De nieuwste ontdekking van de taalwetenschap: uit zorgvuldige statistische analyse blijkt dat het programma Koffietijd, van RTL4, op het verkeerde moment van de dag wordt uitgezonden.
Sinds kort hebben onderzoekers een nieuw instrument om de juiste betekenis van allerlei woorden vast te stellen: Twitter. Daar zijn honderdduizenden mensen bezig iedere dag hun leven te beschrijven, en wel terwijl het zich voordoet — de vertelde tijd is gelijk aan de verteltijd zoals literatuurwetenschappers vroeger zeiden.
Van dat feit kunnen we natuurlijk gebruik maken bij het bepalen van de betekenis van woorden als koffietijd, en dat kun je bijvoorbeeld doen op de website Timeu.se. In een database met miljoenen tweets wordt gezocht naar wanneer mensen precies het woord koffie tweeten en zo kunnen we dan weer vaststellen wanneer het echt koffietijd is in Nederland.
Het juiste antwoord luidt dus: tussen 8 en 9 in de ochtend, behalve in het weekeinde (vooral zondag), maar dan wordt Koffietijd nu juist niet uitgezonden.
Ook van borreltijd kunnen we op deze manier de juiste betekenis vaststellen: vrijdagmiddag tussen vier en vijf.
Ook de betekenis van woorden die niet strikt genomen tijdsaanduidingen zijn, kunnen we zo plaatsen. Je kunt je bijvoorbeeld afvragen in hoeverre kater en brak nu echt synoniemen zijn: voelen mensen zich echt brak terwijl ze een kater hebben, of juist iets eerder of later. Ziehier:
De kater en het brakke gevoel doen zich inderdaad op dezelfde momenten voor, ze pieken allebei duidelijk in het weekeinde (er wordt vrijwel altijd meer over kater gesproken dan over brak, maar dat is ook niet zo verbazingwekkend). Er zijn om onduidelijke redenen een paar uur in de week waarop brak overheerst: zaterdagochtend vroeg. Hoe dit ook zij, we hebben hier dus een mooi bewijs dat mensen zich brak voelen als ze een kater hebben, en andersom.
Dubbelzinnigheden in taal behoren tot de grootste obstakels voor computers om met menselijke taal te kunnen omgaan. Gegevens als deze kunnen bijvoorbeeld een vertaalcomputer helpen keuzes te maken. De tweet ‘ik heb een kater’ kan om half drie in de nacht van zaterdag op zondag waarschijnlijk beter worden vertaald als ‘I am having a hangover’, en op donderdagmiddag als ‘I am having a cat’. Dit soort berekeningen zijn daarom meer dan alleen een spelletje voor tijdens koffietijd of borreltijd.
Naschrift 10.00. Sommige lezers verbazen zich over het woord ‘brak’. Ze zijn niet de enigen. In de roman Tonio vertelt A.F.Th. van der Heijden dat zijn zoon dat woord vaak gebruikte, terwijl Van der Heijden het zelf niet kende. Mijn vermoeden is dat het een jongerenwoord is. Dat zou je ook met Twitter kunnen onderzoeken, als je gebruik zou kunnen maken van verfijndere informatie: bijvoorbeeld de GPS-gegevens, waardoor je zou kunnen zien of ‘brak’ vooral rondom danceparty’s wordt gebruikt, en ‘kater’ vooral in Amsterdam-Zuid.
Naschrift 14.30 Onze Taal meldt via Twitter nog een woord met een spectaculaire verdeling over de dag en de week: Chinees.
Guy zegt
Onthullend maar ook een beetje beangstigend, deze data-ontleding. Vooral omdat zo'n wetenschappelijk onderzoek in eerste instantie niet gebruikt wordt voor het edele vertalen, maar veeleer als voeding voor het marketingmonster.
Taaladviesdienst zegt
Leuke resultaten:
– "geen zin": maandagochtend 7 uur http://timeu.se/9fc83704
– "lekker": zaterdag en zondag http://timeu.se/19c20804
– "shoppen": zaterdag overdag http://timeu.se/9623ed25
– "te laat": maandagochtend 8 uur http://timeu.se/c1905379
– "vertraging": 's morgens 8 uur http://timeu.se/2d44fb39
– "brug": ochtend- en avondspits http://timeu.se/77e28b60
– "krant": zaterdagochtend 10 uur http://timeu.se/84ed6a62
Anoniem zegt
Op werkdagen, vooral op kantoortijden, veel 'twitter' en 'tweet'.
Is twitteren écht zo populair, of een van de dingen die we doen als het lastig is om bezig te zijn met andere (leukere) hobby's? Ter vergelijking: over 'sporten', 'feestje' en 'tv' wordt vooral 's avonds en/of in het weekend getwitterd…
Anoniem zegt
"huiswerk" http://timeu.se/5d4e2e7c
Zou er op zondag eerder begonnen worden met het maken van huiswerk dan op zaterdag?
Anoniem zegt
wat is het piekje om 5 uur zaterdag voor boodschappen?
TeXt iZ zegt
Als Texelaar is het natuurlijk leuk om te weten wanneer #Texel het meest wordt getwitterd. Zaterdag tussen 7 en 10 dus, met de absolute piek om 9 uur.
Op nummer 2 en 3 staan zaterdag om 18.00 en 13.00 uur.
Op nummer 4 en 5: zondag om 10 uur en van 11 tot 12. Gevolgd door vrijdag om 11 en 16.00 uur.
Tja, dat had ik kunnen weten… De meeste mensen twitteren over Texel als ze er heen gaan en dat is meestal in het weekend.
Toch benieuwd wanneer de Texelaars het meest twitteren. Op welk woord zou ik dan moeten zoeken? Wordt vervolgd…
Anoniem zegt
Overlappende pieken tussen seks (http://timeu.se/index.php?type=w&q;=seks) en sigaret (http://timeu.se/index.php?type=w&q;=sigaret) 🙂