Door Marc van Oostendorp
De laatste jaren storten beoefenaren van de economische wetenschap zich vol verve op de taal. Kwade tongen beweren dat het komt door de crisis die sommige economen definitief heeft doen inzien dat wat zij beweren eigenlijk óók allemaal onzin is, maar een redelijker verklaring is dat de taalwetenschap de laatste jaren steeds meer met grote databases (zoals de World Atlas of Linguistic Structures) is gaan werken, iets waar economen dol op zijn.
Het begon enkele jaren geleden met een artikel van de Amerikaan Keith Chen, die probeerde te laten zien dat mensen die een taal spreken waarin toekomende tijd verplicht in de werkwoordsvorm wordt uitgedrukt minder geld sparen en minder goed op hun gezondheid letten dan sprekers van bijvoorbeeld het Nederlands waarin je ik kom morgen kunt zeggen in plaats van ik zal morgen komen. (Ik schreef hier over dat onderzoek.)
Sindsdien komt er regelmatig van dit soort onderzoek naar boven, en je vraagt je als taalkundige af wat je ermee moet.
In de war
Een paar weken geleden werd de wereld bijvoorbeeld opgeschrikt door het bericht dat sprekers van talen die verschil maken in woordgeslacht (le soleil – la lune) meer geneigd zijn tot seksediscriminatie dan sprekers van talen zoals het Chinees waarin dat hele verschil er nauwelijks toe doet.
Als eenvoudige taalkundige denk je dan: maar is de Chinese maatschappij inderdaad zoveel feministischer dan de Franse? Nee maar, zegt de econoom dan, je moet dat statistisch zien: dat Chinees is dan misschien een outlyer. Maar, zeg ik dan, in welk opzicht kun je het Chinees als één ding rekenen? Moet je niet eigenlijk de sprekers tellen van zo’n taal en gooit dat dan de hele statistiek niet in de war?
Spelling
Bovendien klinkt zo’n correlatie misschien wel intuïtief, maar blijken de onderzoekers allerlei vormen van grammatical gender te hebben meegeteld. Het Nederlands krijgt bijvoorbeeld een feministisch strafpunt omdat het verschil maakt tussen de- en het-woorden, terwijl je je toch nauwelijks kunt voorstellen hoe je je het sociaalpsychologische mechanisme zou moeten voorstellen die dat verband legt.
Maar aan dat soort subtiel geredeneer doen economen met hun liefde voor massa’s data niet. (Roddel: zo’n tien jaar geleden sprak ik met een econoom die een hoofdstuk van zijn proefschrift had gewijd aan het verband tussen de score die mensen in een of andere Amerikaanse staat hadden voor een taaltoets en hun latere inkomen. Dat was dus nog voor de taalhausse onder economen. Allerlei heel ingewikkelde berekeningen waren eraan te pas gekomen om dit voor honderdduizenden mensen vast te stellen. Ik vroeg hem wat er precies in die taaltoets werd getoetst (spelling? argumentatie? stijl? heel verschillende dingen die heel verschillende vaardigheden vereisen). Maar daar had hij nooit naar gekeken.)
Beroep
In Nederland is vooral de Tilburg University heel actief. Daar werken een paar uitstekende taalkundigen, maar die worden kennelijk nooit geconsulteerd, of in ieder geval niet genoemd in de papers. Vorig jaar verblijdde men ons vanuit Tilburg bijvoorbeeld met een in het Engels geschreven artikel waaruit bleek dat men in Nederlandse organisaties beter Nederlands kan spreken.
En nu was er vorige week dan weer sprake van dat mensen die dialect spreken minder zouden verdienen. Verschillende media besteedden er aandacht aan, en sommige mensen gaven zelfs commentaar op het ‘onderzoek’, maar het bijzondere van dit onderzoek was vooral dat het onvindbaar bleek. al dook uiteindelijk wel een manuscript uit januari op dat waarschijnlijk de basis vormt van het bericht.
Nu is dit zo’n vreemd artikel dat ik me afvraag of zelfs een economisch tijdschrift het zal willen publiceren. De auteurs tonen aan dat er in een redelijk grootschalig onderzoek op internet een correlatie gevonden kan worden tussen twee factoren: hoe vaak mensen zelf zeggen dat ze dialect spreken en wat voor soort beroep ze uitoefenen.
Wage-Penalty
Nu is dat mogelijk tot op zekere hoogte interessant, maar feitelijk is het heel moeilijk te interpreteren. Waar ligt dat verband aan? Worden dialectsprekers gediscrimeerd? Zij ze dommer of onbruikbaar voor de arbeidsmarkt? Of zijn mensen in hogere beroepen minder snel geneigd toe te geven dat ze dialect spreken (terwijl ze dat stiekem wel doen)? Of is er een heel andere, derde, factor die met allebei deze zaken correleert en de feitelijke verklaring biedt (bijvoorbeeld een neiging tot het geven van sociaal wenselijke antwoorden in enquêtes, of het inzicht dat dialect spreken en niet meedoen aan de rat race je veel gelukkiger maakt).
De auteurs noemen dat probleem – correlatie is geen causatie – wel een paar keer, maar vervolgens gooien ze er een paar loze semi-wiskundige formules tegenaan alsof die een oplossing bieden, en geven dus in ieder geval de manuscriptversie van het artikel een behoorlijk suggestieve titel: The Wage-Penalty of Dialect Speaking.
Onzin
Dat lijkt me het probleem van eigenlijk al dat economisch onderzoek: men is enorm goed in big data en in het toepassen van geavanceerde statistische technieken. Maar de bevindingen zijn verder niet ingebed in een beter begrip van wat taal is of hoe het werkt, en daarom springt men na al dat zorgvuldige getel ineens naar een conclusie die door de bestudeerde feiten helemaal niet gerechtvaardigd wordt.
Dat biedt op zichzelf misschien aanknopingspunten voor samenwerking: de economen leren de taalkundigen om te gaan met zulke gigantische databases, de taalkundigen voorzien een en ander van wat meer context; maar dan moeten economen die zulk onderzoek beginnen natuurlijk wel de weg weten naar de deur van hun taalkundige collega’s verderop op de gang. En niet denken dat wat die taalkundigen zeggen eigenlijk allemaal óók onzin is.
Lucas Seuren zegt
Tsja, met genoeg data vind je altijd wel correlaties tussen variabelen die intuïtief logisch zijn (of niet), maar ondertussen gewoon stom toeval: http://www.tylervigen.com/spurious-correlations.
Als je niet kunt aantonen dat er een causaal verband is, is en correlatie niet meer dan een grappige observatie.
Mark zegt
Het goede nieuws is dat Keith Chen niet te beroerd was om met taalwetenschappers in zee te gaan om de zaak echt goed te testen. Seán Roberts and James Winters werkten met hem samen. Wat ze vonden was dat het effect verdwijnt als je controleert voor de verwantschap van talen… http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0132145
Zo’n falsificatie of non-replicatie krijgt helaas nooit zoveel aandacht als de eerste, spannende maar foutieve claim!
Marc van Oostendorp zegt
Dank, ik had dat inderdaad gemist!
Gaston zegt
Iets vergelijkbaars lijkt te gebeuren wanneer biologen statistische methodes uit de genetica toepassen op grote aantallen cognaten. Ze doen dan uitspraken over taalverwantschappen en prehistorische herkomstgebieden, zonder zich te bekommeren om redelijk betrouwbare historische en archeologische kennis die hun vermoedens ondersteunt of – minstens even vaak – bij voorbaat buitengewoon onwaarschijnlijk maakt.
Die economen en genetici hebben mooie hamers en zien daarom overal spijkers. Maar sommige langwerpige dingen zijn waterstralen, of vingers.