Ik kan er niks aan doen, maar ik doe toch ook nog even een duit in het zakje van die discussie over dat Groot Nationaal Onderzoek over taal, dat Marc van Oostendorp al voor een groot deel heeft gevuld. Marc ging vooral in op het dédain waarmee de onderzoekers over de, laten we zeggen, reguliere linguïstiek spraken. Daarmee opende hij een doos van Pandora waarin alle controverses zaten tussen verschillende disciplines van de taalkunde, en in zijn algemeenheid een aantal fundamentele wetenschappelijk-methodologische twistpunten. Die kwamen dus allemaal weer vrij en verspreidden zich over de aarde. Ik dacht: er moet toch nog een sprankje hoop in die doos zijn blijven zitten.
Ik was zo’n deelnemer die, in de woorden van Marc, zijn tijd verspild heeft met het meedoen. Ik heb een aantal keren die test gedaan, vanaf verschillende IP-adressen, dus ik zal wel als drie personen in de statistieken zitten. Of ik weet het eigenlijk niet, want vanaf mijn computer hebben ook een paar vrienden meegedaan dus voor zover ze even oud zijn en van hetzelfde geslacht en dezelfde afkomst als ik zijn die dan geteld als één en dezelfde persoon. Maar gelukkig zal niet iedereen dat zo gedaan hebben (hoop ik dan maar), zodat die oneffenheid wel in de grote getallen zal verdwijnen.
Wat mij eigenlijk van het begin af aan bekroop was een ongemakkelijk gevoel bij de vraag wat er nou precies gemeten werd. En dat gevoel, moet ik eerlijk zeggen, is niet verdwenen na lezing van het rapport dat op de website van de Gentse universiteit staat.
Ik kan het misschien het beste illustreren aan de hand van de instructietekst bij het experiment. Die luidde als volgt:
Hallo!
In deze test krijg je 100 woorden te zien, zowel bestaande als niet-bestaande woorden.
Geef voor elk woord aan of het volgens jou een Nederlands woord is, of niet.
Met een Nederlands woord bedoelen we dat het woord in (een deel van) het Nederlandse taalgebied gebruikt en begrepen wordt.
Ik ben geen psycholoog (de onderzoekers hebben hier een betere scholing in dan ik), maar ik vind dit een verwarrende instructie. Allereerst wordt er een problematisch begrip betrekkelijk achteloos geïntroduceerd, namelijk bestaand-niet bestaand. Ik weet vrij zeker dat er onder de taalgebruikers geen overeenstemming bestaat over de vraag wanneer een woord nou bestaat of niet. Er zijn mensen die vinden dat een woord officieel gecanoniseerd moet zijn (in een woordenboek moet staan) om te bestaan, terwijl anderen van mening zijn dat elk woord dat ze zich kunnen voorstellen zo’n beetje bestaansrecht heeft.En ergens daartussenin zit de opvatting dat elk woord dat je wel eens gehoord hebt daarmee ook meteen bestaat, eventueel afhankelijk van hoe vaak, en in welke context.
Wat moeten de proefpersonen hiervan denken? Waarschijnlijk zullen ze bij de eerste zin hun persoonlijke epistemologische opvatting over de woorden van de taal activeren. Eventueel zullen ze verwachten dat dit begrip bestaand-niet bestaand in de volgende zin toegelicht wordt, maar nee: daar staat dat het gaat om de vraag Nederlands-niet Nederlands. Ik kan niet precies in de Vlaamse ziel kijken, maar het zou kunnen dat Vlamingen hier denken dat het om het land Nederland gaat. Zoiets moeten de onderzoekers ook gedacht hebben, want ze voegen er meteen aan toe wat ze bedoelen met Nederlands (beginnersfout in communicatie: als je in de tweede zin moet zeggen wat je in de eerste bedoelt, wat heeft de eerste zin dan voor functie?). Blijkbaar is de bedoeling dat je inschat of een woord ‘in (een deel van) het Nederlandse taalgebied gebruikt en begrepen wordt.’
Hiermee is denk ik de verwarring niet opgelost, maar eerder toegenomen. Wie bij Nederlands al het land in gedachten had, hoeft bij Nederlands taalgebied die gedachte niet meteen te verlaten. Althans, het Nederlands taalgebied kan ik ook opvatten als het taalgebied van het land Nederland. En wat erger is, het begrip Nederlands wordt nu gekoppeld aan de begrippen gebruikt en begrepen. Nu heb ik me suf zitten peinzen over woorden die wel gebruikt maar niet begrepen worden, maar dat geef ik toch al snel op, en ik denk dat de gemiddelde proefpersoon hier ook denkt: gooi het maar in mijn pet. Met andere woorden: de instructie doet in het beste geval geen kwaad, maar voegt in ieder geval niets toe.
Het gevolg van deze verwarrende instructie is denk ik dat iedereen toch maar aan de test gaat beginnen met zijn eigen vage ideetje over wanneer een woord bestaat of niet, al was het alleen maar omdat op iedere pagina twee knoppen staan met de tekst NEE dit woord bestaat NIET en JA dit woord bestaat.
Is dat erg? Ja dat weet ik niet. Ik had graag gezien dat het in het rapport althans geproblematiseerd werd, maar dat gebeurt niet. Stel dat Vlamingen een normatiever opvatting over het wel of niet bestaan van woorden hebben, dan zal het lijken alsof hun woordenschat kleiner is (want bij twijfel zullen ze eerder nee zeggen). Ik zeg niet dat dit zo is, maar het zou kunnen. Stel dat Vlamingen of Nederlanders denken dat het over het land Nederland gaat (dat is misschien bij de Vlamingen wel waarschijnlijker, al hebben we daar geen gegevens over), dan zullen de typisch Nederlandse woorden in het voordeel zijn (want bij de woorden die als Vlaams herkend worden zullen sommige mensen zeggen: dat is geen Nederlands, want het wordt niet in Nederland gebruikt en begrepen).
Dat vind ik allemaal eigenlijk al een serieus probleem. Maar ik zie ook eigenlijk niet goed wat er nu precies gemeten wordt. In het rapport (op pagina 3) staat een vage alinea over de relatie tussen woordenschatgrootte en ‘verschillen in responses’ (waaronder reactietijd), en het feit dat nepwoorden de betrouwbaarheid vergroten, maar wat daarvan de portee is ontgaat me. Er wordt verwezen naar eerder onderzoek op dit gebied, maar zonder bronverwijzing, dus dat kan ik ook niet goed nakijken. Dat is wachten op de eerste wetenschappelijke publicatie dan maar. Maar los daarvan: wat voor woordenschat wordt hier nu eigenlijk gemeten?
Ik weet wel hoe ik de test zelf ingevuld heb. Alle woorden die ik herkende (of meende te herkennen) heb ik als bestaand aangemerkt, ook als ik de betekenis daarvan niet kende. Zo wist ik zeker dat het woord tapuit een Nederlands woord was. Misschien ben ik het ooit in een spelletje Wordfeud of in een kruiswoordpuzzel tegengekomen, maar de betekenis moest ik achteraf opzoeken (het is een zangvogel, ‘vermoedelijk zo genoemd vanwege het herhaaldelijk bukken, dat dan een associatie met tappen heeft opgeroepen,’ dat vergeet ik nu niet meer). Ik zie wel dat het woord tapuit dus onder de een of andere interpretatie van mijn woordenschat al vóór de test daartoe behoorde, maar ik had ook kunnen denken: ik weet niet wat het betekent en ik denk dat heel veel mensen het ook niet begrijpen, dus ik vul in NEE dit woord bestaat NIET. Dus zelfs als je zou willen volhouden dat het woord tapuit al tot mijn woordenschat behoorde, hoe zit het dan met iemand die hetzelfde weet als ik, maar de andere beslissing neemt?
Let wel, dit gaat dus niet over de vraag of een woord in mijn actieve of passieve woordenschat zit Het woord tapuit zat niet in mijn actieve woordenschat, en ik geloof dat er ook in de toekomst jaren voorbijgaan voordat ik dat weer zal gaan gebruiken (zoals hier, maar nou heb ik het ook nog maar alleen over het woord en de bijbehorende betekenis, ik had bijvoorbeeld geen idee hoe het beestje eruit ziet – het heeft iets van een roodborstje zie ik nu).
Misschien dat de gedachte is om met de reactietijden dit soort effecten te neutraliseren, bijvoorbeeld door alleen de resultaten te beschouwen met een minimale reactietijd of zo, maar ook hierover staat geen woord in het rapport (behoudens die vage alinea over reactietijden). In het rapport, en vooral in de berichtgeving daarover, wordt de score op de test gemakshalve vertaald naar een absolute woordenschat, wat hoe dan ook te voorbarig is, want het experiment omvatte nog geen 60.000 woorden. Om de werkelijke woordenschat van een persoon te berekenen zou je op zijn minst moeten speculeren hoe je de resultaten op deze lijst moet extrapoleren naar een absoluut getal gebaseerd op de totale lijst van woorden uit het Nederlands, als je je al zo’n lijst kunt voorstellen wat ook al niet zo eenvoudig is. Maar dat extrapoleren is ook nog niet zo gemakkelijk want ten eerste zullen in de test de meer frequente woorden zijn genomen, zodat het restant minder kans maakt om tot een woordenschat te behoren. En ten tweede blijkt een deel van de woordenschat van het Nederlands (transparante samenstellingen) systematisch uit de test te zijn weggelaten, dus hoe je dat zou willen verrekenen is me helemaal een raadsel.
Ik ben dus erg benieuwd naar de wetenschappelijke publicaties. Ik hoop dat alle overwegingen die ik hierboven heb in de discussiesectie aan de orde komen, en dat de resultaten op een zorgvuldige en genuanceerde manier worden besproken. Ik weet nu al zeker dat geen van de beweringen die nu in de media naar voren komen, ongeschonden uit die besprekingen zal komen.
Miet Ooms zegt
Dit zijn de bedenkingen die ik me ook al maakte, zelfs zonder de test in te vullen. Ik heb zelf al een probleem met het begrip 'bestaand woord', met af te bakenen wat tot het Nederlands behoort en wat niet (streektaalwooorden, zijn die Nederlands of niet? Indien niet, hoe bepaal je dan de grens? Indien wel, kennen we echt alle streektaalwoorden? En dat laatste is eigenlijk een retorische vraag) Bovendien vind ik dat er, gezien de massa data, wel erg snel 'resultaten' zijn en conclusies getrokken worden. Ik ga het rapport zelf eens grondig doornemen, maar ik vrees dat mijn bedenkingen alleen maar groter gaan worden…
Hans Broekhuis zegt
Het “tapuit”-voorbeeld uit deze blog illustreert hoe onzorgvuldig de heer Brysbaert de resultaten van het Groot Nationaal Onderzoek in de pers presenteert. De resultaten laten zien hoeveel woorden een informant al dan niet herkent als “bestaand”. Maar in het programma “Labyrint” (11 minuten na het begin) geeft de heer Brysbaert hier een iets ander interpretatie aan. Geheel in de geest van het wedstrijdkarakter van dit onderzoek vraag hij zich af “wie heeft nu …. kent nu de meeste woorden”, de Vlamingen of de Nederlanders? Nu dit zijn de Nederlanders, want die kennen 2% meer woorden.
Nu moet de heer Brysbaert als psycholoog zich er toch bewust van zijn dat het “kennen van een woord” heel iets anders is dan het “herkennen van een woord als al dan niet bestaand”. Het kennen van een woord impliceert sinds De Saussure's Cours de linguistique générale (1916) ten minste:
(1) dat de informant de woordvorm kent en
(2) dat de informant de betekenis van die woordvorm kent
Even later heeft de heer Brysbaert het zelfs over taalbeheersing, waarbij hij voorbijgaat aan het feit dat het beheersen van een woord impliceert dat:
(3) de informant het woord op een juiste manier kan gebruiken.
Dit lijkt misschien allemaal niet erg, maar dat wordt het wel als je ziet dat de heer Brysbaert de constatering dat vooral oudere Nederlanders meer woorden “kennen” dan oudere Vlamingen laat volgen door drie speculaties volgen: oudere Vlamingen hebben misschien een “minder goede beheersing van het Nederlands” of het zou kunnen zijn dat Vlamingen “eerder het opgeven” dan de Nederlanders en zelfs dat Nederlanders “actiever doorheen hun leven zijn”. Omdat de uitkomsten van het onderzoek helemaal niets zeggen over de woordkennis van de informanten in de technische zin van dat woord, laat staan over hun taalbeheersing, zijn dit soort speculaties hoogst prematuur en, wat erger is, vooroordeelbevestigend: sprekers van de prestigetaal (in en om de Randstad) hebben immers de hoogste score.
Net als Peter-Arno Coppen hoop ik maar dat “de resultaten op een zorgvuldige en genuanceerde manier worden besproken”, maar ik vrees dat het veel moeite zal kosten om allerlei onjuiste opvattingen die nu dankzij alle media-aandacht bij het grotere publiek post (kunnen) vatten weer weg te nemen.
Peter-Arno Coppen zegt
Het effect dat het lijkt alsof Nederlanders meer woorden kennen dan Vlamingen kan zoals ik speculeerde een effect van de toets zijn: bij een meer normatieve kijk op 'bestaand' scoor je een kleinere woordenschat.
En het effect dat oudere taalgebruikers meer woorden herkennen kan ook een simpele kwestie van groter aanbod zijn. Oudere mensen hebben langer geleefd dan jongere mensen (hoewel we hier strikt genomen geen statistische gegevens over hebben), dus ze zijn langer blootgesteld aan een gevarieerder taalaanbod.
Er zijn natuurlijk talloze andere verklaringsgronden (ik heb de factor 'onderwijs' nog niet voorbij horen komen), dus ik ben wel benieuwd naar die discussie daarover.
Hans zegt
Je hebt natuurlijk gelijk en wat je in de tweede alinea zegt wordt ook door Brysbaert in het Labyrint-interview gesuggereerd.
Maar dat was mijn punt niet. Het gaat mij om het gebruik van het woord "kennen". Het onderzoek zegt helemaal NIETS over "kennen" hoogstens over "herkennen". Zo kan ik misschien een Frans of Engels woord als zodanig herkennen maar dan hoeft het nog niet zo te zijn dat ik het ook ken.
Naar mijn mening wordt het woord "kennen" in deze context dus voortdurend misbruikt, met ernstige gevolgen. Zie mijn bovenstaande reactie.
Peter-Arno Coppen zegt
Ja, dat klopt. Daar zat ik ook wel een beetje mee te worstelen toen ik het voorbeeld beschreef. Ik snap wel dat 'herkennen' niet hetzelfde is als onze gangbare opvatting van 'kennen' (dat, zoals jij beschrijft, minimaal iets over vorm en betekenis zou moeten inhouden), maar er zijn volgens mij allerlei modaliteiten mogelijk. Zo kan ik het woord herkennen en weten dat het iets met een vogel was (maar nog geen idee hebben over hoe het beestje eruit ziet, hoe het klinkt, of allerlei andere eigenschappen). Met andere woorden, die "betekenisherkenning" kan ook heel rudimentair zijn. Of zelfs verkeerd, zodat je wel kunt zeggen dat het woord tot je woordenschat behoort, maar dan in een verkeerde opvatting over betekenis (hetzelfde geldt natuurlijk voor andere eigenschappen zoals uitspraak).
Kortom: dat hele idee van 'kennen' wordt hier wel erg eenvoudig voorgesteld, daar zijn we het over eens.
Nou kan ik me nog wel voorstellen dat er onderzoek bestaat (dat wordt een beetje in die vage alinea gesuggereerd) waarin een relatie wordt aangetoond tussen werkelijke woordenschatkennis (met uitgebreide bevraging van betekenissen en zo), en de score op dit soort oppervlakkige testjes (mogelijk in relatie tot reactietijd). Van daaruit zou je kunnen speculeren over werkelijke woordenschat op basis van deze resultaten. Het lijkt me allemaal heel wankel, maar ik wacht graag die discussie af.
Hans zegt
Ja, tussen herkennen via kennen naar beheersen zitten natuurlijk nog heel wat tussenstadia. Maar we blijven zitten met het probleem dat in de presentatie in de media nu alles op een grote hoop gegooid wordt, waardoor (ongetwijfeld onbedoeld) een sterk vertekend beeld ontstaat. We mogen verwachten dat dit soort discussies de onderzoekers in ieder geval bewust maken van de zorgen die bij sommigen leven en dat ze daar, waar mogelijk, bij hun uiteindelijk presentatie van hun onderzoeksresultaten hun voordeel mee zullen doen. Helaas zijn de reacties van Brysbaert op de kritiek van Marc en de naar aanleiding daarvan gevoerde discussies tot nu toe niet erg hoopgevend zijn.
Peter-Arno Coppen zegt
Nee dat is waar. Maar er is altijd hoop.