Een van de intrigerende aspecten van taal is dat het overal om ons heen is en tegelijkertijd zo lastig te vatten. Staat taal bijvoorbeeld in een boek? Klinkt het in de ruimte? In zekere zin zijn dat alleen maar inktvlekken en luchttrillingen: ze worden pas taal als wij het interpreteren. Zit taal tussen onze oren? Maar hoe scheiden we het dan van wat zich daar verder bevindt? Als spreker van het Nederlands weet ik dat “de egel kust het konijntje’ een goede zin is en ‘de het egel konijntje kust’ niet. Maar waar in de werkelijkheid bevinden die zinnen zich en hoe kan ik er kennis over hebben als ik ze allebei nog nooit heb gehoord?
Wat zijn eigenlijk de data van taalkundig onderzoek?
Het proefschrift dat Gert-Jan Schoenmakers vandaag in Nijmegen verdedigt, levert een nuttige bijdrage aan de voortdurende discussie over dit onderwerp. Hij laat zien dat je eigenlijk alleen succesvolle taalkunde kunt doen door verschillende data te gebruiken en af te wegen. Hij bespreekt een onderwerp dat ook al (zijdelings) aan de orde kwam in het proefschrift dat zijn collega Tara Struik onlangs verdedigde (en dat ik hier besprak): de variatie tussen zinnen als de volgende twee.
- Petra beweert dat ze het boek gisteren heeft gelezen.
- Petra beweert dat ze gisteren het boek heeft gelezen.
Het verschil, beweren veel taalwetenschappers in de literatuur, is dat het lijdend voorwerp het boek naar reeds bekende informatie verwijst als het voor gisteren staat, en naar nieuwe informatie als het erachter staat. De eerstgenoemde zin kan het antwoord zijn op de vraag (‘Over de boek gesproken, wat heeft Petra daarover gezegd?’ (het boek is dan al genoemd), en de tweede zin eerder op een vraag als ‘Wat beweert Petra dat ze heeft gelezen?’ (het boek is nieuwe informatie).
Analyses van de vraag waarom dit verschil zo is, zijn feitelijk gebaseerd op dit feit: deskundigen (taalwetenschappers) voelen het verschil zo aan. Dit is enerzijds niet zo gek – ik denk dat de meeste lezers het verschijnsel ook zo aanvoelen – maar misschien ook wel een wat wankele basis. Schoenmakers staat een benadering voor dat hij convergerend bewijs noemt: je kijkt op verschillende manieren naar de taal en probeert te achterhalen wat daar dan uit voortkomt.
In dit specifieke geval liet hij mensen die geen taalkundige opleiding hadden dit soort Petra-zinnen beoordelen. Ze kregen een verhaaltje te lezen waarin werd context werd geboden op basis waarvan je zou kunnen concluderen wat oude en wat nieuwe informatie was, en vervolgens moest je zeggen of een bepaalde zin goed in die context paste. Ook werd er gekeken naar wat mensen spontaan zeiden.
De resultaten: het vrij harde onderscheid dat taalkundigen aanvoelen laten niet-taalkundigen veel minder duidelijk zien of horen. In hun taalwerkelijkheid ligt het genuanceerder, zeker als je beziet hoe zij zinnen beoordelen (de zinnen die ze daadwerkelijk zelf produceerden lagen dichter in de buurt van het door taalkundigen aangevoelde patroon).
Je kunt de oordelen van de taalkundigen niet helemaal terzijde schuiven: het is natuurlijk altijd mogelijk dat er een soort collectieve verdwazing optreedt, maar die duurt meestal niet vele decennia lang. Bovendien zijn taalkundigen natuurlijk veel meer dan andere mensen erop getraind om hun taalgevoel aan te spreken, ze kunnen dus hopelijk beter aanvoelen hoe het zit (ongeveer zoals een ervaren wijnproever verschillen kan herkennen en benoemen die een ander ontgaan). Tegelijkertijd is het natuurlijk ook wel wat vreemd om met die taalkundigen ervan uit te gaan dat er sprake is van een absoluut verschil als andere mensen dat verschil niet zo goed lijken te herkennen.
Je moet daar een balans in zien te vinden. Waar die balans precies is, en hoe we kunnen bepalen ‘hoe het nu werkelijk zit’, daar valt nog veel aan uit te zoeken. Maar Schoenmakers’ proefschrift vormt een waardevolle eerste stap.
Laat een reactie achter