Een van de oudste vraagstukken van de taalwetenschap is: wat zijn eigenlijk de data? We hebben de ambitie een empirische wetenschap te zijn, wat wil zeggen dat de wetenschappelijke theorieën getoetst moeten worden aan de werkelijkheid. Maar wat is die werkelijkheid in het geval van iets dat in wezen zo abstract is als de taal? Waar vinden we de taal en waar vinden we de taalkundige?
Er zijn in grote lijnen twee mogelijke antwoorden op, allebei met een lange traditie. De ene is: de taalkundige vinden we in het laboratorium, de andere: de taalkundige vinden we in de bibliotheek. De taal kunnen we alleen betrappen als we de mens testen die de taal gebruikt: we leggen haar een vreemde zin voor en bezien hoe zij daarop reageert en daarom vinden we de taalkundige in het laboratorium. De taal kunnen we alleen betrappen als we zien wat de mens allemaal aan taal voortbrengt, en daarom vinden we de taalkundige in de bibliotheek.
Schaduwen
Zowel laboratorium als bibliotheek kun je ook metaforisch begrijpen. Je kunt ook experimenten doen zonder witte jas, bijvoorbeeld door aan mensen in je buurt te vragen wat ze van zin A vinden en of ze die beter vinden klinken dan zin B. Je kunt ook gegevens over het taalgebruik van mensen verzamelen door op te schrijven wat ze in je buurt zeggen. Maar er zijn dus twee methoden: je kunt onderzoeken wat er gebeurt als mensen aan speciaal voor het onderzoek ontworpen taal worden onderworpen óf je kunt bezien wat mensen spontaan zeggen.
Naar mijn idee zou je in een normale wereld zeggen: het zijn twee methoden om taal, die niet alleen in wezen abstract is en geen werkelijke fysieke manifestatie kent, die niet kan bestaan buiten de menselijke hersenen om, en die ook nog eens vreselijk complex is, te benaderen. Je moet alle data gebruiken waar je maar je hand op kunt leggen. Ze zijn allemaal als het ware schaduwen van de ware taal die ons telkens ontvliedt – maar hoe meer schaduwen we in kaart brengen hoe dichter we in de buurt komen.
Sterrenkunde
We leven helaas niet in een normale wereld, maar één waarin mensen het prettig vinden om op ieder punt te polariseren. In een nieuw artikel in het tijdschrift Linguistics citeert Jack Grieve de bekende taalkundige Noam Chomsky, een van de voorstanders van experimentele data:
Corpustaalkunde [’taalkunde in de bibliotheek’] betekent niets. Het is alsof een natuurkundige of een scheikundige beslist dat ze niet meer afhankelijk willen zijn van experimenten, maar in plaats daarvan filmopnamen maken van alles wat er gebeurt en vandaar tot generalisaties of inzichten. Welnu, de natuurwetenschappen werken zo niet.
Hier wordt een karikatuur gemaakt van een overigens reëel bestaande opvatting van de bibliotheek, namelijk dat je maar eindeloos opnamen moet maken van wat iedereen zegt, en dat met een enorm statistisch apparaat je vandaar uit vanzelf kunt berekenen ‘hoe de taal daadwerkelijk is’. Uit een stropopargument volgt weinig. Tegelijkertijd bestaat er natuurlijk juist ook een heleboel natuurwetenschap die ook weinig kan doen met experimenten en vrijwel in zijn geheel afhankelijk is van observaties – neem de sterrenkunde.
Sociale omstandigheden
Jammer is dan dat Grieve vervolgens onbekommerd de pendule totaal de andere kant op laat slaan. Volgens hem zijn experimenten voor de natuurwetenschappen onbruikbaar. Je komt vrijwel onvermijdelijk bij duplicatieproblemen uit: de resultaten van een experiment in het ene laboratorium kunnen niet worden gerepliceerd in een ander laboratorium. De reden daarvoor is volgens Grieve dat je taal vooral een sociaal fenomeen is en sociale fenomenen laten zich niet repliceren:
Elk geval van taal bevindt zich in de echte wereld, zelfs de concretisering van een gedachte, en zijn vorm is gekoppeld aan de sociale context waarin het is geproduceerd. De essentie van experimenteel onderzoek is echter deze sociale context te manipuleren, wat noodzakelijkerwijs een effect zal hebben op de taalproductie en -perceptie. Omdat onafhankelijke experimentele replicaties variatie in sociale context moeten inhouden, zal het succes van replicatie over het algemeen lager zijn dan verwacht, afhankelijk van de sociale gevoeligheid van de linguïstische fenomenen die worden geanalyseerd. Dit is de reden waarom replicatiefalen in de taalkunde niet eenvoudig kan worden aangepakt door betere experimentele onderzoekspraktijken toe te passen: replicatiefalen is een onvermijdelijk gevolg van het gebruik van experimenten om een zeer sociaal fenomeen als taal te onderzoeken.
Hier wordt naar mijn smaak weer het ándere kind met het badwater weggegooid. Het is waar dat we weten dat mensen hun taalgebruik eindeloos aanpassen aan de sociale omstandigheden, maar het lijkt mij een beetje overdreven om te zeggen dat dit betekent dat je die sociale omstandigheden niet min of meer kunt kopiëren van het ene laboratorium naar het andere.
Dat idee dat het volkomen vanzelfsprekend is dat taal een sociaal fenomeen is, is volgens mij de crux. In grote lijnen kun je zeggen dat dit de opinie is van de mensen in de bibliotheek; in het laboratorium gaan ze ervan uit dat taal een eigenschap is van de individuele mens, iets dat in je hersenen zit. De kwestie is natuurlijk: het is allebei waar. Dat maakt taal zo’n ingewikkeld fenomeen, dat maakt de mens zo’n wonderlijk verschijnsel, dat hij gebruik maakt van taal om zijn innerlijk te delen met anderen. En dat gebeurt zowel in het laboratorium als in de bibliotheek.
Jos Houtsma zegt
Fijn, zo’n taalfilosofisch stukje.
Maar: “het lijkt mij een beetje overdreven om te zeggen dat dit betekent dat je die sociale omstandigheden niet min of meer kunt kopiëren van het ene laboratorium naar het andere.”
Wat stel je je daarbij voor?
Jos Houtsma zegt
O wacht, je denkt aan welgevormde zinnen. Is dat het?
Marc van Oostendorp zegt
Dat is slechts één voorbeeld. Mogelijk wordt je oordeel over de welgevormdheid van zinnen door wie je in de buurt hebt (als er daar enorme autoriteit wordt uitgestraald worden subtiele oordelen misschien anders). Maar in de eerste plaats weten we uit onderzoek dat zelfs de informeel verzamelde intuïties van taalonderzoekers eigenlijk heel goed repliceerbaar zijn, en in de tweede plaats: zelfs als er een effect zou zijn van de uitstraling van de onderzoekssituatie kun je die natuurlijk wel degelijk min of meer herhalen.