Een van de wonderlijke eigenschappen van menselijke taal, is dat dezelfde vorm soms verschillende dingen kan betekenen. Een taal als het Nederlands heeft genoeg klinkers en medeklinkers om ieder woord verschillend te maken van ieder ander woord, en toch zitten we opgescheept als woorden met bank dat minstens twee verschillende dingen betekent: waarom noemen we de financiële instelling niet banka en het zitmeubel pank? Niemand die er bij mijn weten een goede verklaring voor heeft, maar toch heeft bij mijn weten iedere taal van dit soort paren.
Een heel bijzonder subgeval van dubbelzinnigheid is dat veel woorden – volgens sommige geleerden zo’n beetje alle woorden – nauw aan elkaar verwante betekenissen kunnen hebben. Een klassiek voorbeeld is post. Ik kan zeggen ‘de post is geweest’, en dan bedoel ik een persoon, ‘het gaat niet goed met de post’, en dan bedoel ik een organisatie of bedrijf, en ‘de post ligt op tafel’ bedoel ik een stapel brieven. Die betekenissen hebben duidelijk allemaal met elkaar te maken, maar het is niet meteen duidelijk wat de centrale betekenis is. Dit noemen we polysemie, waar we het verschil tussen bank en bank homonymie noemen. Voor bank neemt iedereen aan dat we twee verschillende woorden in ons innerlijke woordenboek hebben, die min of meer toevallig dezelfde vorm hebben. Bij post is dat niet zo duidelijk.
Communiceren
Dat laatste komt onder andere doordat we tot op zekere hoogte ieder woord polyseem kunnen maken. De ene medewerker van een eetcafé kan tegen de andere zeggen: ‘die paardenstaart wil afrekenen’, zonder dat er iemand denkt dat er daadwerkelijk een bos haar met zijn portefeuille wappert; de betekenis is in plaats daarvan natuurlijk ‘iemand met een paardenstaart’. Als de medewerkers van dat eetcafé creatief genoeg zijn kunnen ze op die manier ieder zelfstandig naamwoord gebruiken om een persoon aan te duiden: dat existentialisme (iemand die voortdurend over Sartre en Camus praat), die fietsvelg (iemand die een fietsvelg voor zich op tafel heeft gelegd), enzovoort.
Het tijdschrift Computational Linguistics publiceerde onlangs een verbluffend artikel van twee Londense computertaalkundigen over polysemie – een overzichtsartikel waarin heel veel onderzoek naar het verschijnsel wordt samengevat uit allerlei verschillende disciplines, zoals de taalwetenschap, de computationele taalwetenschap (zoals je weet zijn dat vakken met op elkaar lijkende namen waarvan de beoefenaars sinds minstens een jaar of twintig nog nauwelijks communiceren met elkaar) en de psychologie (waarin weer een heel ander vertoog heerst).
Moeiteloos
De Londenaren laten zien dat er grofweg twee ideeën zijn te onderscheiden in die enorme stapel literatuur. Er zijn mensen (bijvoorbeeld de meeste hedendaagse computertaalkundigen) die denken dat we al die verschillende nuances van betekenis wel ergens hebben opgeslagen, en er zijn mensen (bijvoorbeeld de meeste hedendaagse taalkundigen) die denken dat we een vaag algemeen idee hebben opgeslagen (‘iets met brieven, kaarten en tijdschriften’) waarvan we de specifiekere betekenis kunnen afleiden. Er komt uit het artikel geen duidelijke winnaar uit de strijd tussen deze twee visies: het wordt de opdracht van de wetenschap op de twee vormen op de een of andere manier te combineren.
Dat al die nuances ten diepste met elkaar verbonden zijn (een argument voor de gedachte dat we dus één vage, algemene betekenis hebben) wordt bijvoorbeeld wel beargumenteerd aan de hand van voorbeelden zoals de volgende:
- Het boek dat daar op tafel ligt is geschreven door mijn grootvader.
In die zin worden twee betekenissen van boek moeiteloos door elkaar gebruikt: de betekenis van een fysiek object dat op tafel kan liggen én de betekenis van een lange tekst. Het is best mogelijk dat mijn grootvader overleden is voordat het boek ooit gematerialiseerd werd, dat hij alleen een bestand op zijn computer achterliet. Dan nog steeds kan ik het moeiteloos zeggen.
Uit elkaar groeien
Met een woord als bank kun je die truc niet uithalen, maar ook met post wordt het lastig (‘de post die op tafel ligt wordt slecht bestuurd’), misschien omdat de verschillende nuances lastig uit elkaar te liggen. In de literatuur zijn bovendien voorbeelden te vinden (aangehaald in Computational Linguistics) die ook lastig zijn:
- Dit boek veranderde de westerse wereld fundamenteel en zit vol koffievlekken. [vreemd]
- Dit boek staat vol fouten waar het probeert biologie uit te leggen en zit vol koffievlekken.
In beide zinnen wordt het boek eerst inhoudelijk benaderd en dan naar uiterlijk. Maar de eerste inhoudelijke uitleg (waarin het gaat over het effect van de tekst op een cultuur) gaat om onopgehelderde redenen minder goed samen dan de tweede (waar het puur gaat om een beoordeling van wat er in de tekst staat). Hoe dan ook laat dit alles zien dat de verschillende betekenislagen meer of minder uit elkaar kunnen liggen.
Waarschijnlijk kunnen ze ook uit elkaar groeien: de twee betekenissen van bank zijn via een lange geschiedenis van vele eeuwen uiteindelijk ook op dezelfde oorsprong terug te voeren. Ook dat langzaam uit elkaar drijven van vormen die ooit toch echt helemaal het zelfde waren behoort tot de wonderlijke eigenschappen van de menselijke taal.
Robbert-Jan Henkes zegt
Misschien een spuit elf-reactie: “Dit boek veranderde de westerse wereld fundamenteel en zit vol koffievlekken.” is vreemd. Maar als je het verandert in: “Dit boek veranderde de westerse wereld voor geen cent en zit vol koffievlekken.” is het netzomin vreemd als de zin erna, “Dit boek staat vol fouten waar het probeert biologie uit te leggen en zit vol koffievlekken.” Zit er ook een emotieve component in het gekozen taalspel, ik bedoel hangt die toegekende betekeniswolk ook niet samen met wat je zelf vindt of voelt? En is die niet vaak zo persoonsgebonden dat die niet goed double-blind computationeel te onderzoeken valt?
Marc van Oostendorp zegt
Ja, op dit vlak is nog niet duidelijk wat precies de ene zin voor een specifieke taalgebruiker acceptabeler maakt dan de andere. Ik deel overigens jouw oordeel over die ‘geen cent’-zin niet, die vind ik net zo vreemd als de zin met ‘fundamenteel’. Zo zie je maar.
Robbert-Jan Henkes zegt
“Dit boek veranderde de westerse wereld voor geen cent en zit vol koffievlekken.” Lees of hoor daarin mee: “En daarom mag het van mij de oudpapierbak in.” Mij komt het niet vreemd over, maar inderdaad: zo zie je maar weer en is er altijd wat.
Marc van Oostendorp zegt
Ja, inderdaad, die context erbij maakt dat de zin beter klinkt! Maar dan zit het probleem van de zin met de ‘fundamenteel’-zin dus in het feit dat er tegenovergesteld zijn, en inderdaad klinkt ‘Dit boek veranderde de westerese wereld fundamenteel en heeft een leren omslag’ (en daarom zetten we het in de etalage) een stuk acceptabeler.
Patrick De Block zegt
En dan heb je nog regionale verschillen. Mijn Nederlandse schoondochter heeft het over de bank, terwijl hier alleen lederen zetels staan (kan ook een stoffen omhulsel zijn). Een bank is een houten of betonnen ding dat bijvoorbeeld in een park staat.
C.W. Schoneveld zegt
Hier in Nederland zit ik op mijn laptop deze reactie te schrijven, gezeten op mijn zwartleren tweezitsbank (model Le Corbusier).
Weia Reinboud zegt
Ook bij de heel acceptabele zin moet je in je hoofd toch even een buiteling maken, om het fysieke ding naar wie het geschreven heeft te springen. De minder acceptabele zinnen vereisen meer of grotere buitelingen. Misschien is het zo dat je dan meer neiging hebt om het niet in 1 zin te proppen, dus zulke buitelzinnen komen niet voor.