Hier is een intrigerend geheim van de taalwetenschap: we weten niet wat een woord is. Er bestaat niet alleen geen definitie van die alle taalkundigen bevredigt, het is waarschijnlijk moeilijk om een definitie te geven die ook maar iemand bevredigt. Waar niet-taalkundigen over taal vaak nadenken als een verzameling woorden – we doen verkiezingen van ‘woorden van het jaar’, het verschijnen van een nieuwe editie van Van Dale is iedere paar jaar dé taalgebeurtenis van het jaar – zitten taalkundigen met hun handen in het haar.
Er zijn taalkundigen die zich morfologen noemen en andere taalkundigen die zich syntaxis noemen, en het definiërende verschil wordt geacht te zijn dat de eerste de opbouw van woorden bestuderen en de tweede de opbouw van zinnen.
De vraag is vooral: hoe het woord te onderscheiden van een willekeurige andere brok taal? Je kunt niet zeggen: een woord is wat in het woordenboek staat, want dan verschuif je het probleem alleen maar naar de lexicografen en hoe beslissen die dan wat ze opnemen? Om soortgelijke redenen kun je ook niet zeggen: het is iets dat tussen twee spaties staat, want hoe bepalen we waar die spaties staan anders dan door te bepalen dat ze om woorden heen staan?
Als mensen praten, plakken ze alles aan elkaar. Hoe beslissen we op een wetenschappelijke manier dat je die stroom op sommige plekken kunt ophakken en dat we de resterende brokjes ‘woorden’ mogen noemen? Stel dat een marsmannetje op onze aarde terecht komt, hoe maken we hem dan duidelijk dat er woorden zijn. De problemen worden trouwens nog groter als je een procedure probeert te denken waarbij je voor alle talen – ook de talen die nooit geschreven zijn, ook de talen met grammatica’s die heel anders zijn dan die van de westerse – probeert vast te stellen wat de woorden zijn.
Het is iets waarvan je de betekenis apart moet onthouden, maar dat geldt ook voor idiomen (‘de pijp aan Maarten geven’). Het is iets dat ‘zelfstandig’ kan voorkomen, maar wanneer doet zich dat zelfstandige dan precies voor?
Sommige taalkundigen denken dat het woord ‘woord’ eigenlijk een misverstand is. De bekende Duitse taalkundige Martin Haspelmath is zo iemand. In een recente blogpost legt hij uit dat zelfs handboeken over morfologie opmerkingen bevatten zoals:
Full disclosure: no one knows what a word is. There is, so far, no definition that covers all the things that linguists identify as words in all languages.
Gebhardt 2023: 59
Toch waagt Haspelmath zich vervolgens zelf aan een definitie (verder uitgewerkt in een wetenschappelijk artikel in het tijdschrift Word (!)), maar dan om pragmatische redenen. Als je de taalkundige literatuur wilt begrijpen, moet je nu eenmaal weten wat mensen ongeveer bedoelen als ze een bepaalde term gebruiken. Die definitie is bewust onbevredigend in de zin dat het een opsomming is van dingen die een woord mogelijk zou kunnen zijn:
A word is (i) a free morph, or (ii) a clitic, or (iii) a root with its affixes, (iv) a compound with its affixes.
Hiermee worden natuurlijk allerlei nieuwe begrippen geïntroduceerd, zoals vrij, morf(eem), wortel, samenstelling, affixen, die ook weer allemaal een definitie behoeven wat evenmin een trivialiteit is, maar waarover meer overeenstemming bestaat; Haspelmath heeft de afgelopen jaren geprobeerd al die definities te geven. Het probleem bij een term als ‘woord’ is natuurlijk dat het ook in het dagelijks taalgebruik wordt gebruikt, en daar hebben morf en affix minder last van. Dat maakt een precies afgebakende wetenschappelijke definitie wat gemakkelijker. Een clitic (klitisch element) is overigens een term voor zaken als le en la (je la mange) in het Frans, of ‘m in het Nederlands: een woord dat vast zit aan een ander woord; maar dan moeten we dus uitkijken dat we in de definitie van clitic niet het begrip woord gebruiken, anders zijn we nog veel verder van huis.
Maar zelfs als het lukt al die deelbegrippen te definiëren, blijft staan dat we niet goed weten wat (i), (ii), (iii) en (iv) met elkaar gemeen hebben. Behalve dat we het allemaal ‘woorden’ noemen. Het lijkt een fundamenteel begrip voor de taal, maar dat laat alleen maar zien hoe groot de raadsels zijn waar de taalwetenschap nog steeds voor staat.
Jona Lendering zegt
Heerlijk stukje. Dank je wel.
Jan IJzermans zegt
Leuk stukske maar ook een illustratie van een dieper gegeven (‘probleem’ zullen sommigen zeggen) van wereldwijd geldende definities van basale begrippen. Bijv. een wereldwijd geaccepteerde definitie van stoel is er niet noch, met wat meer culturele implicaties, van feest of dankbaarheid.
Marc van Oostendorp zegt
Voor vrijwel geen begrip in de dagelijkse omgangstaal bestaat een sluitende definitie. Maar in een vaktaal probeer je dat onder collega’s op te lossen, en dat lukt in dit geval (ik weet niet hoe het zit bij stoelstudies of dankbaarheidswetenschap) lukt zelfs dat niet.
Bessel Dekker zegt
Een probleem is misschien onoverkomelijk: dat taalkundige termen worden gedefinieerd met behulp van andere taalkundige termen, maar dat dat wederzijds het geval is. Dat heeft misschien een nadeel (circulariteit), maar ook een voordeel (het onderstreept dat de taal een textuur is, met onderlinge samenhangen). Misschien is dat niet zo erg, en moeten we niet té veel naar discrete definities zoeken. En misschien moet de rol van de intuïtie in taalzaken niet onderschat worden. Dat is uiteraard geen vrijbrief voor wilde fantasieën: intuïtie blijft een hachelijk criterium.
Overigens een pietepeuterig kleinigheidje: waarschijnlijk zijn er geen „taalkundigen die zich syntaxis noemen”: dat is natuurlijk „syntacticus”.
Bert de Waart zegt
In een van de eerste colleges van het vak Algemene Taalwetenschap, verplicht bijvak voor alle candidandi in een talenstudie aan de UvA, zei Reichling, ooit zelf gepromoveerd op een ‘Het Woord’ geheten proefschrift (Een proefschrift in het Nederlands? Kon dat? Ja jongen dat kon toen), dat het woord het basiselement van taal was, met als enige argument dat een indianenopperhoofd van iets dat geen woord was, maar iets korters, had gezegd ‘It makes no sense’.
Nu ja, zo herinner ik het mij, van ruim vijftig jaar geleden.