Onverwachte taalvragen in de Nationale Wetenschapsagenda (2)
Door Marc van Oostendorp
Er zijn voor een taalkundige soms verrassende vragen ingediend bij de Nationale Wetenschapsagenda. Zoals:
- Hoeveel Nederlands hebben we al gebruikt? ‘Banket’ en ‘stoet’ zijn Nederlandse woorden, ‘stulika’ en ‘oproom’ zijn (waarschijnlijk) geen Nederlandse woorden, maar zouden het kunnen zijn, ‘hglsko’ en ‘salptjr’ kunnen geen Nederlandse woorden zijn. Hoeveel van het potentieel hebben we gebruikt, en verschilt het Nederlands daarin van andere talen?
Het antwoord op die vraag valt wel bij benadering te geven.
We moeten daarvoor eerst even aannemen dat ‘het Nederlands’ (hier wordt duidelijk bedoeld: de Nederlandse woordenschat) een eindige omvang heeft. We moeten dan dus afzien van hottentottententententoonstelling-achtige woorden.
Drie stukjes
Laten we ons beperken tot die woorden waarin we geen onderdelen meer kunnen herkennen die zelf ook weer woorden zijn (zoals tent of stel). De volgende vraag is dan: hoe lang kan zo’n woord zijn. Encyclopedie heeft vijf lettergrepen en er is geen reden om aan te nemen dat er geen woorden zouden kunnen zijn met honderd, of duizend lettergrepen, ook al bestaan die (nog) niet. Hier hebben we dus alweer snel een bron van oneindigheid te pakken, maar laten we voor het gemak het maximale aantal lettergrepen op 7 stellen.
Nu wordt de vraag dus: hoeveel verschillende lettergrepen zijn er? We delen daarvoor de lettergreep op in drie stukjes:
- Voor de klinker kunnen staan (we tellen alleen klanken): p, t, k, b, d, f, s, ch, v, z, g, m, n, l, r, j, w, pr, tr, kr, br, dr, fr, chr, vr, gr, pl, kl, kw, tw, bl, fl, sl, chl, vl, zl, gl, pn, kn, sp, st, sch, sm, sn, sl, sj, spr, str, schr, spl (50 mogelijkheden)
- Het Nederlands heeft de volgende klinkers: aa, ee, eu, oo, ie, uu, oe, a, e, u, o, i, stomme e, ei, ui, au (16 mogelijkheden)
- Na die klinkers kunnen de volgende medeklinkers staan: p, t, k, s, ch, m, n, l, r, j, w, mp, lp, rp, nt, lt, rt, nk, lk, rk, mf, lf, rf, ns, ls, rs, rch, lch, cht, ng, ngst (31 mogelijkheden)
Struil
Dat geeft dus 50x16x31 = 24.800 mogelijkheden. Dit is een wat grove schatting want enerzijds kunnen bijvoorbeeld niet alle klinkers met alle mogelijke (combinaties) van slotmedeklinkers worden samengevoegd, en anderzijds kunnen slotlettergrepen meer dan andere lettergrepen. Maar het betekent dat er ongeveer 2000.000.000.000.000.000.000.000.000.000 mogelijke ongelede zevenlettergrepige woorden zijn.
Maar hoeveel van dat potentieel hebben we eigenlijk gebruikt? We hebben waarschijnlijk wel veel verschillende ongelede woorden, in ieder geval als we allerlei technische en wetenschappelijke termen gaan meetellen, maar daarmee bezetten we toch maar een klein deel van de totale mogelijke ruimte.
Dat komt doordat we tegelijkertijd allerlei woorden hebben die ambigu zijn, zoals bank: in plaats dat we die term reserveren voor het zitmeubel en de financiële instelling een ander deel van de ruimte laten bezetten (struil), kiezen we er kennelijk voor om in plaats daarvan een al bestaand deel te gebruiken.
Wonderlijk
Dit is een curieuze eigenschap die het Nederlands deelt met andere talen: de ruimte wordt helemaal niet gebruikt, ook al lijkt hij eigenlijk nodig. In plaats dat er steeds meer ruimte wordt gebruikt, wordt de gebruikte ruimte juist kleiner. Volgens sommige tellingen gebruikte het Chinees zo’n duizend jaar geleden ongeveer 3100 verschillende lettergrepen, en nu nog maar 1300. Woorden hebben kennelijk de neiging op elkaar te lijken.
De reden waarom taalkundigen zich niet met de vraag aan de Wetenschapsagenda bezighouden is dat hij op zich nergens toe leidt. Taalkundigen willen niet allerlei feitjes over taal weten, maar weten hoe taal in de hersenen of in de maatschappij werkt, hoe taal zich in het verleden ontwikkeld heeft, hoe je een computer taal zou kunnen leren, niet ‘hoeveel Nederlands we hebben gebruikt’. Maar in dit geval zit er onder die simpele vraag wel degelijk een verbazingwekkende kwestie: dat we de neiging hebben de mogelijkheden van onze talen onder te benutten. Ik weet niet waarom dat zo is of hoe je het zou kunnen onderzoeken. Maar het is een wonderlijk fenomeen.
andre rodenburg zegt
Zo hebben alle Nedelanders die ooit geleefd hebben ook niet allemaal unieke namen, maar zijn velen juist naar iemand anders vernoemd. Een geldbank (de Grieken noemen dat trouwens een trapeze…) heet zo omdat iemand vroeger op een zitmeubel zaken deed. Soms vindt iemand iets nieuws uit en dat krijgt dan een al dan niet 'bestaande' naam als rijwiel of fiets.
Hans de Wolf zegt
Het feit dat een taal bestaande woorden hergebruikt voor nieuwe begrippen in die taal deed me denken aan het komische Engelstalige boekje "The Meaning of Liff" (https://en.m.wikipedia.org/wiki/The_Meaning_of_Liff) van by Douglas Adams en John Lloyd en de opvolger "The Deeper Meaning of Liff", waarin wordt voorgesteld om plaatsnamen te gaan gebruiken voor nieuwe begrippen, omdat die toch niets beter te doen hebben dan rondhangen op plaatsnaamborden.
Drabkikker zegt
Ha, dit vraagt om herafstoffing van mijn oude woordgeneratorspel!
Drabkikker zegt
Daar is ook een hele leuke Nederlandse versie op geënt! Kunt u Breukelen? heet het.
Marcel Plaatsman zegt
Het kan toch ook voor een taalkundige interessant zijn om de eindigheid van het aantal mogelijke woorden te onderzoeken? Voor het Chinees is het bijvoorbeeld wel relevant, het aantal lettergrepen is zó beperkt dat er veel homoniemen zijn ontstaan, die weliswaar op schrift goed uit elkaar gehouden worden door de karakters, maar in de gesproken taal gaat dat natuurlijk niet. Hoe gaat zo'n taal met de welbekende homonymievrees om?