Door Marten van der Meulen
Ik ben dezer dagen voor allerlei onderzoeksdoeleinden lekker aan het klooien in het onvolprezen Corpus Gesproken Nederlands (CGN). Een van de voorbeelden die ik tegenkwam bevatte het volgende fragment:
het ook een een een boek dat
Een grappig voorbeeld: drie keer een op een rij! Ik wist wel dat mensen af en toe lidwoorden herhalen. In gesproken taal komt het best eens voor: het wordt gedaan om tijd te rekken, om even na te kunnen nadenken. Uh en uhm worden soms om dezelfde reden gebruikt. Maar voor zover ik weet houdt het wat betreft lidwoorden hierbij op: welke we herhalen en hoe vaak we dat doen, daar ben ik nog geen artikel over tegengekomen.
Bepaald of onbepaald
Worden bijvoorbeeld bepaalde of onbepaalde lidwoorden vaker herhaald? Ik had het daar toevallig over met een van mijn hooggeachte promotoren, Helen de Hoop. Zij hypothetiseerde dat onbepaalde lidwoorden vaker worden herhaald, omdat je bij zo’n lidwoord nog meer mogelijkheden hebt voor wat je gaat zeggen. Het woord onbepaald is hier doorslaggevend. Zo’n hypothese is in het CGN makkelijk te testen. Het enige wat ik moet doen is lidwoorden zoeken die op elkaar volgen. Een probleem: in principe zit natuurlijk ‘een een’ ook in ‘een een een’. Ik loste dit op door in mijn zoekopdracht telkens de combinatie van lidwoorden zowel te starten als te eindigen door ‘woord is níet (het lidwoord waar ik naar zoek)’. Ook zocht ik alleen op woorden die als lidwoord waren aangemerkt, om zo het telwoord één buitenspel te zetten. Zie hier beneden de resultaten.
de | het | een | |
2x | 2321 | 279 | 2919 |
3x | 387 | 29 | 607 |
4x | 96 | 9 | 133 |
5x | 20 | 3 | 32 |
6x | 6 | 0 | 14 |
7x | 7 | 0 | 3 |
8x | 0 | 0 | 2 |
9x | 0 | 0 | 1 |
totaal | 2837 | 349 | 3711 |
Ik moet zeggen: ik was toch behoorlijk verbaasd over hoe vaak dit voorkwam. In totaal vinden we herhalende lidwoorden in maar liefst 6897 gevallen. Ook opvallend vind ik de voorbeelden met heel veel opeenvolgende lidwoorden. Die gevallen zien er zo uit:
dat is een zeg maar een een een een een een een een een manier van genezing die uit Japan komt (9x een)
de de de de de de de zogenaamde aanschuifconferenties die we in Oudemanhuispoort hebben georganiseerd (7x de)
het is ’t is allemaal wat meer buiten het het het het het Haagse gekonkel (5x het)
De en een
Vervolgens valt op dat de en een veel vaker voorkomen dan het. Maar dat is misschien een effect van de totale aanwezigheid van die lidwoorden. Daar is makkelijk achter te komen door de relatieve frequentie van de lidwoorden in het corpus.
totaal corpus | % lidwoord corpus | % dubbele lidwoorden | |
de | 249.339 | 52,5% | 41,1% |
het | 53.230 | 11,2% | 5,1% |
een | 172.332 | 36,3% | 53,8% |
Inderdaad komt het relatief minder voor, en dat verklaart deels ook het feit dat het minder voorkomt bij de verdubbelde lidwoorden. Maar daar is niet alles mee gezegd. Dan de andere hypothese: komt lidwoordherhaling inderdaad vaker voor bij onbepaalde lidwoorden? Het antwoord daarop is absoluut ja. Onbepaalde lidwoorden zijn stevig oververtegenwoordigd bij de verdubbelingen. Ze komen bovendien ook in langere combinaties voor.
Aanwijzende voornaamwoorden
Een andere collega van me, Joske Piepers, kwam op vervolgens op het lumineuze idee om ook naar aanwijzende voornaamwoorden te kijken. Deze (sic) zoekopdracht sluit aan bij een serie waar Marc van Oostendorp mee bezig is over het verschil tussen hier en daar, dit en dat: dit en deze zijn formeler en specifieker dan dat en die. Mijn vermoeden is dat dat en die dus vaker voorkomen, opnieuw vanwege de onzekerheid die in de woorden besloten ligt. Ik vermoed bovendien dat deze weinig wordt herhaald, omdat het niet eenlettergrepig is.
die | dat | dit | deze | |
2x | 2986 | 8497 | 113 | 35 |
3x | 411 | 542 | 12 | 3 |
4x | 70 | 108 | 0 | 0 |
5x | 13 | 11 | 0 | 0 |
6x | 7 | 2 | 0 | 0 |
7x | 2 | 0 | 0 | 0 |
totaal | 3489 | 10160 | 125 | 38 |
Mijn vermoedens worden wederom bevestigd. Het verschil in frequentie is bovendien veel groter dan bij de lidwoorden: het meer specifieke dit en deze worden slechts bij uitzondering herhaald. Opvallend is het hoge aantal verdubbelingen van dat ten opzichte van die: dat strookt niet met de frequenties van de bijbehorende lidwoorden. Voor een deel kan het misschien verklaard worden door zinnen als Ik denk dat dat klopt, maar meer gedetailleerd onderzoek zou moeten uitwijzen of dat zo is.
Meer onderzoek
Het is weer een klein en behoorlijk oppervlakkig onderzoekje (net als bij difficulteren), maar het laat toch een paar interessante dingen zien. Zo komen aanwijzend voornaamwoord- en lidwoordverdubbelingen behoorlijk vaak voor. Veel vaker dan ik had gedacht in ieder geval. Bovendien komen verdubbelingen vaker voor bij het onbepaalde lidwoord en de onbepaaldere aanwijzende voornaamwoorden. Daarmee is de kous niet af. Om in een goede wetenschappelijke traditie te besluiten: er moet meer onderzoek worden gedaan. Zijn er bijvoorbeeld nog nadere patronen te bespeuren in het gebruik? Welke woorden volgen op de verdubbelingen? Zijn er nog effecten van genre? Komen verdubbelingen bijvoorbeeld meer voor in informelere situaties (je zou denken van wel)? Sowieso ben ik van mening dat lidwoorden nog wel wat meer onderzoek verdienen. Geïnteresseerden kunnen zich te allen tijde bij ondergetekende vervoegen.
Dit artikel verscheen eerder op het eigen blog van Marten van der Meulen.
Mient Adema zegt
Als je begint te stotteren met lidwoorden of aanwijzende voornaamwoorden en dat gebeurt omdat je nog niet weet wat erachter moet komen, dan is het in principe heel goed mogelijk dat je na 5 x een tot een de of het komt, of na een dit tot een deze of die. Je begint met een lekker kort woord dat flexibel is in combinaties, lijkt me, en als je weet wat het wordt ga je een van de verschillende hokjes in. Dat CGN zou dus ook voor die opties aangewend moeten worden, wil je een wat verantwoord beeld krijgen.
msvandermeulen zegt
Ik zou sowieso niet van ‘stotteren’ spreken hier, net als dat bij uh en uhm niet het geval is, maar meer van herhaling. Het is een interessant idee of mensen na een tijdje naar specifiekere woorden overstappen die níet bijvoorbeeld zelfstandige of bijvoeglijke naamwoorden zijn. Probleem hierbij is wel dat er bij zo’n overgang twee dingen kunnen gebeuren: een vernauwing van de mogelijkheid (‘een een een een dít boek’), of een koerswijziging (‘de de de de (aanvankelijk richting vraag) het antwoord’). Het lijkt me erg moeilijk om daar een onderscheid tussen te maken. Ik kom er waarschijnlijk op korte termijn niet aan toe vrees ik…
Mient Adema zegt
Stotteren is bij nader inzien hier misplaatst, al was het wel bedoeld als een wat losse manier van zeggen. Ik bedoelde aan te geven dat herhalingen van lidwoorden en aanwijzende voornaamwoorden (maar evenzeer zinsdelen die met een herhaald “om” beginnen bijvoorbeeld) iets laten zien van wat in iemands hoofd speelt. Je krijgt dan, lijkt me, te maken met enerzijds aarzeling en anderzijds de wil om het bij voorbaat in een taalkundige vorm te gieten die je nog niet precies te pakken hebt.
Mijn idee was dat met de gevonden zinnen uit het CGN vrij gemakkelijk zou kunnen worden begrepen om welke reden de herhaling plaats vond.
Was het de vondst van het juiste woord of gooide de spreker het uiteindelijk maar over een andere boeg?
In spreektaal moet het wel wemelen van dit soort koerswijzigingen.
Peter-Arno Coppen zegt
De hypothese van De Hoop dat ‘een’ meer mogelijkheden biedt (omdat het geen genderdifferentiatie vertoont) lijkt zeker een deel van de verklaring voor het verschil tussen het onbepaalde en het bepaalde lidwoord. Maar misschien gaat het ook om het pragmatische principe dat er bij ‘de’ eerder sprake zal zijn van een zelfstandig naamwoord dat al in het discussiedomein aanwezig is, en dus geen woordvindingsproblemen zal opleveren.
elsware zegt
Dat laatste lijkt ook mij het meest voor de hand liggende, naast de hypothese van De Hoop.
msvandermeulen zegt
Ik zou niet zeggen dat ‘de’ géén woordvindingsproblemen zou opleveren, want dan zou er ook geen reden zijn om ‘de’ te herhalen, en dat gebeurt wel. Maar misschien speelt ‘aanwezigheid in het discussiedomein’ (wat ik een fijne en sjieke omschrijving vind) wel een rol. Punt lijkt me alleen dat zelfs bij ‘een’ het gekozen woord uiteindelijk toch óók een grotere kans heeft binnen dat domein te vallen. Het lijkt hiermee een neurolinguïstisch vraagstuk te worden: als je ‘een’ zegt, weet je dan nog totaal niet welk woord erna komt? Ik denk dat dat niet zo is…