Op 1 september 2022 vertrekt Antal van den Bosch als directeur van het Meertens Instituut. De laatste dagen van de maand nemen enkele (oud-)medewerkers van het instituut afscheid.
Een topwetenschapper laat zich niet leiden of beïnvloeden door ideologieën, vooroordelen, of de waan van het moment, maar kijkt met een open en onbevangen blik naar nieuwe ideeën, en beoordeelt die op hun intrinsieke waarde, niet op het theoretische paradigma waar ze uit afkomstig zijn. Dat was ook precies de ingesteldheid die wij, twee generatieve taalkundigen, aantroffen toen we in 2018 op het Meertens Instituut binnenstapten in het kantoor van Antal, een niet-generatief taalkundige. We hadden een theoretische analyse van variatie in werkwoordsvolgorde in de Nederlandse dialecten, maar die kon maar een deel van die variatie verklaren, en het vermoeden was dat taalcontact ook een belangrijke rol speelde. Het gesprek met Antal leidde tot een experiment om dat vermoeden te toetsen, en die samenwerking mondde uit in een gezamenlijke publicatie in Language (zie ook de eerdere bespreking op Neerlandistiek).
Werkwoordelijke wanorde
Drie woorden kan je op zes verschillende manieren na elkaar plaatsen. Toegepast op de laatste drie woorden van de zin “Ik vind dat iedereen moet kunnen zwemmen” levert dat de volgende zes volgordes op:
1. Ik vind dat iedereen moet kunnen zwemmen.
2. Ik vind dat iedereen moet zwemmen kunnen.
3. Ik vind dat iedereen zwemmen kunnen moet.
4. Ik vind dat iedereen zwemmen moet kunnen.
5. Ik vind dat iedereen kunnen zwemmen moet.
6. Ik vind dat iedereen kunnen moet zwemmen.
Als je dit zinnetje laat vertalen door dialectsprekers uit het hele taalgebied, dan blijken de laatste twee volgordes nergens voor te komen. Een derde van de theoretische mogelijkheden bestaat in de praktijk dus niet: lekker ordelijk. Achter die orde gaat echter een wereld van wanorde schuil:
In sommige dialecten komen alle volgordes in 1-4 voor, in andere slechts drie van de vier, of twee, of één, maar niet altijd dezelfde drie of twee of één. En de wanorde wordt nog groter wanneer we andere soorten van werkwoordsgroepen erbij betrekken: in de zin “Ik vind dat iedereen moet kunnen zwemmen” gaat het om een hoofdwerkwoord in de infinitief (“zwemmen”) gecombineerd met twee werkwoorden van modaliteit (“moet” en “kunnen”), maar in “dat hij de auto moet hebben gemaakt” gaat het om een voltooid deelwoord als hoofdwerkwoord (“gemaakt”), een werkwoord van modaliteit (“moet”), en een hulpwerkwoord van voltooid aspect (“hebben”). Wanneer we nu naar alle werkwoordvolgordes kijken in de SAND-database, dan vertonen de 185 dialecten waarvoor we alle gegevens voorhanden hebben niet minder dan 137 verschillende werkwoordsvolgordepatronen. Met andere woorden, bijna ieder dialect heeft zijn eigen unieke combinatie van welke werkwoordsvolgordes wel en welke niet voorkomen. De wanorde lijkt compleet.
Theoretische families
Een eerste manier om wat orde in de patronen te brengen is door ze onder te brengen in groepen: wanneer twee volgordes vaak samen voorkomen in een dialect, dan behoren ze tot dezelfde familie, en wanneer ze zelden of nooit samen voorkomen, dan behoren ze tot een verschillende familie. Vervolgens kan je dan nagaan of die families bepaalde eigenschappen gemeenschappelijk hebben, en daarvoor zijn we te rade gegaan bij de theoretische literatuur over werkwoordsclusters:
Op deze grafiek staan de 28 werkwoordsvolgordes die we in ons artikel onderzocht hebben. Volgordes die dicht bij elkaar staan komen vaak samen voor en behoren dus tot dezelfde familie, volgordes die ver van elkaar staan behoren tot een verschillende familie. De verschillende kleuren geven een poging weer om een theoretische invulling te geven aan de families. Uit een artikel uit 1986 van Liliane Haegemen en Henk Van Riemsdijk hebben we de hypothese gehaald dat de volgorde tussen een modaal werkwoord en het werkwoord dat erdoor geselecteerd wordt een belangrijke rol speelt in het verklaren van variatie in werkwoordsvolgorde, en die hypothese wordt deels bevestigd in de grafiek: de groene volgordes, die in de analyse van Haegeman & Van Riemsdijk modale inversie vertonen, staan overwegend aan de rechterkant van de grafiek, en de rode volgordes zonder modale inversie staan links. (De zwarte volgordes bevatten geen modaal werkwoord en zijn dus irrelevant voor deze hypothese.) Door de werkwoordsvolgordes op te delen in theoretische families kunnen we dus een deel van de variatie begrijpen.
Doe zoals je buren
Een deel van de variatie, maar lang niet alles, en dat is waar Antal op het toneel verscheen. Hij stelde voor om ook geografische locatie in rekening te brengen: de volgordes die een dialectspreekster aanvaardt worden mogelijk niet enkel bepaald door haar grammatica (de theoretische familie die ze aanhangt), maar ook door de volgordes die gebruikt worden in naburige dorpen of steden. De methode die we hiervoor gebruikt hebben is “k-nearest neighbours classification”: je probeert het al dan niet voorkomen van een bepaalde werkwoordsvolgorde te voorspellen door te kijken of ze voorkomt in naburige locaties. Het leuke aan deze methode is dat je ‘naburig’ op verschillende manieren kan definiëren: twee dialecten kunnen naburig zijn doordat ze geografisch dicht bij elkaar liggen, maar ook doordat ze tot dezelfde (of een gelijkaardige) theoretische familie behoren. Op die manier konden we laten zien dat de theoretische analyse en de puur geografische benadering complementair zijn, en een verschillend deel van de variatie verklaren. Meer in het algemeen hopen we met dit artikel te laten zien dat een samenwerking tussen formeel-theoretische en kwantitatief-computationele taalkundigen een duidelijke meerwaarde kan opleveren voor beide partijen. Wij hopen in ieder geval de samenwerking met Antal in de toekomst nog verder te zetten.
Laat een reactie achter