Het stuk ‘Behoorlijk vernietigend’ van Riny Huijbregts opent met: “Een korte reactie op drie elementen uit de bijdrage van Freek van de Veldes “Hoe vernietigend zijn parasitaire gaten voor de gebruiksgebaseerde taalkunde?”.” Dan volgt een helemaal niet zo korte aanval op een aantal stellingen die ik vanuit een gebruiksgebaseerde achtergrond heb ingebracht in de discussie. Die snijden volgens Riny geen van alle hout.
Parasitaire gaten als godsbewijs
Door Freek Van de Velde
Ik apprecieer het enorm dat Huijbregts de moeite neemt om te reageren. Nicolaas Beets heeft eens geschreven: “Het botsen der gevoelens: zegt men vaak, Kan voeren tot het ware van de zaak”.Een parafrase eigenlijk van het Franse bon mot Du choc des opinions jaillit la vérité. Maar dat ik de geste apprecieer betekent uiteraard niet dat ik nu gelijk overtuigd ben van alles wat Huijbregts in die reactie neerpent.
Ik ga niet op alle kwesties apart in, want we zitten hier, ondanks de soms zelotische toon van de discussie, niet op een taalkundig-religieuze synode waar we elke leerstelling apart moeten behandelen. Ik wil trouwens ook niet te technisch worden op Neder-L. Wat ik wel wil doen, is een aantal misverstanden over concepten en methoden in de gebruiksgebaseerde taalkunde aankaarten, waaruit de verontwaardigde reactie van Huijbregts (cum sociis) voortkomt, denk ik. Beets’ gedicht gaat verder: “waar vooroordeel met vooroordeel strijdt, Wat is het – dan verlies van tijd!”. Het lijkt me nuttig dat we een goed zicht krijgen op elkaars uitgangspunten, om niet te blijven hangen in ‘vooroordelen’.
Allereerst iets over corpora. Er lijkt bij sommige (zij het lang niet alle) generatief-taalkundigen een diep wantrouwen in corpusdata te bestaan. Die corpora hebben last van sample bias, performance-ruis, noem maar op. Je had een tijdje geleden ook van die artikelen als ‘O corpora o mores’ (Verkuyl 1998, Nederlandse Taalkunde), maar ik heb de indruk dat ook bijna twintig jaar later de generatieve taalkunde het corpusonderzoek nog steeds niet helemaal in haar hart heeft gesloten. Het is zeker waar dat sommige zinnen niet in een corpus voorkomen, of dat je niet altijd zeker weet wat er bedoeld is. Soms geeft de context inderdaad geen uitsluitsel, maar dat neemt niet weg dat het bekijken van empirische data een veel wetenschappelijker type data-garing is dan introspectie. Ten eerste heb je bij introspectie individuele verschillen tussen taalkundigen over wat nu wel en niet acceptabel is. Een zin als ‘Waar heb je zonder in te lezen een boek over gekocht’ is voor mij eigenlijk heel slecht. Maar er hoort geen sterretje bij, geloof ik, als je de parasitaire-gatenexperts gelooft. Of neem Huijbregts voorbeeld ‘Here’s someone who everyone who meets (PG) will immediately like (RG)’, die goed heet te zijn. We moeten Huijbregts kennelijk op z’n woord geloven. Voor mij is dit maar een rare zin. Als je op de acceptabiliteit van die zin een theorie bouwt, krijg je een wankel bouwwerk natuurlijk. Ten tweede: zelfs als je overeenstemming tussen twee taalkundigen hebt over een zin, is het nog maar de vraag hoe stabiel je oordeel is. Iedereen kent wel het fenomeen dat het je na een zin of tien gaat duizelen voor de ogen, en dat je niet precies meer weet of je een voorgelegde zin nu wel of niet grammaticaal vindt (zgn. ‘competence collapse’). Dat geldt a fortiori voor ingewikkelde, zelf-gefabriceerde zinnen die de marge van de grammatica verkennen. Er is verder ook onderzoek dat laat zien dat taalgebruikers bij heel complexe constructies gewoon geen intuïties meer hebben, en soms maar wat gaan knoeien (zie Gaeta 2013 voor een interessant voorbeeld, maar er zijn er meer). Ten derde: introspectie en corpusonderzoek leiden niet tot dezelfde resultaten, en ik denk dat Gibson & Fedorenko (2013) gelijk hebben als ze argumenteren dat kwantitatief onderzoek betrouwbaarder resultaten oplevert.
Huijbregts merkt op dat sommige zinnen of constructies niet frequent voorkomen in een corpus, maar toch goed gevonden worden. Hoe kan dat? vraagt Huijbregts zich af. Hier komt dus analogie om de hoek kijken. Nieuwe patronen kunnen herkend en geparseerd worden op grond van eerdere voorbeelden, ook – en dat is, naar ik vermoed – een verschil met de generatieve taalkunde, als die eerdere voorbeelden niet 100% gelijk zijn in hun grammaticale structuur met wat eerder voorkwam in het aanbod. In de generatieve taalkunde wordt dat niet als analogische extensie van het bestaande bottom-up gebouwde repertoire van de taalleerder gezien, maar als een bewijs van ingebakken kennis. Ik begrijp dan ook niet goed hoe Huijbregts met grote stelligheid kan beweren dat “Geen enkele contekst en geen enkele frequentie in een bestaand corpus zal het effect teweeg brengen dat “er” in Waar heeft Jan er vaak over gesproken? locatief geïnterpreteerd gaat worden.”
Huijbregts ziet ook helemaal niets in het ‘vage’ concept van analogie. Dat is niet operationaliseerbaar, of wordt althans door mij niet geoperationaliseerd. Het klopt dat analogie een glibberig mechanisme is in taal. Het kan soms de ene kant op gaan, soms de andere, en je weet op voorhand niet altijd waar het gaat toeslaan. Jammer, maar zo is het nu eenmaal. De effecten zijn nochtans heel reëel. Ik zie althans niet hoe je een vorm als ‘gegoven’ (in het dorp waar ik als kind gewoond heb een heel gebruikelijke vorm) voor ‘gegeven’ moet verklaren zonder een beroep te doen op analogie. Hier is een werkwoord uit sterke klasse V (‘geven’) overgegaan naar sterke klasse IV (typevoorbeeld ‘nemen’) in zijn ablautklinker voor het participium. Waarom niet overal en in elk dialect? Tja, die mate van onvoorspelbaarheid heb je ook in de geschiedenis (waarom breekt de Franse revolutie in 1789 uit, en niet in 1788 of 1790?), de biologie, en zelfs de fysica, met de welbekende vleugelslag van een vlinder die een orkaan in een andere hemisfeer kan opwekken. Nog een linguïstisch voorbeeldje: neem enkelvoud ‘bond’, preteritum van ‘binden’, dat vroeger ‘band’ was, maar de klinker van het meervoud (‘bonden’) analogisch overgenomen heeft. In het Duits is het precies andersom. Daar heeft het meervoud zich analogisch aangepast aan het enkelvoud. Misschien komen we er ooit wel achter waarom deze verwante talen, een radicaal tegengestelde beweging hebben gekend in dit particuliere geval, maar op dit ogenblik is het onduidelijk. Ik begrijp dat dat frustrerend is voor grote systeembouwers als Huijbregts, maar het is niet anders. Ook hier geldt: hoe moet je de genoemde voorbeelden anders verklaren dan met ‘analogie’?
Is er dan helemaal geen empirische greep te krijgen op analogie? Toch wel. Dat is precies wat we laten zien in dat artikel van Pijpops & Van de Velde waarnaar ik doorgelinkt had, maar ik denk dat Huijbregts zich “de moeite bespaard heeft” dat na te lezen.
Huijbregts gaat ook nog eens in op het Poverty of Stimulus argument, en komt met cijfers, die hem tot de volgende uitspraak verleiden: “de conclusie lijkt onvermijdelijk dat PG-type constructies onleerbaar zijn op grond van data alleen.” Daar ben ik het dus grondig mee oneens. Er zitten in de redenering allerlei assumpties, die de gebruiksgebaseerde grammatica helemaal niet noodzakelijkerwijze deelt. Bijvoorbeeld: “0.2 % PG-aanwezigheid in het kind/hoorder-gerichte taalaanbod is nodig voor een leersucces” Dat lijkt me een gigantische overschatting. Dąbrowska (2014) haalt een hoop onderzoek aan waaruit blijkt dat “Human long-term memory has a vast storage capacity. Some researchers have even argued that, for all practical purposes, its storage capacity can be assumed to be infinite”. Daaruit volgt dat ook heel incidentele patronen gemakkelijk opgeslagen kunnen worden: “A series of rigorous experiments recently conducted by Gurevich et al. (2010) demonstrates incidental verbatim memory for sentences in adults after a single exposure.” (Dąbrowska 2014: 627). Dąbrowska wijst verder ook op onderzoek van Moon die meerwoords-idiomen uit een woordenboek opzoekt in een 18-miljoen-woorden-corpus en vaststelt dat 70% van die idiomen een frequentie van minder dan 1 per miljoen woorden had en 40% zelfs helemaal niet voorkwam. Als je geen linguïst bent, kom je ‘kick the bucket’ bijna nooit tegen, maar toch kennen de meeste moedertaalsprekers de uitdrukking. Hoe leert iemand een constructie als “hij wierp zich op het banket als had hij in een week niet gegeten”, met die rare woordvolgorde na ‘als’? Je hoeft die niet zo vaak tegen te komen om ermee uit de voeten te komen. Kinderen komen er waarschijnlijk helemaal niet mee in aanraking. Maar als je die als volwassene een paar keer hoort, dan kan je toch verwerven, ook als die de woordvolgorderegels van het Nederlands schendt.
Een andere assumptie van Huijbregts is dat grammatica verworven wordt door kinderen en niet (meer) door volwassenen. Ook dat is een assumptie die niet gedeeld wordt in de gebruiksgebaseerde taalkunde (zie bijvoorbeeld Croft 2000).
Omdat je zelf geen blad voor de mond neemt, permitteer ik me hier een wat chargerende uitspraak, Riny. Dat zul je me wel niet euvel duiden. De soms zelfgenoegzaam geformuleerde ‘generalisaties’ die de generatieve taalkunde beweert ontdekt te hebben, en die haar naar eigen zeggen zo gunstig doen afsteken bij het platte-aarde-functionalisme van de gebruiksgebaseerde benaderingen, maken op een buitenstaander – uit andere vakdomeinen of van andere theoretische overtuigingen in de taalkunde – soms de indruk van een samenzweringstheorie. Er worden overal, in alle talen en in allerlei grammaticale constructies, bewijzen voor functionele projecties, lokaliteitsprincipes en wat weet ik al niet gevonden, die meteen (van)alles verklaren. Als gebruiksgebaseerde taalkundige kijk je daar met stijgende verbazing naar. Soms zijn er heel eenvoudige, lokale mechanismen (zoals analogie), die de gevonden patronen net zo goed kunnen verklaren. Ik gebruik graag de formulering ‘local generalisations’ van Joseph (1992), zie ook Enger (2013). Ook in het Nederlands zijn er spectaculaire voorbeelden van aan te wijzen (zie Van de Velde & Van der Horst 2013). Als je daarmee aankomt, krijg je vaak laatdunkende reacties van generatieve taalkundigen: ‘Maar dat is toch geen verklaring! Je wil toch een omvattender principe ontdekken’. Ik weet niet of dat per se zoveel beter is. Domein-algemene cognitieve processen zijn net heel breed, ook als ze maar lokaal werkzaam zijn. Voor de gebruiksgebaseerde taalkunde is er niet zoiets als een groot domein-specifiek taalkundig-computationeel systeem in het hoofd van de spreker waarbij je ‘gratis’ allerlei grammaticale regelmatigheden verklaard krijgt. Net zomin als er een clubje Zionistische kapitalisten in een New Yorks dakappartement de wereld bestiert, die als het hun goed uitkomt de Twin Towers neer laten halen. Hoezeer dat ook een unificerende verklaring zou kunnen bieden voor allerlei geobserveerde patronen in de wereld. Opgelet: ik zeg niet dat de generatieve taalkunde zichzelf een rad voor ogen draait, alleen dat ze er wonderwel in slaagt die indruk te wekken ten overstaan van buitenstaanders, inclusief beroepslinguïsten. Als Huijbregts op het einde schrijft “Negeren is mogelijk, ontkennen moeilijk. Dus, Freek. Hoe vernietigend? Behoorlijk!” dan klinkt dat als het triomfalisme van iemand die een godsbewijs op tafel legt.
Booij, G. 2010. Construction morphology. Oxford: Oxford university press, 2010.
Croft, W. 2000. Explaining language change. An evolutionary approach. Harlow: Longman.
Dąbrowska, E. 2014. ‘Recycling utterances: a speaker’s guide to sentence processing’. Cognitive Linguistics 25(4): 617-653.
Enger, H.-O. 2013. ‘Morphological theory and grammaticalisation: the role of meaning and local generalisations’. Language Sciences 36: 18-31.
Gaeta, L. 2013. ‘Multiple sources for the German scandal construction’. Studies in Language 37(3): 566-598.
Gibson, E. & E. Fedorenko. 2013. ‘The need for quantitative methods in syntax and semantics research’. Language and Cognitive Processes 28(1-2): 88-124.
Joseph, B.D. 1992. ‘Diachronic explanation: Putting the speaker back into the picture’. In: G.W. Davis & G.K. Iverson (eds.), Explanations in historical linguistics. Amsterdam: John Benjamins. 123-144.
Van de Velde, F. & J. van der Horst. 2013. ‘Homoplasy in diachronic grammar’. Language Sciences 36(1). 66–77.
Van de Velde, F. & D. Pijpops. Under review. ‘Constructional contamination. A case study’.
Verkuyl, H.J. 1998. ‘O corpora, O mores’. Nederlandse Taalkunde 3: 60-63.
mark zegt
Laten we wat grammaticaliteitsoordelen betreft niet het kind met het badwater weggooien: de veelgeciteerde resultaten van Sprouse & Almeida hebben laten zien dat ze wel degelijk robuust kunnen zijn, en relatief gemakkelijk gekwantificeerd kunnen worden. Het is me wel een raadsel waarom dat niet meer gebeurt trouwens, nu het zo eenvoudig is.
Overigens is de repliek van Gibson en collega's op S&A; (Language & Cognitive Processes, 2012) ook zeer de moeite waard om te lezen. Daar wijzen ze erop dat veel van de door S&A; geteste contrasten relatief eenvoudige dingen zijn waar alle huidige syntactische theoriën (zowel generatief als gebruiks- of constructie-gebaseerd) een goed antwoord op hebben. Waar het echt om draait is of de betrouwbaarheid net zo hoog is voor de contrasten waarvan gezegd wordt dat ze cruciaal zijn voor het beslissen tussen twee verschillende theorieën. Daarvan zijn er een stuk minder in de geteste database, en die zijn niet systematisch gecodeerd door S&A;, dus dat is nog goeddeels een open vraag.
Dat is volgens mij waar Freek Van de Velde hier op doelt in zijn eerst punt van repliek: de verregaande vreemdheid van de parasitaire gat-zinnen die door Huijbregts en collega's als cruciaal voorgesteld worden. Ook ik deel die vervreemding, bijvoorbeeld met betrekking tot de zinnen "Guess which politician your interest in clearly appeals to" en "Guess which politician your interest in Jane clearly appeals to", die in het TiCS-artikel allebei als goed aangemerkt worden (en als beter dan "Guess which politicain clearly loves your interest in"). Zoals Gibson et al. 2012 aangeven, "very high reliability is required for complex theories". Juist hier zou het dus belangrijk zijn om een meer experimentele, kwantitatieve benadering serieus te nemen om er zeker van te zijn dat het fenomeen inderdaad zo werkt als gedacht.
De vermeende vaagheid van analogie bestaat volgens mij alleen als je een hele hoop serieus onderzoek onder het tapijt veegt, van Von der Gabelentz en Von Humboldt tot Hockett, Gentner, MacWhinney, Croft, Anderson en recentelijk bijvoorbeeld Bod. Dat het minder elegant lijkt ligt maar net aan wat je priors zijn natuurlijk. Dat is dan ook wat deze discussie blootlegt: een dieper verschil van inzicht over wat taal precies is en waar het te vinden is.