In zijn reactie op Marc van Oostendorps bijdrage De wiskundige structuur van de zin ontrafeld heeft Berthold van Maris natuurlijk groot gelijk dat we lang voor Chomsky al bekend waren met zinsdelen. Dat is nooit enig punt van discussie geweest. Zinsdelen zaten altijd al in het basisschoolpakket. Toch heeft dit pakket nooit geleid tot de cognitieve revolutie van halverwege vorige eeuw.
Wat is daar precies gebeurd? Wat hebben we ervan geleerd? Marc van Oostendorp zet met eenvoudige voorbeelden van Chomsky helder uiteen dat het menselijk taalsysteem blind is voor lineaire woordvolgorde maar gevoelig is voor hiërarchische structuur. Niet zomaar een constatering maar een krachtig empirisch resultaat en noodzakelijk gevolg van een “wiskundige” regel in een taalsysteem met een organische inbedding. Precies het omgekeerde van wat je zou verwachten. Dat had niemand zien aankomen. We horen woorden en woordgroepen op een andere plaats dan waar ze geïnterpreteerd worden. Nu is het duidelijk waarom dit zo is en ook zo moet zijn. De “zinsdelentheorie” van Chomsky is dus duidelijk meer dan wat Van Maris ons zou doen vermoeden. Niet echt opzienbarend nieuws. Chomsky zoekt naar “echte” verklaring waar de ander “enkel” beschrijft. Dit is de kern van het generatieve paradigma. Verklaring vereist een theoretisch model. Vóór LSLT (1955) en Syntactic Structures (1957) was er geen enkel serieus, expliciet, taalmodel. Na LSLT was er een programma voor een potentieel verklarend model. De tijdslijn van vóór 1955/57 wordt dan ook soms voor de grap als B(efore)C(homsky) aangemerkt.
We moeten in wetenschap, ook in cognitieve wetenschap, eisen stellen aan wat een verklaring zou kunnen en moeten zijn. Linguïstiek is gelukkig een domein waar dat mogelijk is gebleken. Dat is het goede nieuws van Chomsky toen en nu. Onderzoek naar interne taal is door hem opgewaardeerd van natuurlijke historie tot natuurwetenschap. Niet elk antwoord op een vraag is een verklaring. Recentelijk benaderen courante formuleringen van het humane taalsysteem (de zogeheten “strong minimalist thesis”) het schoonheidsideaal dat John Archibald Wheeler voor ogen stond en recht doet aan het eenvoudsbeginsel van Einsteins “miracle creed.”
Je hoeft niet veel meer te lezen (en te begrijpen) dan Chomsky’s “Three Models” (1956). Het tweede model daarin besproken (Phrase Structure Grammar) zou in de ogen van van Maris alleen al een voldoende beschrijving zijn van zinsdelen en taalstructuur. Waarom dan nog Chomsky? Het is de moeite waard om daar wat langer bij stil te staan. Chomsky toonde aan dat deze zinsdeelmodellen geen verklarende/predictieve waarde hebben. Daarvoor had je een derde model met een ander type regel nodig dat het bestaan van ongebonden onafhankelijkheden kan verklaren. Deze vroegere theorieën krijgen vanaf 2010 preciezere formuleringen in de minimalistische modellen van de Merge-theorie. Merge is niet zomaar een operatie die twee woorden verbindt tot een zinsdeel. Het is een minimale vorm van set-formatie, het recursieve basisprincipe van natuurlijke taal dat lineaire volgorde op logische gronden uitsluit. De tweede paper van Chomsky die daarom gelezen moet worden is m.i. van ongekende eenvoud en elegantie. Dit is Chomsky’s bijdrage “Minimalism: Where are we now, and where can we hope to go” in Gengo Kenkyu 160 (2021). Om een redelijk beeld te krijgen van Chomsky’s revolutie in de taalkunde is meer niet nodig.
Het Marcolli-artikel dat Marc van Oostendorp adverteert formaliseert aspecten van de Merge-theorie die in Chomsky’s Reading Lectures (2017) en UCLA Lectures (2019) zijn ontwikkeld, en verwijst terloops naar nieuwe ontwikkelingen zoals aangestipt in zijn recente Keio-EMU Lectures (2023). In het artikel wordt in een kernparagraaf (§2.4.1) aangetoond hoe een Merge-theorie krachtige voorspellingen doet over wat wel en wat geen mogelijke regeltoepassingen kunnen zijn. Een goed begrip hiervan is wezenlijk om de unieke bijdrage van het generatieve paradigma aan onze inzichten in menselijke taal op waarde te kunnen schatten.
Merge is een recursieve regel die twee constituenten P, Q selecteert en deze combineert in een nieuwe constituent, de verzameling {P,Q} van P en Q. Merge werkt op termen (d.w.z. elementen, elementen van elementen, etc.) van een “workspace” WS en voegt daar een nieuw element aan toe. Omdat menselijke taal een biologisch systeem is met begrensde “hulpbronnen” is een algemene beperking van toepassing. De nieuwe WS wordt steeds met precies één nieuw element uitgebreid om de derivatie eventueel voort te zetten. Een minimale maar wezenlijke voorwaarde om tot een echte verklaring te komen. Een onmiddellijk gevolg: de termen P, Q waarop Merge wordt toegepast zijn ofwel (i) beide elementen van WS die mogelijk zelf zijn opgebouwd door eerdere toepassingen (bv. P = {de, man} en Q = {las, enkele boeken}), ofwel (ii) de een, zeg P, is een term van de ander, i.e., Q , een element van WS (bv. P = {welke boeken} en Q = {de man, {las welke boeken}}). Dit theorema sluit uit dat Merge kan worden toegepast op twee termen van verschillende WS-elementen. In deze vereenvoudigde voorbeelden genereert (externe) Merge de expressie {{de man}, {las enkele boeken}}, en (interne) Merge de expressie {{welke boeken, {las de man welke boeken}}.
In het laatste geval zijn de twee vraagwoorden elkaars kopieën en dragen ze elk bij aan de interpretatie: het vraagwoord, een element in een operator-variabele constructie, bindt de kopie in object positie die daar de thematische rol krijgt van het werkwoord. In de omzetting naar spraak (als daarvoor gekozen wordt) verdwijnen alle kopieën uit de structuur op één na (namelijk de hoogste): Welke boeken las de man? Het gevolg van een algemeen zuinigheidsbeginsel in externalisatie. Wij horen daarom zinsdelen in posities die niet altijd de posities zijn waar ze ook een betekenis krijgen. Maar dit is een perifeer kenmerk van externalisatie, opgelegd door eigenschappen van het sensomotorisch systeem, niet van het interne taalsysteem dat beide kopieën nodig heeft.
Hiermee krijgen we een verklarend inzicht in de aard van het verschil tussen (1) en (2), analoog aan het rotsblok dat omlaag valt of de stoom die van een kopje koffie opstijgt.
De vraag die zich zou moeten opdringen is waarom (1) verschilt van (2), en waarom er geen taal bestaat waar omgekeerd (2) wordt uitgesloten en (1) welgevormd is. Beide zinnen hebben dezelfde woorden, dezelfde zinsdelen, dezelfde betekenis. De asymmetrie zou daarom onze verwondering moeten opwekken. Het generatieve programma is het eerste en enige model dat zich dit soort vragen stelde. Verklaring kwam pas na de verwondering.
In het geval van (1) kiest Merge op een zeker moment in de syntactische afleiding altijd N1 (zelf een element van de WS of een term van een element van WS) en PP2 (altijd zelf een term van een element van WS).1 Het verloop van de derivatie bepaalt hier de verschillende opties. Maar steeds is zo dat N1 en PP2 niet beide WS-elementen zijn en dat noch N1 noch PP2 een term is van de ander zodat een Merge-toepassing onontkoombaar zal leiden tot een schending van de uitbreidingsbeperking op WS. De eerste expressie (1) wordt daarom uitgesloten als het resultaat van een niet-legitieme regeltoepassing van Merge (namelijk Sideward Merge).
Er zijn een oneindig aantal empirisch onbestaanbare structuren die niet a priori onmogelijk zijn maar door de meest eenvoudige “zinsdeelregel,” d.w.z. Merge, op deze manier principieel worden uitgesloten. Je hebt pas een verklarende theorie over mogelijke en leerbare talen als die tegelijk onmogelijke en onleerbare talen kan uitsluiten. Dat is het groeiende succes van Chomsky’s opeenvolgende herformuleringen van zijn LSLT. Het kerninzicht van wat wel de Galileïsche revolutie in de cognitieve wetenschappen genoemd wordt.
Maar (2) is een heel andere constructie. De structureel gelijke PPs zijn geen kopieën van elkaar maar zijn elk als een onafhankelijk element in WS geselecteerd door verschillende toepassingen van externe Merge. Dat is ook precies waarom ook een andere lexicale invulling legitiem is: De vraag naar Bretonse oesters overstijgt het aanbod van Zeeuwse mosselen. In het geval van “herhaling” zoals in (2) is er daarom sprake van ellipsis, klemtoonreductie en deletie, onder condities die te maken hebben met het gebruik van taal in discourse context. Deze regels staan los van interne taal en schenden alle universele condities op syntactische afleidingen. Een markant voorbeeld (één van ontelbaar vele) is de zin: Sebastiaan confronteert graag iemand die dol is óp —, met iemand die een hekel heeft áán —, Iers stepdansen. De “right-node-raising” afleiding van deze expressie is niet de uitkomst van een grammaticaregel maar van de afbeelding van structuur op lineaire volgorde wanneer de optie voor gesproken taal geactiveerd wordt. Zij valt strikt genomen buiten het domein van (interne) taal en volgt de eisen die de sensomotorische modulen opleggen aan het interne taalsysteem.
De waarheid is vaak te simpel om die rechtstreeks te kunnen zien in de complexiteit van de empirische gegevens. De schoonheid van eenvoud moet hard bevochten worden en met het generatieve programma krijgen we voor het eerst inzichtelijke verklaringen van eenvoudige dingen die we eerder als vanzelfsprekend beschouwden maar feitelijk problematisch bleken. Zinsdelen, ja zeker, maar nu pas weten we wat zinsdelen wel en niet kunnen zijn en hoe die bijdragen aan de constructie van legitieme syntactische structuur in menselijke taal, de drager van wat William Dwight Whitney “audible thought” noemde. En aan dat systeem ligt een eenvoudige combinatorische regel ten grondslag. All You Need is Merge, schreef Bob Berwick al in 2011.
1) N1 is hier hetzij zelf een element van WS, hetzij een term van een WS-element {N1, {V, {N2, PP2}}}. PP2 is altijd zelf een term van een element van WS, bv. een term van {N2, PP2}, {V, {N2, PP2}}, of {N1, {V, {N2, PP2}}}. X is een term van Y als (i) X een element is van Y, of (ii) X een element is van Z, Z een term van Y.
Pek van Andel zegt
De verwondering gaat vooraf aan de verklaring. Daar ben ik het natuurlijk geheel mee eens. Als je, zoals ik zelf ook, serendipiteit definieert als een verrassende waarneming gevolgd door een correcte herleiding, dan zorgt daarbij de verrassing voor de verwondering, en de herleiding voor de verklaring. Ik die heuristiek ooit eens uitvoerig beschreven in het British Journal for the Philosophy of Science: https://www.wur.nl/upload_mm/4/d/d/53dacf13-58aa-40e3-aafd-1cd5be36607f_Pek%20van%20Andel.pdf (een gratis versie van deze tekst).
Robert Kruzdlo zegt
To change is always seeming fickleness,
but not to change with the advance of science
is worse. It is persistence in error
(James Dwight Dana, 1813-1895)
En wat gaat er vooraf aan de verrassende waarneming? Welke prikkels? Waarom wordt iets een zinsstructuur voor je het weet.
Riny Huijbregts zegt
Prikkels en bewustzijn. Ja, dat is een belangrijke vraag waar weinig tot niets over bekend is. Het taalsysteem werkt onbewust en is ontoegankelijk voor introspectie. Wij zijn ons alleen bewust van fragmenten gegenereerde structuur die door perifere systemen (bv. spraak) worden uitgedrukt. Onze taalmodellen verklaren ‘kennis van taal’ maar niet het ‘gebruik van die kennis.’ Niemand weet hoe, of waarom, of wanneer het brein deze (en geen andere) zin op deze (en geen andere) manier produceert. Taal en bewustzijn. “Een harde wetenschappelijke queeste,” de (vertaalde) titel van een belangrijk artikel van MIT-neurowetenschappers Bizzi and Ajemian (Daedalus 2015) over ‘puppets’ en de ‘puppeteer.’ We weten al veel over de poppetjes maar praktisch niets over de poppenspeler. Een oude kwestie nog altijd relevant.
Riny Huijbregts zegt
Misschien. Serendipiteit heb ik altijd begrepen als “een geluk bij een ongeluk” of “een belangrijk inzicht in iets dat toevallig en gratuit verkregen is uit een onderzoek dat op iets anders gericht was.” Zoiets als interessante, belangrijke maar onverwachte, onbedoelde bijvangst. Maar het artikel zegt vooral iets over bewustwording van, en actieve verwondering over, empirische verschijnselen die vervolgens tot relevante onderzoeksvragen leiden. En met name de onderzoeksvraag zelf, (1) vs. (2), en het type verklaring voor deze verschijnselen, Merge-theorie.
Ad Welschen zegt
Zeer bedankt voor deze bijdrage, M.A.C.!
Anneke Neijt zegt
Goed dat je toelichting geeft, Riny. Want het blijft lastige kost, hoe luchtig insiders er ook over doen. Overigens, de structuur van (1) bevat geen identieke PP’s. Dat is verwarrend. Het gaat wel om identieke semantische rollen, dus op dat abstractere niveau zijn de zinsdelen identiek.
De grammaticaliteitsoordelen zijn lastig. Jouw zin (1) vind ik eigenlijk wel acceptabel. (1) lijkt beter te worden als je het voorzetsel weglaat: “Het aanbod van Zeeuwse mosselen overstijgt de vraag.”
In het Nederlands kun je de NP’s van wat traditioneel een bijvoeglijke nabepaling heet vaak weglaten (“iemand is de ex van”, “het aanbod van overstijgt de vraag naar”. “ik heb liever aardbeien zonder dan peren met ijs”, “ik heb liever aardbeien met ijs dan peren zonder”). Bij ellipsis is vaak voorwaartse en achterwaartse weglating mogelijk.
Riny Huijbregts zegt
Dank voor je commentaar. Ja, dit was onzorgvuldig. Ik had preciezer moeten zijn om dit te voorkomen. In plaats van naar PPs had ik naar de woordgroep “Zeeuwse mosselen” in deze PPs moeten verwijzen. Voor analyse en strekking van het betoog maakt dit allemaal niets uit. In (1) zijn niet de PPs maar de NPs binnen deze PPs gelijk. In (2) praten we dan niet over “structureel gelijke PPs” maar over “structureel gelijke NPs” die geen kopieën van elkaar zijn.
Voor de voorbeelden (1) en (2) uit het artikel gelden dan de volgende structuren.
(1) {{N1, {P1, NP2}}, {V, {N2, {P2, NP2}}}}
(2) {{N1, {P1, NP1}}, {V, {N2, {P2, NP2}}}}
Indexen zijn hier voor het gemak ingevoerd en hebben geen betekenis. Voor (1) selecteert de Merge operatie nu P1 (‘naar’), hier zelf een WS-element, of een term van een WS-element, en NP2, hier altijd zelf een term van een WS-element. Het resultaat is dan, zeg, PP1. Vervolgens werkt Merge op N1 en PP1 en het uiteindelijke resultaat is de structuur (1). De argumentatie blijft hetzelfde. Voor (2) selecteert Merge de termen P1 en NP1, allebei elementen uit WS. Geen wezenlijke verandering.
Je welgevormdheidsoordelen gaan m.i. over iets anders, en hebben geen gevolg voor het betoog. De voorbeelden (vgl. “patat-zonder” of “familie-van” of “verlangen-naar”) komen als onafhankelijke woordgroepen voor en eisen niet de aanwezigheid van een syntactisch “antecedent” in de zin. Vergelijk “ik heb zin in een patatje zónder,” “het verlangen náár alleen al maakt de mens dorstig,” “de groep exen ván ligt overhoop,” of “het verlangen náár is sterker dan de vrees vóór.” Een conversatie context volstaat. Een interessant gegeven, maar zonder relevantie voor de afleidingen in het artikel.
De Merge afleiding is algemener en heeft niet specifiek te maken met voorwaartse of achterwaartse weglating. Zie bv. de onwelgevormde zinnen ”Sebastiaan confronteert graag iemand die dol is op Iers stepdansen met iemand die een hekel aan — heeft” of “Een hekel hebben aan K2 beklimmingen blijkt gezonder dan uitkijken naar — te zijn.” Een nog simpeler voorbeeld is “De voortdurende aandacht voor Jan put — uit.” Voor welgevormdheid moeten de lege posities hier lexicaal gevuld worden, bv. door pronominale vormen (al dan niet met coreferentie). Dit zijn slechts een paar van een onbepaald aantal denkbare voorbeelden die allemaal op dezelfde manier worden uitgesloten door een eenvoudsconditie op Merge. Niet alleen in het Nederlands maar in alle talen. Geen beschrijving maar verklaring gevoed door verwondering.
Anneke Neijt zegt
Waarschijnlijk zijn mijn oordelen geheel onbetrouwbaar. Ongrammaticale zinnen kunnen, als je ze maar vaak genoeg onder ogen krijgt, grammaticaal gaan klinken. Ik kan, juist doordat ik veel onderzoek naar samentrekkingsverschijnselen heb gedaan, af en toe twijfelen aan een beslist ongrammaticale samentrekking zoals “*Bob denkt dat Noam gelijk heeft en Noam Bob.” Ik vroeg dus even aan mijn huisgenoot om een oordeel, en die vond meteen (2) beter dan (1). Je snapt, ik twijfel vervolgens weer aan diens oordelen. Maar de conclusie moet wel zijn dat zin (1) minder acceptabel is dan zin (2).
Interessant, en je bespreekt dat niet: er is een goed waarneembaar prosodisch verschil. In (2) moet je een duidelijke pauze laten horen bij de weglatingsplaats. Als je (1) op de meest natuurlijke manier wilt uitspreken dan is er geen sprake van zo’n pauze. Bovendien is (2) alleen acceptabel met een H*L op beide contrastieve woorden (“aanbod” t.o. “vraag” en “van” t.o. “naar”). Op dit moment wordt de prosodie nog niet in de syntactische discussies betrokken, voor zover ik weet, maar daar ligt wel een punt van nader onderzoek.
Laten we even de prosodie buiten beschouwing dan is het verschil tussen de zinnen (1) en (2) alleen maar de richting van de weglating. Ik dacht dat externalisatie (dus juist niet Merge) zorgt voor eventuele weglating, en dat de vraag of materiaal dat identiek is, beschouwd moet worden als kopie of als herhaling door de Markoviaanse eis (eerdere stadia in de derivatie hebben geen invloed op het vervolg van de derivatie) niet meer zichtbaar is op het moment van externalisatie. Ik zal je nadere uitleg nog wel goed gaan bestuderen, maar via deze denkstappen kom ik even niet verder.
Riny Huijbregts zegt
Ik denk dat we afdwalen naar zaken die hier niet thuishoren en beter elders besproken kunnen worden.
Punt is niet echt dat (1) minder acceptabel is dan (2) maar dat (1) niet gegenereerd kan worden, dus ongrammaticaal is, terwijl (2) wel gegenereerd kan worden en dus welgevormd is. De prosodie werd overigens wel impliciet betrokken (zie de accenten op “náár” en “ván”) maar is ook irrelevant. De verklaring voor het verschil tussen (1) en (2) is niet van prosodie afhankelijk. Prosodie, klemtoonreductie en ellipsis zijn natuurlijk wel interessant (vgl. “ZIJ sloeg HEM en HIJ (sloeg) HAAR” vs. “zij SLOEG hem en hij KUSTE haar”) maar spelen enkel een rol in externalisatie, het gebruik van interne taal. Zij staan zelf geheel buiten I-language.
Je zegt “Laten we even de prosodie buiten beschouwing dan is het verschil tussen de zinnen (1) en (2) alleen maar de richting van de weglating.” Nadrukkelijk nee. Het verschil zit hem in de verschillende derivaties. Het artikel zegt kort het volgende. De meest eenvoudige formulering van Merge laat twee en precies twee varianten toe, I(nternal) M(erge) en E(xternal) M(erge). Merge blokkeert de derivatie van (1). Die impliceert een toepassing van een illegitieme Sideward Merge. Multi-dominante afleidingen worden daarom principieel uitgesloten. Maar de meest eenvoudige Merge staat wel de derivatie van (2) toe (hier de EM variant). Ellipsis, zoals in (2), is mogelijk maar niet verplicht. Kopie-deletie is daarentegen wel verplicht en volgt uit een efficiëntie-beginsel.
Stel: Merge selecteert een object O van WS en een term X van O, en construeert een nieuw object O’ = {X, O} met een kopie van X in O. Dit is een geval van IM, een legitieme Merge operatie. Omdat beide termen X in een “c-command configuratie” staan zijn het per definitie kopieën. Omdat derivaties in fasen verlopen wordt op faseniveau besloten of externalisatie wordt geactiveerd of niet. Wanneer tot externalisatie wordt overgegaan wordt de kopie lager in de structuur altijd gedeleerd. Dit is geheel conform de Markoviaanse eigenschappen van derivaties. We hebben geen boodschap aan hoe de cc-configuratie tot stand is gekomen. De configuratie zelf is afleesbaar uit de structuur. Dat volstaat. Resultaat is dus dat de kopie van een term (vroeger “spoor van een verplaatsing”) ALTIJD gedeleerd wordt onder externalisatie maar behouden blijft in interne taal voor semantische interpretatie. De deletie zelf is geheel kosteloos want dit volgt uit een algemeen zuinigheidsprincipe dat van toepassing op spraak is, namelijk articuleer zo min mogelijk. Kopieën worden daarom maar eenmaal uitgesproken. Dit draagt bij aan de computationele efficiëntie van taal maar kan een bron zijn van communicatieve verwarring.
Dit is een belangrijk punt dat Chomsky vaak bespreekt in zijn werk: (interne) taal kan gebruikt worden voor communicatie maar is primair een systeem voor het formuleren van gedachten. In zijn visie is geëxternaliseerde taal (gesproken taal, gebarentaal) een epifenomeen. Het bevat lineaire orde en andere arrangementen, eigenschappen van een mengsel van interne taal en perifere sensomotorische systemen die compleet anders zijn met een onafhankelijke en oudere evolutionaire ontwikkeling. Er bestaat niet zoiets als een systeem van E-language dat de verzameling van welgevormde woordreeksen genereert. Deze opvattingen vind je al in het begin van de jaren tachtig, nu gepreciseerd in de geavanceerde Merge-literatuur. Chomsky (2021) is een aanrader.
Berthold van Maris zegt
Je zegt dat Merge een heel eenvoudig principe is, maar dat is het natuurlijk niet. Een Merge die twee elementen met elkaar verbindt is iets heel anders dan een Merge die een element verplaatst (of, zoals nu vaak gezegd wordt: die een element copieert en daarna het andere element schrapt). En bijvoorbeeld, het “mergen” van een zelfstandig naamwoord met een bijvoeglijk naamwoord heeft andere gevolgen dan het “mergen” van een VP. Als je vindt dat al die dingen hetzelfde zijn abstraheer je enorm, en ja, wie alles wegabstraheert houdt uiteindelijk iets heel simpels over.
Mijn opmerking over “zinsdelen, ja maar dat wisten we toch al” ging overigens niet zozeer over Chomsky maar over meer hoe die blog geschreven was.
Berthold van Maris zegt
Sorry, ik bedoelde: dan het “mergen”van een NP met een VP.
Riny Huijbregts zegt
Het spijt me dit te moeten zeggen maar dit is compleet onjuist. Merge verplaatst niet, kopieert niet, deleert niet, en is een puur symmetrische operatie. Er is geen verschil tussen “verbinding” (EM) en “verplaatsing” (IM). Deze varianten vallen samen. Dit is het kernpunt van Merge. Je moet natuurlijk wel de recente literatuur kennen waarover we hier praten. Zoals ik aangaf is dat Chomsky (2021). Commentaar en kritische opmerkingen zijn welkom maar moeten wel passen in de context van deze moderne theorievorming onder het motto “geen beschrijving maar verklaring.” Kort door de bocht, je commentaar is goed bedoeld maar gedateerd. Ik zal de moeite nemen dit hieronder preciezer te duiden.
Gegenereerde structuur blijft behouden. Dit is overigens het hele idee van derivaties of “proofs” in formele systemen en de basis voor recursiviteit, ook een begrip dat verkeerd begrepen wordt. De verschillende stappen in een “proof” of derivatie voegen informatie toe aan een WS waarop later teruggegrepen kan worden om het bewijs of de computatie verder te brengen. Een functie wordt (opnieuw) toegepast op een argument dat deel uitmaakt van een eerdere functietoepassing elders en eerder in de derivatie.
Het idee van “verplaatsing” is een illusie en was niet meer dan een manier van praten over ongebonden afhankelijkheden en discontinuïteiten in een tijd dat we hier nog geen helder inzicht in hadden. Verplaatsing bestaat niet, en kopieën worden niet gecreëerd maar afgelezen uit de structuur, namelijk een cc-configuratie. Tenslotte, deleties zijn uitgesloten in de syntactische derivatie. Volgt uit behoud van structuur, een algemeen beginsel dat verandering van bestaande structuur uitsluit. Kopieën (afleesbaar uit structuur) zijn noodzakelijk voor interpretatie op de semantische interface. Er zijn geen deeloperaties zoals kopiëren of deleren.
Zelfstandige en bijvoeglijke naamwoorden, werkwoorden, etc. zijn natuurlijk verschillende beesten. Merge genereert syntactische structuur. Maar voor welgevormdheid moet die structuur nog steeds voldoen aan onafhankelijke condities van andere systemen, bv. predikaat-argument structuur. De Merge toepassingen die leiden tot bv. *“Jan legt op tafel,” of *“Piet slaapt drie honden,” of *“de lacht,” of *“het de omhoog,” etc. worden in de semantische interface verworpen (“theta theorie”). Elke zin is anders maar is wel het (complexe) resultaat van verschillende interacties van dezelfde eenvoudige onderliggende operaties. Merge is er daar een van. Congruentie en labeling zijn andere operaties. Theta theorie is weer een andere module. Er is geen sprake van “wegabstraheren,” wel van abstraheren, generaliseren en integreren van eenvoudige deelsystemen die samen welgevormde syntactische structuren met betekenis genereren. Merge is een element in SMT, niet het enige element. Dat is evident. Deze denkbeeldige problemen van je zijn wat ze zijn, irreëel en irrationeel. Merge is een empirische theorie die in principe weerlegd kan, en zoals gebruikelijk ook deels weerlegd zal gaan worden, maar dan wel met degelijke analyses van relevant empirische materiaal. We zijn hier volop mee bezig.
Berthold van Maris zegt
Kan best zijn dat in de meest recente modellen verplaatsingen geen verplaatsingen meer genoemd worden. Verder is mijn niet helemaal duidelijk hoe Merge omgaat met uitgangen, voorvoegsels en klinkerveranderingen.
Riny Huijbregts zegt
Merge heeft niets hierover te zeggen. Maar een generatief model heeft meer operaties dan alleen Merge. Maar er wordt helemaal niets “weggeabstraheerd.” Eerlijk gezegd denk ik dat dit punt al eerder besproken is (in verband met “lach-” en “-t” en de onformuleerbaarheid van “hoofd-verplaatsing”). Je hoeft je geen zorgen te maken. Er verdwijnt he-le-maal niets. Nada. Morfosyntaxis, morfologie, fonologie blijven onaangetast en zijn even belangrijk als voorheen. En ook deze modules kennen naast taalspecifieke ook belangrijke universele condities. Bv. de vertrouwde fonologische cyclus (“strict cyclicity”) biedt een zeer interessante verklaring, afkomstig van Marc van Oostendorp, voor een descriptieve observatie van Geert Booij waarom prefixen niet, maar suffixen wél syllabificatie toestaan. Niet “on-teren” (met prefix “ont-”) maar wél “demen-teren” (met suffix “-eren”). Ook een geschikt voorbeeld van het motto van dit artikel.
De enige relevante en interessante vraag is waar deze modules een plaats vinden in de afbeelding van syntaxis naar betekenis en klankvorm. Er zijn verschillende mogelijkheden, afhankelijk van verdere conceptuele ontwikkelingen en empirische observaties. Eén mogelijkheid is in externalisatie. Een meer interessante optie, naar mijn mening, is op fase niveau vlak voordat de fase-structuur cyclisch wordt afgevoerd naar de betekenis en klank interfaces.
Berthold van Maris zegt
Ik vind het interessant dat je naar Chomsky, 2021 verwijst. En natuurlijk gaat deze blog over, opnieuw, een “baanbrekend” artikel van Chomsky e.a. van dit jaar. Het is al vijftig jaar zo dat er binnen deze tak van sport (generatieve grammatica) altijd naar belangrijke publicaties van Chomsky verwezen wordt. Terwijl er ongelofelijk veel navolgers waren en zijn, ook veel, erg veel hoogleraren die in de geest van Chomsky de zinsbouw zijn gaan analyseren. Maar naar publicaties van die hoogleraren wordt zelden verwezen. Het is altijd: Chomsky. Dat roept bij mij de vraag op: wat hebben al die hoogleraren de laatste vijftig jaar zitten doen?
Riny Huijbregts zegt
Deze hoogleraren zijn zonder twijfel goed bezig geweest. Niet iedereen rijdt op hetzelfde paard. Taal is meer dan syntaxis en heeft vele aspecten die verschillend en succesvol bestudeerd worden. Er wordt zelfs binnen de syntaxis erg goed en innovatief werk gedaan, in Nederland en daarbuiten, ook al heeft het generatieve model marktaandeel verloren. Maar dat is een andere zaak. Noams eerste belangstelling betrof de eenvoud van taalsystemen en de bijdrage van een empirisch relevant eenvoudsbeginsel aan verklarend vermogen. En zijn bijdragen hier zijn fundamenteel en uniek. Je kunt dit niet gebruiken om anderen te declasseren. Talenten en genieën die een compleet nieuw onderzoeksprogramma opzetten, uitvoeren en met herformulering bestaande inzichten periodiek verdiepen tot ongekend verklarende modellen zijn wereldwijd schaars. Chomsky is weer uitzonderlijk binnen deze groep. Buitencategorie. Dat mag je anderen niet aanrekenen. Laten we dankbaar zijn dat we dankzij hem inzichten hebben die we anders nooit hadden gehad.
Berthold van Maris zegt
Verder staat of valt dat Merge met het idee dat alle verbindingen in een zin binair zijn. Dat leidt tot heel gekunstelde zinsanalyses.
Anneke Neijt zegt
Gekunsteld – lange tijd heb ik dat ook gedacht, want bij nevenschikkingen kun je binariteit niet volhouden. Bij de andere constructies moet je gewoonlijk een binaire relatie veronderstellen. Denk aan de opbouw van woorden.
Overigens kan Merge wel meer dan twee elementen samennemen, maar dan gaat het niet om de simpelste vorm van Merge (en in de definitie van Merge zit op dit moment binariteit). Vermoedelijk komt het erop neer dat bij nevenschikkingen een ongelimiteerd aantal elementen van dezelfde soort worden samengenomen (een sequentie). Bij onderschikking gaat het om ongelijksoortige elementen. Het ene element krijgt dan een betekenis mee via dat andere element. Dan wordt het wel heel aannemelijk dat het om een binaire relatie moet gaan. Bij nevenschikkingen geven de elementen geen structurele betekenis aan elkaar.
Riny Huijbregts zegt
Dingen zijn toch even net iets anders dan je zegt. Er is geen n-ary Merge mogelijk. Dit wordt op empirische (descriptieve adequaatheid, overgenereren) en conceptuele gronden (ongelimiteerde toename van termen in WS) uitgesloten. Met name is er geen Merge die meer dan twee elementen kan samennemen (en niet omdat Merge “op dit moment” toevallig binair zou zijn). We hebben, lijkt het, drie belangrijke soorten coördinatie:
[1] ongebonden ongestructureerde coördinatie (“Jan, de slager, de dorpsoudste, Merel, … ”)
[2] ongebonden gestructureerde coördinatie (“zowel Jan of de slager als de dorpsoudste en Merel”)
[3] sequenties (“respectievelijk Jan, de slager, dorpsoudste, en Merel”)
Alleen type [3] lijkt problematisch want sequenties impliceren lineaire arrangementen en die kunnen niet door Merge worden gegenereerd. Nu blijkt dat dat maar goed is ook want woordjes als “respectievelijk” of “van rechts naar links,” etc. hebben discourse eigenschappen en bestaan onafhankelijk van coördinatie. Zie: “De vier kandidaten zijn gelijkwaardig. Hun respectievelijke antwoorden kwamen redelijk overeen.” Dit was al tenminste sinds Jim McCawley (1988) bekend. Deze verschijnselen en hun analyse versterken daarom de Merge-theorie. Sequenties kunnen nu bv. gereduceerd worden tot type [1] coördinatie. De volgorde arrangementen (net als deiktische elementen en shifters) zijn dan toegevoegde elementen met discourse functies maar leggen geen eisen op aan het interne taalsysteem, het domein van Merge.
Ongebonden gestructureerde coördinatie [2] valt eenvoudig onder Merge. Dat hoeft geen verder betoog.
Tenslotte, ongebonden ongestructureerde coördinatie [1] kan niet het resultaat zijn van Merge maar is iets dat we cadeau krijgen. Merge is een operatie binnen de verzamelingentheorie, en verzamelingentheorie vooronderstelt Form Set (FS). FS is daarom een algemene operatie (onafhankelijk van taal) waarover we vrijelijk kunnen beschikken. Kortom, FS is geen n-ary Merge. De enige vraag die over blijft is hoe deze ongestructureerde verzamelingen door Merge in de syntactische derivatie geïntegreerd kunnen worden.
Riny Huijbregts zegt
Binair is optimaal. Als het werkt (een empirisch gegeven) is het optimaal verklarend. De “gekunstelde zinsanalyses” blijven imaginair. Als je Marcolli et al. (2023, §4) zou bekijken zie je dat n-ary Merge, bv. ternaire Merge, voor ernstige conceptuele en empirische problemen zorgt. Zij baseren hun conclusies op eerder werk van mij en refereren hier ook naar. Overigens, een n-ary Merge theorie moet ook een (n-1)-ary Merge toepassing fiatteren voor syntactische welgevormdheid. Anders krijg je nooit ’t regent. Maar dit betekent dat binair optimaal is. De studies van de CIT wiskundige en theoretisch natuurkundige Mathilde Marcolli en anderen zouden je gedachten kunnen bijsturen maar het zou onredelijk zijn om kennis van deze artikelen te vooronderstellen.
Berthold van Maris zegt
Een paar jaar geleden vroeg ik het volgende aan iemand die een autoriteit is op het gebied van Merge:
Hoe ontstaat de combinatie Eva plus lacht in “Eva lacht”?
Is het een Merge van Eva en lach(en), waarbij die -t een gevolg is van die Merge?
Of “Merge” je eerst lach met -t, en daarna Eva met lacht?
Of is het allebei waar?
Het antwoord van de deskundige: dat is nog een punt van discussie.
Toen dacht ik: deze theorie staat echt nog in de kinderschoenen zeg.
Riny Huijbregts zegt
Je anekdote over een autoriteit in verwarring is aandoenlijk maar irrelevant. Morfologie is taalspecifiek en heeft strikt genomen geen invloed op syntactische afleiding. Er is wel een functionele categorie INFL. Merge kan dus wel zoiets genereren als {INFL, {lees-, boeken}}. MAAR de verbinding “lees-” met “-t” (van INFL) kan niet tot stand komen via Merge. Met andere woorden, “hoofd-verplaatsing” is een niet-legitieme Merge operatie, en wordt uitgesloten door de condities precies uitgelegd in mijn oorspronkelijke stuk. Noch INFL noch “lees-” is een term van de ander en geen van beide zijn syntactische objecten die elementen (“members”) van de WS (een verzameling) zijn. Hoe het wel moet? Een proces is de morpho-syntaxis dat plaats vindt in externalisatie.
Die kinderschoenen uit de anecdote passen de theorie al lang niet meer.
Riny Huijbregts zegt
Sorry, moet zijn: Één optie is een morfosyntactisch proces dat plaats in externalisatie.
Berthold van Maris zegt
Opnieuw een voorbeeld van hoe iets (uitgangen en dergelijke ) uit de theorie wordt weggeabstraheert.
Riny Huijbregts zegt
Re: “Eén optie is een morfosyntactisch proces dat plaats [vindt] in externalisatie”
Wegabstraheren en tikfouten op één lijn zetten. A stroke of genius? Zie boven voor nieuw inhoudelijk commentaar op je vraag naar de aard en positie van morfologie en fonologie in SMT-modellen waar Merge een fundamentele operatie is.
Berthold van Maris zegt
Nog iets geks: Merge wordt altijd voorgesteld als een vorm van recursie.
Recursie is de mogelijkheid om de output van een bepaalde operatie weer te gebruiken als input voor diezelfde operatie, en dat eventueel meerdere keren achter elkaar of zelf eindeloos.
Bijvoorbeeld:
1 + 1 = 2
2 + 1 = 3
3 + 1 = 4
etc
En bijvoorbeeld ook
de vriend + van de buurvrouw = de vriend van de buurvrouw
de fiets + van de vriend van de buurvrouw = de fiets van de vriend van de buurvrouw
het sleuteltje + de fiets van de vriend van de buurvrouw = etc.
etc.
Volgens Chomsky is wat hieronder gebeurd ook een vorm van recursie
man + groot = grote man
grote man + de = de grote man
de grote man + lachen = de grote man lacht
de grote man lacht + hard = de grote man lacht hard etc.
Maar hoezo zou je dit als recursie kunnen zien? De aard van de elementen die de input vormen verschillen telkens (een lidwoord is iets heel anders dan een werkwoord) en, vooral ook, de effecten die de operatie teweeg brengt verschillen iedere keer, de ene keer komt er een uitgang e bij, de andere keer een uitgang t, en ook de effecten op woordvolgorde en waar je een accent zegt zijn telkens anders.
Waarom wordt dit dan toch recursie genoemd?
Anneke Neijt zegt
Als je uitgaat van een lexicon met woorden, idiomen enz., dan gaat het steeds om woord+woord=woord. Hoe het lexicon er precies uitziet, is nog onbekend. Vermoedelijk een verzameling primitieve en complexe vorm-betekeniseenheden.
Berthold van Maris zegt
Beste Anneke, is dat niet opnieuw een voorbeeld van zo sterk abstraheren dat je eigenlijk niks overhoudt?
Anneke Neijt zegt
Ik denk dat het lexicon zowel primitieve als complexe vorm-betekeniseenheden bevat en dat het voor Merge niet uitmaakt of je een primitief element pakt of een complex element.
Riny Huijbregts zegt
De “successor-functie,” n = S(n-1), is recursief. Dat is IM ook. Feitelijk is IM een manier om deze successor-functie te genereren (levert interessante inzichten op die we hier achterwege laten). Recursie is meer algemeen. Zie boven. Het iteratief en direct toepassen van een regel op een deel van zijn eigen output is enkel een speciaal geval. Recursie heeft met WS te maken en het teruggrijpen naar (elementen) uit eerdere stappen. De regel opereert blind, heeft geen voorkennis of achterafkennis van de derivationele geschiedenis. De Markoviaanse conditie blokkeert deze kennis. Verkeerde toepassingen leveren structuren op die later door de mand vallen (“worden uitgefilterd”) op het niveau van de (semantische, fonologische) interfaces.
De (indirect) recursieve regeltoepassing met (i) NP → D-N, (ii) NP → D-N PP, en (ii) PP → P NP is weer een specifiek voorbeeld, dit keer uit PSG. Dit is natuurlijk geen weerlegging van recursieve Merge. Merge beeldt WS af op WS. Zo wordt Merge(P, Q) toegepast op termen van WS, voegt zij {P, Q} toe aan een nieuwe WS’, en wordt zij vervolgens eventueel weer toegepast als Merge(P’,Q’) op termen van deze nieuwe WS’. Er is geen noodzaak dat P’ of Q’ hier de zojuist gebouwde set {P, Q} is of een term hiervan. Maar voor convergentie zal {P, Q} ergens in de derivatie een term van WS zijn die Merge selecteert. Directe en indirecte recursiviteit van je voorbeelden zijn specifieke instantiaties. Prima. Ze betekenen niet dat Merge niet recursief zou zijn. Volgens jou zou de successor functie “n = S(n-1)” niet recursief zijn omdat “n” telkens een andere waarde heeft bij elke nieuwe toepassing.
Re: “de grote man lacht hard etc.”
Haha. Geef me de precieze referentie… Dit kun je niet menen. Wanneer we uitgaan van de lexicale formatieven in een workspace WS = {man, groot, de, lachen, hard} krijgen we misschien zoiets als {hard, {lachen, {de, {groot, man}}}} naast vele andere mogelijkheden. Maar deze structuur haalt het daglicht niet, bv. omdat het uitblijven van congruentie tussen “man” en “lachen” het labelen van de exocentrische structuur onmogelijk maakt. De derivatie crasht. Dit volgt al uit oudere versies (bv. Chomsky 2013/2015).
Re: Waarom wordt dit dan toch recursie genoemd?
Nog eens, recursie heeft met derivaties (“proofs”in formele systemen en WS in computationele derivaties) te maken. Een functie zoekt een argument in een eerdere stap van de derivatie die als resultaat in WS blijft opgeslagen met het doel de derivatie verder te brengen. De “tekstboek” voorbeelden die je geeft (zoals “het sleuteltje van de fiets van ….. de broer van Henk”) zijn niet echt verkeerd maar slechts een heel speciaal geval van recursie. Zie de discussie boven. Je “bezwaren” zijn denkbeeldig.
Populaire discussies over Merge en recursie geven vaak een heel verkeerd beeld van de technische begrippen met hun theoretische inhoud en empirische consequenties. Dat maakt discussies vaak moeilijk, met name omdat het hier “taal” betreft en iedereen natuurlijk “weet” wat taal is. Maar met taal bedoelen we hier I-language, een theoretische constructie met empirische inhoud, niet gesproken taal of gebarentaal, en de “kennis van taal” betreft onbewuste kennis van dit biolinguïstisch systeem dat door Merge theorie abstract en voor recursieve computatie in kaart wordt gebracht.
Berthold van Maris zegt
Maar goed, ik ga de recente Chomsky-literatuur deze zomer ook maar eens lezen. Ik vind Merge vooral curieus. Ik zie meer in Construction Grammar, als een manier om talen goed te beschrijven. ( ( Een ( fijn-e ( dag ) ) ) nog )
Riny Huijbregts zegt
Goed plan, lijkt me.
Maar je keuze van Construction Grammar (CG) is werkelijk de allerslechtste keuze die je je kunt voorstellen. Je hebt misschien gelijk als je zegt dat CG talen beter beschrijft. Maar daar gaat het niet om en dat is precies de reden waarom CG zichzelf diskwalificeert als een biologisch realistisch taalmodel. Het ontbreekt CG aan de bereidheid tot verwondering en verklaring. CG geeft geen inzicht in wat wél en geen constructies kunnen zijn. Het is niet alleen een slechte theorie, “it’s not even wrong” (naar een fameuze uitspraak van de kwantumfysicus Wolfgang Pauli). Een doodzonde in wetenschap. CG geeft enkel een lijst van wat als constructies gezien wordt, maar heeft geen eigen idee van wat constructies zijn, hoe die gegenereerd worden of worden samengevoegd tot syntactische gehelen. CG verklaart niet maar stipuleert en beschrijft. Geen wetenschappelijk taalmodel dus. Je vraagt je af hoe zoiets als CG überhaupt bedacht kan zijn….
Het is nog veel erger. CG kan zèlf niet zonder generatief model. Neem de eerste de beste constructie, bv. “hoe ouder X hoe gekker Y,” een van de klassieke voorbeelden. Elk van de variabelen X en Y kan worden ingevuld met een zinsstructuur van onbepaalde complexiteit. Dat betekent dus een complete generatieve grammatica voor X en nog eentje voor Y, en deze twee grammatica’s zijn bovendien identiek. Kan het erger? Jammer voor Ray Jackendoff , Adele Goldberg, en anderen maar dit is een dingetje….
Berthold van Maris zegt
Vergeet William Croft niet. En Arie Verhagen, in eigen land. Croft geeft in zijn boek Radical Construction Grammar een soort van antwoord op de kritiek die er vanuit “de generatieven” tradioneel is op Construction Grammar. Ik neem aan dat je dat boek kent?
Riny Huijbregts zegt
Ja, mij bekend, en Ik ken er nog meer. Ook jammer voor hen.
Berthold van Maris zegt
Constructies kunnen in constructies worden ingebed. Wat is daar zo ingewikkeld aan?
Riny Huijbregts zegt
“Wat is daar zo ingewikkeld aan?”
Probeer dit eens echt serieus uit. Je moet alle constructies (wat betekent “alle” hier?) in een (natuurlijk eindige) lijst opsommen en één voor één stipulatief karakteriseren. Hoe doe je dat precies? Deze constructies zijn “oppervlakkig” en “usage-based” (passief, raising, en unaccusative zijn allemaal verschillende constructies). Wat is geen constructie? Een deelgrammatica is nodig voor elke constructie. Constructies moeten variabelen bevatten die ingevuld kunnen worden door, in dit geval, weer andere constructies die zelf weer variabelen kunnen bevatten zodat unificatie mogelijk wordt. Maar let op wat je dan doet. Je ben dan bezig met een recursieve computationele functie, die niet anders is dan een notationele variant van een generatieve grammatica (bv. Yoshi’s TAG), en eentje die inferieur is aan Merge-based grammatica’s. Maar dat is nu juist wat je niet wil. Schieten in eigen voet.
Dit is precies het punt van “hoe ouder … hoe gekker …” Je hebt minstens één generatieve grammatica nodig om te bereiken wat je wil. Het punt dat ik maak. Kortom, Pauli’s “quip” is hier toepasselijk lijkt me. Voor mij geen CG.
Riny Huijbregts zegt
Sorry, voor typo’s hierboven : “je bent” voor “je ben” en “Joshi” voor “Yoshi.”