De wiskundige structuur van de zin ontrafeld

94 jaar oud is Noam Chomsky nu, en vorige maand verscheen een klein nieuw hoogtepunt in zijn oeuvre, een artikel dat weer een aantal dingen op zijn kop zet, en misschien een nieuwe richting wijst in de studie van de zinsbouw. Ja, Chomsky is van dit artikel ‘maar’ de tweede auteur, en het is heel waarschijnlijk dat het artikel voor een groot deel uit de koker komt van de eerste, de bekende wiskundige en theoretisch natuurkundige Matilde Marcolli.

In het artikel wordt namelijk geprobeerd om Chomsky’s inzichten in de manier waarop zinnen in menselijke taal worden gevormd, te vangen in een precies wiskundig formalisme – Chomsky heeft de nieuwste versies van die ideeën de laatste decennia altijd gepresenteerd op een betrekkelijk informele manier, maar in het nieuwe artikel wordt getoond dat je als je even doorzet die ideeën kunt omzetten in een wiskundige vorm die heel precies afdekt hoe de kern van de zinsbouw in elkaar zit en die tegelijkertijd een parallel heeft in de natuurkunde: ’this formulation turns out to be in fact the same very basic mathematical structure that arises naturally in the description of fundamental interaction in physics’ schrijven de auteurs in hun inleiding.

Met een beetje wiskunde in je eindexamenpakket en wat doorzettingsvermogen valt de argumentatie in het artikel gemakkelijk te volgen. De kern van Chomsky’s idee is dat de structuur van zinnen niet wordt gedefinieerd in het feit dat het ene woord voor of achter het andere staat, maar doordat woorden groepjes vormen. Een bekend voorbeeld is de manier waarop stellende zinnen en vraagzinnen aan elkaar gerelateerd zijn:

In het Nederlands bestaat die relatie eruit dat het verbogen werkwoord in de vraagzin voorop staat (‘Kom je morgen’, ‘Weet Koos dat ook?’) en in de stellende zin ergens na het eerste zinsdeel (‘Je komt morgen’, ‘Koos weet dat ook’). Maar hoe zit dat met ingebedde zinnen zoals de volgende:

Kunnen adelaars die zwemmen vliegen?

Logisch gezien zou dit de vraagzinversie kunnen zijn van twee stellende zinnen:

Adelaars die kunnen zwemmen, vliegen
Adelaars die zwemmen, kunnen vliegen

Logisch gezien kan het allebei, maar iedere spreker van het Nederlands weet – misschien na een beetje nadenken vanwege de eigenaardige inhoud van de zinnen – dat de genoemde vraagzin een vraagversie is van de tweede stellende zin, en niet de eerste. Dat komt omdat het niet het eerste voorkomen van kunnen is dat je naar voren plaatst, maar het kunnen dat dus na het eerste zinsdeel staat. Zinsbouw gaat over zinsdelen, en niet over links en rechts en de eerste, de tweede en de derde.

Dat is een uiterst eenvoudig idee, maar Chomsky en de geleerden die hem in deze gedachtegang volgen hebben laten zien dat je op deze manier een groot aantal eigenaardigheden van menselijke taal kunt afleiden. En Marcolli heeft nu laten zien dat je Chomsky’s idee heel elegant in een wiskundige formule kunt stoppen – een formule die dus heel veel aspecten van zinsbouw in menselijke taal (iedere menselijke taal) moet uitdrukken. We kunnen vanaf nu van een willekeurige zin in een willekeurige taal uitrekenen of hij aan de formule van Chomsky voldoet.

De kwestie is op dit moment weer in het brandpunt van de belangstelling gekomen door ChatGPT en andere vormen van zogeheten ‘generatieve kunstmatige intelligentie’. Het feit dat die chatbots moeiteloos de ene grammaticale zin na de andere kunnen zetten, zien sommigen als een doodsteek van Chomsky’s levenswerk. Een belangrijk argument voor de aanname dat alle talen gebruik maakten van een soortgelijke wiskundige manier om zinnen in elkaar te zetten, was immers dat alle kinderen zo moeiteloos hun moedertaal te leren. Het idee was: dat kwam doordat zij die wiskunde niet hoeven te ontdekken, het is ze aangeboren.

Maar nu is er dus een apparaat dat niks aangeboren is en geen weet heeft van deze structuur – en die kan het ook!

Nu lijkt me dat tegenargument problematisch. Het punt is dat die chatbots nu eenmaal alles kunnen leren. Als je ze wijsmaakt dat Kunnen adelaars die zwemmen vliegen? de vragende vorm is van Adelaars die kunnen zwemmen vliegen, geloven ze het ook en passen ze die regel voortaan moeiteloos toe. Chomsky’s bewering is dat kinderen een taal waarin dat soort operaties plaatsvinden juist nooit zouden kunnen leren. Wat dat betreft is het logisch dat kunstmatige intelligentie kan leren om (in ieder geval in grote lijnen) menselijke taal na te doen, maar het plaatst Chomsky’s oorspronkelijke vraag alleen in een ander daglicht: we verbazen ons niet langer over het feit dat de mens zoveel beter is in taal dan de computer, maar dat ze zoveel dingen juist niet kan. En de oplossing is dezelfde: omdat de mens werkt met de beperking tot een bepaalde methode.

De vraag is nu: waarom hebben alle menselijke talen soortgelijke beperkingen? Het antwoord op die vraag is dan: omdat de manier waarop mensen zinnen bouwen kennelijk aan heel specifieke wiskundige eisen voldoet. Die dan ook nog eens hetzelfde zijn als die je kunt vinden in bepaalde natuurkundige wetten.

Gerelateerd

Reacties

Berthold van Maris zegt

7 juni 2023 om 15:02

Chomsky heeft nu “ontdekt” dat zinnen uit zinsdelen bestaan? Maar dat wisten toch al? En ja, natuurlijk kun je dat wiskundig weergeven. Nee, dit is helaas geen breaking news zoals de openingszin suggereert.

Beantwoorden
- Marc van Oostendorp zegt
  
  7 juni 2023 om 20:45
  
  Reactie op de relativiteitstheorie: ‘Dat alles relatief is, dat wisten we toch al?’
  
  Chomsky heeft laten zien hoe de analyse van zinnen (in alle voldoende bestudeerde talen) genoeg heeft aan het begrip ‘zinsdeel’, en geen behoefte heeft aan pakweg, begrippen als ‘komt voor’, ‘komt na’, ‘onderwerp’, ‘werkwoordsgroep’ en ga zo maar door. Mits je dat begrip zinsdeel voldoende op een bepaalde manier definieert. Wanneer jij bekend met literatuur waarin dat eerder werd aangetoond (of zelfs maar beweerd), houd ik me van harte aanbevolen.
  
  Beantwoorden
  - Berthold van Maris zegt
    
    8 juni 2023 om 14:42
    
    In een interview dat ik had met Wouter Zwart, NRC 7 april 2012, vertelt hij ongeveer hetzelfde, volgens mij.
    
    Beantwoorden
Robert Kruzdlo zegt

7 juni 2023 om 19:27

Mooi artikel. De beperkingen van de taal bij mensen en de logische wiskundige onbewust gebruik is logisch. ‘Organisch taalgebruik.’ Het brein is sneller dan welk wiskundige dan ook. Daarom hebben we zoveel moeite het te begrijpen. En dan 94 jaar oud.

Beantwoorden
Berthold van Maris zegt

8 juni 2023 om 15:06

O sorry, ik bedoel Jan-Wouter Zwart

Beantwoorden
Berthold van Maris zegt

8 juni 2023 om 15:13

En nog een vraagje, want je legt het maar half uit, heb ik de indruk. Moet je eerst vaststellen hoe de zin qua zinsdelen in elkaar zit, dus een zinsanalyse maken (a la Chomsky) om vervolgens uit te kunnen rekenen of die zin aan formule van Chomsky voldoet?
In dat geval zou er sprake kunnen zijn van een cirkelredenering: je analyseert een zin volgens de theorie van Chomsky om vervolgens met de formule van Chomsky vast te stellen dat hij voldoet aan die theorie.

Beantwoorden
- Marc van Oostendorp zegt
  
  8 juni 2023 om 15:25
  
  De bewering lijkt mij: voor iedere zin in iedere taal is er een complete analyse die aan de formule voldoet. In die zin is het niet-circulair, want het is niet lastig om hypothetische talen te bedenken met zinnen die niet aan de formule voldoen (bijvoorbeeld een taal waarin ‘Kunnen adelaars die zwemmen vliegen’ de manier is om te bevragen ‘Adelaars die kunnen zwemmen, vliegen’). Zulke talen zouden niet moeten bestaan en niet op de normale manier leerbaar moeten zijn.
  
  Ik denk overigens niet dat ‘de syntaxis’ hiermee is opgelost, want die ‘complete analyse’ betreft feitelijk een bepaalde hoeveelheid verschijnselen. De woordvolgorde wordt bijvoorbeeld minstens voor een deel bepaald door andere eisen – en dat geldt voor nog allerlei andere eisen ook. Bovendien is nog niet bewezen dat de formule klopt – daarvoor zou je minstens voor een representatief aantal talen moeten controleren of ‘verboden’ zinnen daar niet voorkomen, en zo ver is het beschrijvend onderzoek nog lang niet.
  
  Beantwoorden
  - Berthold van Maris zegt
    
    8 juni 2023 om 15:31
    
    Okee, dank je voor de toelichting.
    
    Beantwoorden