Wat kan een computer het vermogen om te doen leren?

Er is belangrijk nieuws in een van de heftigste taalkundige discussies van de afgelopen vijftig jaar. We doen even een experiment met het taalmachientje onder je hersenpan. Wat betekent de volgende zin?

Wat geloof jij dat de actrice gisteren gekocht heeft?

De vraag is nu: wat is het lijdend voorwerp van gekocht? Dat is als je Nederlands spreekt hopelijk geen ingewikkelde vraag: dat is wat. Het staat weliswaar ver naar voren, maar vraagwoorden plaatsen we nu eenmaal naar voren in de zin. Maar neem nu de volgende zin:

Wat deel jij de overtuiging dat de actrice gisteren gekocht heeft?

De zin zou min of meer hetzelfde moeten betekenen als de vorige – de zinnen ‘ik geloof dat de actrice dit gekocht heeft’ en ‘ik deel de overtuiging dat de actrice dit gekocht heeft’ zijn parallel aan elkaar, en er wordt op parallelle manier een vraag van gemaakt– maar dat doet hij niet. Hij betekent niks.

De reden daarvoor, ontdekten taalkundigen meer dan vijftig jaar geleden is dat ‘jouw overtuiging dat…’ een zelfstandignaamwoordgroep is, en ‘geloof jij dat..’ een werkwoordgroep. Om de een of andere reden kan er geen relatie bestaan tussen een werkwoord en zijn lijdend voorwerp als dat werkwoord ingebed is in een zelfstandignaamwoordgroep en het lijdend voorwerp niet.

Ja, de vorige alinea is heel ingewikkeld.

Bouwplan

Maar dat is nu juist het punt: je taalintuïtie trekt zich weinig aan van die ingewikkeldheid. Je voelt dat de tweede zin niet kan en de eerste wel. De ingewikkelde alinea beschrijft waar dat gevoel vandaan komt, ook al ben je je daar niet van bewust. Je hebt dus op een bepaalde manier wel degelijk die ingewikkelde kennis.

Maar dan komt de volgende vraag: waar komt die kennis vandaan? Die vraag is de inzet geweest van die discussie van de afgelopen halve eeuw: die over het aangeboren taalvermogen. In hoeverre begint de baby de ingewikkelde taak van het verwerven van haar moedertaal volkomen blanco en in hoeverre zijn er in haar hersenen al ideeën ingebakken over hoe de grammatica van taal eruit zou moeten zien: in hoeverre verwacht een kind bijvoorbeeld al werkwoorden en zelfstandig naamwoorden te moeten onderscheiden?

Voor de aanhangers van dat aangeboren taalvermogen zijn de zinnen hierboven lang een gewichtig bewijsstuk geweest. Je leert nooit expliciet iets over het ingewikkelde verschil tussen die zinnen. Je ouders zeggen er niets over en op school wordt er ook niets over meegedeeld. Bovendien komen allebei de soorten zinnen niet erg veel voor, en zeker worden ze niet vaak tegen kinderen gezegd. Hoe komen die kinderen er dan achter dat de ene zin wel kan en de andere niet? Het antwoord van de aanhangers van aangeborenheid is: dat kan alleen maar zijn omdat we in ons hoofd bij geboorte een bouwplan hebben van hoe taal er in grote lijnen uitziet, en waar op de een of andere manier al de relatie in is opgenomen tussen vraagwoorden vooraan en het werkwoord verderop waarvan ze het lijdend voorwerp zijn.

Onbewust

Dat gold heel lang als een ijzersterk argument, maar een nieuw manuscript dat nu overal de rondte doet, slaat er wat gaten in: als je de heel krachtige software gebruikt die zichzelf taal kan leren (zoals GPT-3), dan kan die software ook dit soort verschillen oppikken. De computer wordt alleen gevoerd met grote hoeveelheden taal, bakken vol teksten, kasten vol, en past daar alleen maar statistiek op toe, zonder enige van te voren opgelegde kennis over vraagwoorden of naamwoorden of wat dan ook. En toch vindt die computer uiteindelijk de tweede zin hierboven vreemder dan de eerste.

De onderzoekers zijn zelf enigszins bescheiden over hun bevinding. Ze wijzen er bijvoorbeeld op dat de hoeveelheid taal die GPT-3 nodig heeft om een taal te leren naar schatting evenveel is als een tachtigjarige mens gehoord heeft. Wij mensen leren dus wel wat sneller: we hebben minder gegevens nodig om het subtiele verschil op te pikken. We weten bovendien dat die modellen energie slurpen, en we doen het dus ook een stuk efficiënter. Aan de andere kant kun je zeggen: misschien kunnen er nog verfijndere modellen komen die het nog sneller en efficiënter leren. Dat je principieel niet het verschil tussen deze zinnen zou kunnen leren is in ieder geval weerlegd. Een blanco blad kan wel degelijk met dit soort subtiliteiten gevuld raken.

Als het systeem het kan leren, is natuurlijk wel de vraag: hoe komt dat verschil dan in het taalmateriaal dat de computer gebruikt om dit te leren? Met andere woorden: waarom is dat verschil er uberhaupt? De computer zou vast ook een taal kunnen leren waarin dat verschil niet wordt gemaakt; de hypothese is dat kinderen dat niet zouden kunnen. Waarom lijken alle talen een soortgelijk verschil dan toch te vertonen tussen zelfstandignaamwoordgroepen en werkwoordgroepen? Die patronen moeten er door mensen onbewust in gelegd zijn. Zou dat niet toch iets te maken kunnen hebben met hoe onze geest precies werkt?

Gerelateerd

Reacties

Archie van Riemsdijk zegt

6 december 2021 om 07:37

Het lijkt mij dat de reden dat de ene zin wel en de andere zin niet kan, is dat de grammatica te diffuus wordt, waardoor er een bepaalde grens wordt overschreden van moeite die het kost om een eenduidige betekenis (if any) uit de zin te destilleren. Voorbij die grens is de zin onzinnig. Geen a priori taalregel dus, maar ‘does not compute’.

Beantwoorden
- Marc van Oostendorp zegt
  
  6 december 2021 om 09:26
  
  Maar (1) ‘does not compute’ is in die zin ook een taalregel (een zin moet wel berekenbaar zijn, je moet kunnen ‘uitrekenen’ wat bedoeld wordt); (2) voor deze ‘computation’ lijkt het nodig om een verschil te maken tussen zelfstandig naamwoorden en werkwoorden, en dat maakt het nog meer een taalregel.
  
  Het is geen taalregel in de zin dat hij in enig schoolboek staat, of enige stijlgids. Maar dat is nu juist het punt: hij staat niet in die boeken en gidsen omdat mensen dit al vanzelf goed doen. Het is dus een impliciete regel, maar waar komt die dan vandaan?
  
  Het type onderzoek dat hier beschreven wordt kun je ook interpreteren als: taal is een product van het rekenapparaat dat we menselijke hersenen noemen. Maar wat is dat voor rekenapparaat? Door verschil te maken tussen zinnen die we wél en die we niet kunnen verwerken, kunnen we daar achter komen.
  
  Beantwoorden
Robert Kruzdlo zegt

6 december 2021 om 11:15

Ik denk dat je niet achter de werking van de hersenen kunt komen door verschil te maken tussen zinnen die wél en niet door de hersenen kunnen verwerkt worden. Het taalapparaat is een levend iets, biologischneuraal met 80 miljoen neuronale onderlingen kontakten. Wie maakt die zinnen¿ Precies de hersenen zelf. Waar kom je dan achter¿Dat het mensenwerk is en blijft en geen rekenapparaat. Wat je wilt weten stop je zelf erin.

Beantwoorden
Weia Reinboud zegt

7 december 2021 om 09:43

‘Een overtuiging delen/hebben’ kan toch maar over een beperkt aantal dingen gaan? De zin ‘ik deel de overtuiging dat de actrice dit gekocht heeft’ vind ik leeg, daar een vraag van maken leidt dan ook tot een lege zin.

Beantwoorden
C.W.+Schoneveld zegt

7 december 2021 om 15:24

Wat? deel jij de overtuiging dat de actrice gisteren gekocht heeft, in plaats van verkocht, zoals ik dacht. Dat kan natuurlijk wel Geheel nieuw voor mij is “de rondte deed”. Dat zit niet in mijn hoofd en ook niet in mijn woordenboek.

Beantwoorden