• Door naar de hoofd inhoud
  • Skip to secondary menu
  • Spring naar de eerste sidebar
  • Spring naar de voettekst
Neerlandistiek. Online tijdschrift voor taal- en letterkunde

Neerlandistiek

Online tijdschrift voor taal- en letterkundig onderzoek

  • Over Neerlandistiek
  • Contact
  • Homepage
  • Categorie
    • Neerlandistiek voor de klas
    • Vertelcultuur
    • Naamkunde
  • E-books
  • Neerlandistische weblogs
  • Archief
    • 10 jaar taalcanon
    • 100 jaar Willem Frederik Hermans
  • Jong Neerlandistiek
  • Frisistyk
  • Mondiaal

De computer kent vreemde talen

1 maart 2022 door Marc van Oostendorp 7 Reacties

Hét taalkundige artikel dat de laatste tijd waarschijnlijk het meest besproken is door taalkundigen heet One model for the learning of language van Yuan Yang en Steven Piantadosi. Op de sociale media, in de koffiekamers, op Zoom, overal heb ik al over dit artikel gehoord. Tegelijkertijd heeft volgens mij geen niet-taalkundige over het artikel gehoord: er is geen nieuwsmedium, geen wetenschapswebsite en geen populair-wetenschappelijk tijdschrift dat erover geschreven heeft.

De bevinding van het artikel is dan ook nogal technisch: De auteurs maakten een computerprogramma dat een zeer groot aantal talen vrij moeiteloos kon leren. Je gaf het een aantal voorbeelden in de taal en vervolgens kon het ook over nieuwe voorbeelden die het niet eerder had gezien correct zeggen of ze wel of niet tot die taal behoorden.

Op het eerste gezicht zijn die talen tamelijk absurd. In één zo’n taal zijn de volgende zinnen bijvoorbeeld grammaticaal: a b c; aa bb cc; aaa bbb ccc; aaaa bbbb cccc. De volgende zinnen zijn niet grammaticaal: a bb c of aa b cccc. Ik neem aan dat u eigenlijk nu al weet dat aaaaa bbbbb ccccc ook een zin is van deze taal, maar aaa bbbbb cccc niet. Iedere zin in deze taal bestaat uit een aantal a’s, b’s en c’s, en wel precies hetzelfde aantal.

Blauwdruk

Er is geen menselijke taal die ook maar bij benadering die eigenschap heeft, maar het is een soort speelgoedversie voor iets dat talen wel hebben: lange afstandsrelaties. In ‘honden die luid blaffen, rennen door de tuin’ staan honden, blaffen en rennen allemaal in het meervoud; in De hond die luid blaft, rent door de tuin staan hond, blaft en rent allemaal in het enkelvoud. Je kunt die vormen niet mengen (honden die luid blaft, rennen door de tuin): als je op plaats 1 in de zin een bepaalde keuze maakt, moet je op plaats 2 en 3 dezelfde keuze maken. Precies als in de a b c-taal.

Yang en Piantadosi laten in hun artikel zien dat speelgoedtalen met een groot aantal bekende ingewikkelde eigenschappen van zinsbouw in echte talen echt geleerd konden worden, en wel door computers die weinig achtergrondkennis hebben. Dat is, zeggen Yang en Piantadosi, een belangrijk argument in een van de heftigste discussies in de taalwetenschap: de vraag of mensen geboren worden met een specifieke verzameling talenten om taal te leren, een soort aangeboren blauwdruk voor hoe taal eruit zal zien. Als een computer taal kan leren zonder zo’n blauwdruk, dan kunnen kinderen dat misschien ook.

Speelgoedtaaltjes

Nu kon je dat argument al maken op basis van de gigantische taalmodellen die Google bijvoorbeeld gebruikt voor Google Translate. Want ook die maakt over het algemeen grammaticale nieuwe zinnen in talen die het niet kent en die het ook zonder blauwdruk geleerd heeft. Alleen hebben die modellen onwaarschijnlijke hoeveelheden voorbeelden uit de te leren taal nodig: volgens sommige berekeningen net zoveel als een mens in tachtig jaar tijd te horen krijgt. Bovendien vreten ze energie. De vraag is dan dus of het niet efficiënter kan.

Het programma van Yuang en Piantadosi heeft meestal maar een paar honderd voorbeelden nodig om een taal in de vingers te krijgen. Nu zijn al die talen dus wel wat simpeler dan bestaande talen, die een heleboel complicaties combineren. Maar het onderzoek biedt wel een duidelijk vooruitzicht op een systeem dat het echt zal kunnen. Dat is de oorzaak van de felle discussies: weten we door deze speelgoedtaaltjes nu echt dat een computer, en dus een mens, echte talen kan leren?

Handiger

Ik heb de indruk dat de discussie door artikelen als dit langzamerhand verlegd wordt naar andere gebieden. Er is in ieder geval naar mijn idee een heel ander type argument voor het aangeboren taalvermogen: dat talen, hoe verschillend ze ook zijn, toch zo op elkaar lijken. Dat er bijvoorbeeld geen aaa bbb ccc-talen zijn in de echte wereld. Met andere woorden: dat computers eigenlijk meer en ingewikkelder talen kunnen leren dan mensen.

Dat argument is wat ingewikkelder – je moet dan vaststellen dat er inderdaad eigenschappen zijn die alle talen met elkaar delen en daar is lang niet iedereen het over eens. Vervolgens moet je ook nog eens alternatieve verklaringen – talen hebben dingen met elkaar gemeen omdat ze een gemeenschappelijke oorsprong hebben of omdat sommige eigenschappen nu eenmaal handiger zijn dan andere – uitsluiten en dat is niet bepaald gemakkelijk.

Delen:

  • Klik om af te drukken (Wordt in een nieuw venster geopend) Print
  • Klik om dit te e-mailen naar een vriend (Wordt in een nieuw venster geopend) E-mail
  • Klik om te delen op Facebook (Wordt in een nieuw venster geopend) Facebook
  • Klik om te delen op WhatsApp (Wordt in een nieuw venster geopend) WhatsApp
  • Klik om te delen op Telegram (Wordt in een nieuw venster geopend) Telegram
  • Klik om op LinkedIn te delen (Wordt in een nieuw venster geopend) LinkedIn

Vind ik leuk:

Vind-ik-leuk Aan het laden...

Gerelateerd

Categorie: Artikel Tags: syntaxis, taalkunde

Lees Interacties

Reacties

  1. Berthold van Maris zegt

    1 maart 2022 om 13:30

    “Een computerprogramma dat een zeer groot aantal talen vrij moeiteloos kon leren?”
    Is dat niet wat al te fors geformuleerd?

    Beantwoorden
    • Marc van Oostendorp zegt

      1 maart 2022 om 17:18

      Lees het oorspronkelijke artikel.

      Beantwoorden
  2. JamesSjaalman zegt

    1 maart 2022 om 14:59

    Die aabbcc – talen zijn inderdaad iets te symplistisch. Waarom niet (dialecten van) computertalen nemen als proefkonijn? Die liggen kwa eigenschappen ietsje dichter bij natuurlijke taal. Kennen zelfs recursie en een soort van PoS (datatypes! Keywords! Literals! Demiters! Operators!). En de resulterende semantische constraints.

    Beantwoorden
    • Marc van Oostendorp zegt

      2 maart 2022 om 09:28

      Computationeel gezien zijn computertalen over het algemeen nogal eenvoudig. Dat is ook logisch, want je wil als programmeur natuurlijk niet de computer belasten met onnodige complexiteit vanwege de taal die je gebruikt. Het lijkt mij dat een computer alle bestaande programmeertalen eigenlijk wel zou moeten kunnen leren.

      Beantwoorden
      • JamesSjaalman zegt

        2 maart 2022 om 14:02

        Vergelijkbaar met de aabbcc – constructie is bijvoorbeeld het SQL-construct:
        INSERT INTO foo(a,b,c)
        SELECT x,y,x FROM bar;
        Ook hier moeten de lijsten {a,b,c} en {x,y,z} overeenstemmen in kartinaliteit (en type).
        Maar er zitten wel twee tokens tussen, en bovendien kunnen x,y,z expressise zijn, of zelfs scalaire subqueries.
        Echte parsers stellen deze check uit tot de semantische analyse of de codegeneratie.
        Maar dit automatisch -zonder voorkennis- afleiden (uit een corpus van valide programmaas) lijkt me iets lastiger dan het aabbcc-voorbeeld.

        Beantwoorden
  3. Berthold van Maris zegt

    1 maart 2022 om 19:52

    He Sjaalman,nog altijd actief! Ook in de Stichtse Taveerne?

    Beantwoorden
  4. Berthold van Maris zegt

    1 maart 2022 om 19:52

    Ooo nnn zzz iii nnn.

    Beantwoorden

Laat een reactie achterReactie annuleren

Deze site gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie-gegevens worden verwerkt.

Primaire Sidebar

Gedicht van de dag

Willem Bilderdijk • Het Spaansch en ’t Fransch

Maar weg met u, ô spraak van bastertklanken,
Waarin hyeen en valsche schakals janken;
Verloochnares van afkomst en geslacht,
Gevormd voor spot die met de waarheid lacht

➔ Lees meer

Bekijk alle gedichten

  • Facebook
  • YouTube

Chris van Geel

IN DROOM

In een bladstille droom
hoorde ik kreunen op de weg.
Mijn vader sprong op
uit zijn stoel bij het raam –
wij waakten die nacht –,
snelde de tuin door, ik ook.

Het licht van de maan
omrandde met scherpe glanzen
boomstronken, een wagenschot,
de struiken, ieder blad.
Ik zelf lag daar in het donker
in de regen languit op het pad.

Bron: Tirade, november-december 1959

➔ Bekijk hier alle citaten

Agenda

23 mei 2025: Nijmegen taalhoofdstad

23 mei 2025: Nijmegen taalhoofdstad

16 mei 2025

➔ Lees meer
26 mei 2025: Nederlands Centraal

26 mei 2025: Nederlands Centraal

7 mei 2025

➔ Lees meer
9 mei 2025: een avond over patiëntenliteratuur in Perdu

9 mei 2025: een avond over patiëntenliteratuur in Perdu

7 mei 2025

➔ Lees meer
➔ Bekijk alle agendapunten

Neerlandici vandaag

geboortedag
1891 Jef Leenen
sterfdag
1940 Jacob Hiegentlich
1947 Jacobus Heinsius
2022 Thijs Pollmann
➔ Neerlandicikalender

Media

Verschenen: Romanreuzen

Verschenen: Romanreuzen

15 mei 2025 Door Redactie Neerlandistiek Reageer

➔ Lees meer
25. alkalommal rendezték meg a Magyarországi Néderlandisztika Napját

25. alkalommal rendezték meg a Magyarországi Néderlandisztika Napját

15 mei 2025 Door Redactie Neerlandistiek Reageer

➔ Lees meer
De Vliegende Hollander. De Mythe bij Gerard Reve, Jef Last en Louis Ferron

De Vliegende Hollander. De Mythe bij Gerard Reve, Jef Last en Louis Ferron

12 mei 2025 Door Redactie Neerlandistiek 1 Reactie

➔ Lees meer
➔ Bekijk alle video’s en podcasts

Footer

Elektronisch tijdschrift voor de Nederlandse taal en cultuur sinds 1992.

ISSN 0929-6514
Bijdragen zijn welkom op
redactie@neerlandistiek.nl
  • Homepage
  • E-books
  • Neerlandistische weblogs
  • Over Neerlandistiek
  • De archieven
  • Contact
  • Facebook
  • YouTube

Inschrijven voor de Dagpost

Controleer je inbox of spammap om je abonnement te bevestigen.

Copyright © 2025 · Magazine Pro on Genesis Framework · WordPress · Log in

  • Homepage
  • Categorie
    • Voor de klas
    • Vertelcultuur
    • Naamkunde
  • Archief
    • 10 jaar taalcanon
    • 100 jaar Willem Frederik Hermans
  • E-books
  • Neerlandistische weblogs
  • Jong Neerlandistiek
  • Frisistyk
  • Mondiaal Neerlandistiek
  • Over Neerlandistiek
  • Contact
 

Reacties laden....
 

    %d