• Door naar de hoofd inhoud
  • Skip to secondary menu
  • Spring naar de eerste sidebar
  • Spring naar de voettekst
Neerlandistiek. Online tijdschrift voor taal- en letterkunde

Neerlandistiek

Online tijdschrift voor taal- en letterkundig onderzoek

  • Over Neerlandistiek
  • Contact
  • Homepage
  • Categorie
    • Neerlandistiek voor de klas
    • Vertelcultuur
    • Naamkunde
  • E-books
  • Neerlandistische weblogs
  • Archief
    • 10 jaar taalcanon
    • 100 jaar Willem Frederik Hermans
  • Jong Neerlandistiek
  • Frisistyk
  • Mondiaal

Een plaatje zegt de computer meer dan duizend woorden

9 november 2022 door Marc van Oostendorp 1 Reactie

‘Honden’ volgens Google Images.

Kunnen computers taal leren? Het is een van de grote vragen van deze tijd en afgelopen maandag legde Danny Merkx in Nijmegen een nieuw stukje van de puzzel. Hij promoveerde er op een proefschrift waarin hij onderzocht of het hielp als je computers plaatjes laat zien.

Merkx bood de computer daarvoor een verzameling plaatjes aan – bijvoorbeeld gehaald van de website Flickr – die beschreven waren door vrijwilligers: ‘een hond rent door het gras’, ‘een wit hondje in de sneeuw’, ’twee vrouwen op een tractor’. Als de computer hierdoor getraind was, bleek het in staat om ook op een nieuwe foto te zien of er een hond op voorkwam. En dat was niet alleen het geval als de beschrijving was uitgeschreven, maar ook als hij was ingesproken – terwijl gesproken taal veel moeilijker te analyseren is, bijvoorbeeld doordat er allerlei uitspraakvariatie is, of doordat we in gesproken taal geen pauzes leggen tussen woorden maar alles aan elkaar plakken. Bovendien wist de computer voor de training begon niets van taal: hij kende geen woorden, hij wist zelfs niet wat woorden waren.

Dat toevoegen van plaatjes om taal te leren is nieuw. De bestaande ’taalmodellen’ – ook die verantwoordelijk zijn voor de successen van chatbots of Google Translate – worden alleen maar getraind op tekst. Zij leren taal door heel veel heel grote verzamelingen teksten met elkaar te vergelijken. Dat is waarschijnlijk geen heel reële weerspiegeling van hoe kinderen woorden leren, zei Merkx tijdens zijn promotie. Zij hebben ook ouders die bijvoorbeeld op een hond wijzen en dan zeggen ‘hond’. Vandaar dat Merkx ook voor computers geïnteresseerd is in multimodaal leren. Nu zijn er ook andere ‘modaliteiten’ dan het zicht (het gehoor, de reuk, enzovoort), maar het visuele is voor de computer nu eenmaal het makkelijkst te analyseren. Er zijn wel databases van plaatjes, maar niet van geuren.

Het blijkt in de praktijk ook te werken. De bestaande modellen met alléén taal worden getraind op onwaarschijnlijke hoeveelheden teksten – meer dan een mens in een tachtigjarig leven kan lezen, ook als ze permanent leest. Merkx laat in zijn proefschrift zien dat het ook met minder kan. Sterker nog, hij liet zien dat zijn model met plaatjes het in sommige opzichten beter deed dan modellen met alleen tekst. Bijvoorbeeld kan zijn systeem het verschil tussen enkelvoud en meervoud herkennen: het geeft andere plaatjes wanneer je om ‘hond’ vraagt dan om ‘honden’. Dat onderscheid is vaak te subtiel voor tekstmodellen.

Het is logisch en lijkt voor de hand te liggen, maar dat het niet eerder is geprobeerd heeft natuurlijk ook te maken met het feit dat computers steeds sneller worden, en dat er in de Kunstmatige Intelligentie nieuwe technieken gevonden zijn. Zoals er ooit een dag komt dat een robotje, behept met allerlei zintuigen, door de wereld mag scharrelen om woorden te leren. Dan gaan we wat zien!

Het proefschrift van Danny Merkx komt de komende dagen hier te staan.

Delen:

  • Klik om af te drukken (Wordt in een nieuw venster geopend) Print
  • Klik om dit te e-mailen naar een vriend (Wordt in een nieuw venster geopend) E-mail
  • Klik om te delen op Facebook (Wordt in een nieuw venster geopend) Facebook
  • Klik om te delen op WhatsApp (Wordt in een nieuw venster geopend) WhatsApp
  • Klik om te delen op Telegram (Wordt in een nieuw venster geopend) Telegram
  • Klik om op LinkedIn te delen (Wordt in een nieuw venster geopend) LinkedIn

Vind ik leuk:

Vind-ik-leuk Aan het laden...

Gerelateerd

Categorie: Artikel Tags: AI, kunstmatige intelligentie, taalkunde, taalverwerving

Lees Interacties

Reacties

  1. Robert Kruzdlo zegt

    9 november 2022 om 08:19

    Een ondeugend – behept – robotje blijft met 0’en en 1’en spelen en geloof mij als het zintuigen krijgt zal het niet anders zijn. Blijft bij nullen en enen. Zelfs Picasso herhaalde zichzelf door in één stijl te blijven schilderen. Hij was niet behept, hij was een computer die tot op vandaag in snelheid nog niet te evenaren is. Zelfs al verbind je alle computers van de wereld met elkaar dan nog krijg je geen Dautzenberg of een goede weervoorspelling. Dat hardnekkige geloof in robots met zintuigen kost heel veel geld en Google is er blij mee.

    Beantwoorden

Laat een reactie achterReactie annuleren

Deze site gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie gegevens worden verwerkt.

Primaire Sidebar

Gedicht van de dag

W.L. Penning • Het monster

Doller dan ooit is ’t monster losgebroken,
En menschen worden wilde beesten;
Helsch viert het kwaad zijn gloriefeesten –
Tot de overmacht heeft rechtgesproken

➔ Lees meer

Bekijk alle gedichten

  • Facebook
  • YouTube

Chris van Geel

HONDSDAGEN

Niet groen rijpt het gras dit jaar,
bomen dragen hun bladeren wit,
het licht is niet uit het veld
te slaan, de dag reikt aan
de dag, in dromen zoeken
de nachten onderdak.

Bron: Uit de hoge boom geschreven, 1967

➔ Bekijk hier alle citaten

Agenda

7 oktober 2025: een cadeautje voor secties Nederlands

7 oktober 2025: een cadeautje voor secties Nederlands

18 juli 2025

➔ Lees meer
19 september 2025: Afscheidscollege Fred Weerman

19 september 2025: Afscheidscollege Fred Weerman

15 juli 2025

➔ Lees meer
1 juli – 15 september 2025: Over de grenzen van het boek

1 juli – 15 september 2025: Over de grenzen van het boek

11 juli 2025

➔ Lees meer
➔ Bekijk alle agendapunten

Neerlandici vandaag

geboortedag
1949 Jeroen Groenendijk
sterfdag
1963 Jan Naarding
2008 Rein Bloem
➔ Neerlandicikalender

Media

The form of the adjective in Dutch

The form of the adjective in Dutch

20 juli 2025 Door Redactie Neerlandistiek Reageer

➔ Lees meer
De Literaire Letterenshow met Mustafa Stitou en Auke Hulst

De Literaire Letterenshow met Mustafa Stitou en Auke Hulst

19 juli 2025 Door Redactie Neerlandistiek Reageer

➔ Lees meer
Inclusive Dutch: Between Norm and Variation

Inclusive Dutch: Between Norm and Variation

15 juli 2025 Door Redactie Neerlandistiek 3 Reacties

➔ Lees meer
➔ Bekijk alle video’s en podcasts

Footer

Elektronisch tijdschrift voor de Nederlandse taal en cultuur sinds 1992.

ISSN 0929-6514
Bijdragen zijn welkom op
redactie@neerlandistiek.nl
  • Homepage
  • E-books
  • Neerlandistische weblogs
  • Over Neerlandistiek
  • De archieven
  • Contact
  • Facebook
  • YouTube

Inschrijven voor de Dagpost

Controleer je inbox of spammap om je abonnement te bevestigen.

Copyright © 2025 · Magazine Pro on Genesis Framework · WordPress · Log in

  • Homepage
  • Categorie
    • Voor de klas
    • Vertelcultuur
    • Naamkunde
  • Archief
    • 10 jaar taalcanon
    • 100 jaar Willem Frederik Hermans
  • E-books
  • Neerlandistische weblogs
  • Jong Neerlandistiek
  • Frisistyk
  • Mondiaal Neerlandistiek
  • Over Neerlandistiek
  • Contact
 

Reacties laden....
 

    %d