Dichteres en actrice Maud Vanhauwaert, die in 2018 en 2019 stadsdichter van Antwerpen was, opende op 28 januari 2021 de digitale, 34e editie van de HSN-conferentie. Zij nam haar toehoorders mee op een poëtische middagwandeling onder de bijzondere titel Het stad in mij. Onderweg toonde zij een slinger met kleurrijke vlaggetjes. Op het eerste vlaggetje stond een Nederlandse dichtregel. Die tekst was vertaald naar een van de vele talen die in Antwerpen gesproken worden en op een tweede vlaggetje geplaatst. Die versregel vormde het vertrekpunt voor een vertaling naar weer een andere vreemde taal en zo ging dat een tijdje door. Het eind van de slinger was gereserveerd voor een Nederlandse vertaling van het voorlaatste vlaggetje. Het zal niemand verbazen dat de oorspronkelijke Nederlandse tekst niet overeenstemde met de uiteindelijke Nederlandse tekst. Maar de boodschap was niet verloren geraakt tijdens de vele vertaalslagen. Integendeel, het leek of de dichtregel tijdens de reis langs verschillende vreemde talen juist aan poëtische kracht had gewonnen.
Computer: van tekst naar tekst
Wat zou het resultaat zijn als vertalingen niet gemaakt worden door mensen van vlees en bloed maar door een modern online vertaalprogramma als Google Translate? Daar wilde ik meer van weten en daarom besloot ik een verkennend onderzoekje uit te voeren. Ik koos een bekend gedicht uit een van de weinige werken uit de achttiende eeuw die in de nieuwe canon van de literatuur een plaats heeft weten te verwerven: Hieronymus van Alphens ‘De pruimeboom’ uit de Kleine gedigten voor kinderen (1782-1792). Die tekst is niet te lang maar biedt voldoende punten om het algoritme van de techgigant op de proef te stellen.
Het Nederlandse origineel heb ik achtereenvolgens laten vertalen in het Frans, het Spaans, het Italiaans, het Duits, het Zweeds, het Deens en weer terug naar het Nederlands. Een soort grand tour dus langs Romaanse en Germaanse taalgebieden. In de onderstaande tabel staat de oorspronkelijke achttiende-eeuwse tekst links en de uiteindelijke vertaling rechts:
Oorspronkelijke versie | Uiteindelijke versie |
De pruimeboom Eene vertelling Jantje zag eens pruimen hangen, o! als eieren zo groot. ’t Scheen, dat Jantje wou gaan plukken, schoon zijn vader ’t hem verbood. Hier is, zei hij, noch mijn vader, noch de tuinman, die het ziet: Aan een boom, zo vol geladen, mist men vijf zes pruimen niet. Maar ik wil gehoorzaam wezen, en niet plukken: ik loop heen. Zou ik, om een hand vol pruimen, ongehoorzaam wezen? Neen. Voord ging Jantje: maar zijn vader, die hem stil beluisterd had, Kwam hem in het loopen tegen voor aan op het middelpad. Kom mijn Jantje, zei de vader, kom mijn kleine hartedief! Nu zal ik u pruimen plukken; nu heeft vader Jantje lief. Daar op ging Papa aan ’t schudden, Jantje raapte schielijk op; Jantje kreeg zijn hoed vol pruimen, en liep heen op een galop. | pruim Een verhaal Jantje zag eens een hangende pruim, Oh! zo groot als een ei Het leek erop dat Jantje wilde gaan stemmen, hoewel zijn vader het verbood. Zie je, zei hij, noch mijn vader, noch de tuinman die hem ziet: In zo’n beladen boom we verliezen geen vijf of zes pruimen. Maar ik wil gehoorzaam zijn en niet kiezen: ik ga. Ik wil graag een handvol pruimen ongehoorzaam wezen? Geen Kleine Johnny vervolgde: maar zijn vader, dat ik in stilte naar hem had geluisterd ik ontmoette hem geconfronteerd met de middenweg. kom mijn kleine Jan, zei vader, kom mijn liefste Nu zal ik je wat pruimen geven; nu houdt vader van Jantje. Dus papa begon te trillen Jantje reageerde snel; Jantje heeft haar hoed gevuld met pruimen, en begin te galopperen. |
Natuurlijk moest ik glimlachen toen ik de uiteindelijke tekst voor het eerst zag. Sommige verzen waren vreemd vertaald – Jantje wilde gaan stemmen, papa begon te trillen – maar de informatie uit de meeste versregels bleek ondanks de vele vertaalslagen goeddeels bewaard gebleven. Zo slecht doet Google Translate het dus niet.
Interessanter dan de overeenkomsten tussen beide versies van het gedicht zijn de verschillen. Neem bijvoorbeeld de titel. Een pruimenboom lijkt op het eerste gezicht iets anders te zijn dan een pruim, maar bij nadere beschouwing blijken beide woorden hetzelfde te kunnen betekenen. Behalve een vrucht van de pruimenboom is een pruim ook een aanduiding voor een pruimenboom.
Waar komen die andere verschillen vandaan? Bij de vertaling naar welke taal is bijvoorbeeld het werkwoord stemmen terecht gekomen in het gedicht? Zou het resultaat anders zijn als de vertalingen in omgekeerde volgorde hadden plaatsgevonden? (Spoiler: ja!) Wanneer werd Johnny geïntroduceerd als personage? Zijn er ook opmerkelijke verschillen als je de Nederlandse tekst vertaalt naar één specifieke taal en direct terug vertaalt naar het Nederlands? Maakt het daarbij uit of er sprake is van grote, Germaanse of Romaanse talen of kleine, niet-Indogermaanse talen? En zijn deze resultaten voor andere automatische vertaalprogramma’s zoals Deepl.com hetzelfde? Vragen die het volgens mij waard zijn om uitgezocht te worden, bijvoorbeeld door leerlingen in de bovenbouw van het voortgezet/secundair onderwijs in een profielwerkstuk over de kwaliteit van automatische vertalingen. Daarbij kunnen ook automatische ondertitelingen worden betrokken. Daarover gaat de volgende paragraaf.
Computer: van spraak naar tekst
Iedereen zal wel eens het spel gespeeld hebben waarbij mensen in een kring zitten en fluisterend een zin moest worden doorgegeven. Door het zacht praten om de andere deelnemers niet in de gelegenheid te stellen de zin af te luisteren bleek er gaandeweg steeds meer informatie verloren te gaan. Mensen deden er alles aan toch een zinvolle mededeling door te geven, maar dat lukte eigenlijk nooit. Het verschil tussen het begin en het eind van de cirkel was eigenlijk altijd zo groot dat er hard gelachen werd om het resultaat.
Iets vergelijkbaars doet zich voor bij automatische ondertiteling van YouTube-video’s. YouTube herkent niet alle elementen uit de gesproken taal, maar geeft op basis van wel bekende woorden toch een oplossing. Beter iets dan niets, zal YouTube denken. Wat zou dat opleveren voor het gedicht ‘De Pruimeboom’? Ik zocht twee video’s op, één Nederlands-Nederlandse en één Belgisch-Nederlandse. De woorden van de transcriptie heb ik niet veranderd, maar om de teksten beter met elkaar te kunnen vergelijken heb ik wel de afbrekingen in overeenstemming gebracht met de originele verzen van het gedicht.
Nederlands-Nederlands | Belgisch-Nederlands |
jantje zag eens pruimen hangen als eieren ze groot het scheen dat jantje wel gaan plukken schoon zijn vader het hem verbood hier is zei hij nog mijn vader nog een tuinman die het ziet aan een boom zo vol geladen mist men vijf zes pruimen niet maar ik wil gehoorzaam wezen en niet lukken ik loop heen zou ik om een handvol primer ongehoorzaam wezen neem voor het geen jantje maar zijn vader die hem stil beluister dat kwam hem in het lopen tegen vooraan op het middenpad kom mijn jantje zij de vader kon mijn kleine hartendief nu zal ik u pruimen plukken nu heeft jouw vader jantje lief daarom grip op aan het schudden jantje hapte schielijk op jantje kerst en hoe het voelt prive en liep heen in een groep | jantje zag eens pruimen hangen ook als je rug zo groot scheen dat jantje we gaan plukken schoon zijn vader tramverbod hier is zei hij nog mijn vader noch de tuinman die het ziet aan een boom zo vol geladen mist men vijf zes pruimen niet maar ik heb wel gehoorzaam wezen en niet lukken ik loop heen zou ik om een handvol pruimen om gehoorzaam wezen neem voortging jantje maar zijn vader die hem stil beluisterd had problemen het lopen tegen vooraan op het middenpad komen en jantje zij de vader komen kleine hartendief nu zal ik u pruimen plukken nu heeft vader jantje lief daarop geen papa aan schudden jantje raap het is heerlijk op jantje kreeg zijn hoed vol pruimen en diep heen op een galop |
Deze automatische ondertitelingen bieden eveneens interessant onderzoeksmateriaal. Welke woorden worden altijd goed herkend, en welke nooit? Zijn er klanken die vaak wegvallen of verkeerd geïnterpreteerd worden? Kunnen de afwijkingen van het origineel worden verklaard op basis van een afwijkende uitspraak, intonatie, snelheid, articulatie of opnamekwaliteit? Het laatste woord over automatische computervertalingen en computertranscripties is zeker nog niet gezegd of geschreven.
Hendrik Jan Hoogeboom zegt
Als ik het goed begrepen heb vertaalt Google altijd via het Engels. (Ik heb meen ik ook wel eens een Engels woord zien staan als bewijs van die tussenstap.) Als dat klopt, heeft je “grand tour” van vertalingen evenzovele keren een terugkeer gehad naar dezelfde tussentaal. Dat komt misschien de stabiliteit van de reeks ten goede?
Onno Kosters zegt
“[D]e informatie uit de meeste versregels bleek ondanks de vele vertaalslagen goeddeels bewaard gebleven. Zo slecht doet Google Translate het dus niet.” Want poëzie is informatie overbrengen?
Er is al heel veel onderzoek gedaan naar literair vertalen en vertaaltechnologie, het was zinvol geweest daar eerst eens onderzoek naar te doen. Zie bv. https://literairvertalen.org/kennisbank/dossier-vertaling-en-technologie en https://www.tijdschrift-filter.nl/webfilter/dossier/literair-vertalen-en-technologie/januari-2021/