Door Marijn Schraagen
Het is december 1636. Pieter Corneliszoon Hooft zit in zijn werkkamer in het Muiderslot om de post door te nemen. Als eerste opent hij een brief van Constantijn Huygens, met wie hij al jaren een uitgebreide correspondentie onderhoudt. De brief luidt als volgt:
Mijn’ Heere;
Vandaag kwam mijn zoon Christiaan bij mij met een curieuze uitvinding. Het is een machine met een veer die opgewonden moet worden, met in het binnenste een leeg vel papier en een volle inktpot. De machine doopt vervolgens een veer (niet degene die opgewonden is, maar de veer van een gans) in de inkt en begint zomaar dichtregels op het papier te schrijven! Christiaan is van plan om zijn kennissen per post de dichtsels van deze moderne techniek te sturen, en heeft het instrument daarom de Post-Moderne Robot genoemd, afgekort ‘Pomobot’. Robot is het Boheemse woord voor ‘dwangarbeider’, een toepasselijke term omdat de uitvinding altijd en overal werkt – mits iemand de veer aandraait natuurlijk.
Het eerste dichtsel wil ik u graag voorleggen. Het luidt als volgt:
Dat ghij de doortrapte minnaer
Die geensins weerdigh en raeckt
Die in vernuft en ghebaer
Verdooft soo grillich uitmaakt,
Eedle faem voor hellen braeckt,
Ghewoon sijn trompet bedenckt,
En krijcht aen welx waeckt,
Hier onder ons schild krenckt.
Is het niet merkwaardig? Suzanna en ik denken erover om een poëzieavond te organiseren voor deze schrijfsels. Misschien tijdens het feest van Sinter Claes, dat zou het geven van geschenken wellicht verlevendigen. Ik ben, zoals altijd, hogelijk benieuwd naar uw mening over alle deze verwikkelingen.
Mijn Heere,
U.E.
ootmoede dienaer
C Huijgens.
In ’s Gravenhaghe. den
3en Decemb. 1636.
Hooft fronste zijn wenkbrauwen. Zo’n vreemd gedicht had hij nog maar zelden gezien. Hij nam zich voor de tekst direct van verbeteringen te voorzien en terug te sturen aan Huygens. Maar hoe was deze tekst te redden, welke stappen zou hij het beste kunnen volgen?
Hooft bedacht dat de structuur van de tekst niet eens zo slecht was (hoewel het met het metrum van geen kanten klopte), maar dat de gebruikte woorden niet altijd goed bij elkaar pasten. “Als ik nu eens andere woorden kies”, dacht hij, “die zowel bij de huidige woorden passen, als bij elkaar?”
“Het eenvoudigste lijkt me, om in alle boeken die ik bezit te tellen hoe vaak elk woord in de buurt van elk ander woord voorkomt. Dan maak ik voor elk woord een lijst met tweehonderd getallen, die ik een willekeurige waarde geef. Daarna kijk ik voor woorden die vaak bij elkaar staan, of de getallen op elke plek in de lijst een beetje op elkaar lijken, en andersom of de getallen voor woorden die niet vaak bij elkaar staan van elkaar verschillen. Als dat zo is, dan heb ik de goede getallen gekozen, maar anders moet ik de getallen een beetje aanpassen om de lijsten meer op elkaar te laten lijken. De aanpassing mag niet te groot zijn natuurlijk, want dan gaat het mis voor woorden waarbij ik al de goede getallen had. Op die manier gaat de aanpassing in veel kleine stapjes. Dat duurt wel lang, maar dan heb ik uiteindelijk voor alle woorden het juiste resultaat. Daarnaast is het al vroeg donker in deze tijd van het jaar, dus op die lange avonden moet je wel wat te doen hebben natuurlijk.”
Dus Hooft pakte zijn telraam en ging aan het werk. Voor het woord ‘doortrapte’ bijvoorbeeld begon het lijstje getallen als volgt: -0.161352 -0.382860 0.292927 -0.233666 1.345929 -0.595966 0.756392 -0.131320 0.296050 -0.290197. De woorden met dezelfde soort getallen waren bijvoorbeeld ‘verraeders’, ‘misbruicken’, ‘strenge’ en ‘onnoosle’. Voor ‘minnaer’ waren dat ‘wedermin’, ‘kusjens’, ‘Galathea’ en ‘Min’. Hooft probeerde verschillende combinaties uit. “Misschien ‘misbruicken Galathea’? Nee, dat klinkt als #metoo. Dan ‘onnoosle kusjens’? Zou kunnen, maar Constantijn zal me er nog van beschuldigen een streekroman te willen schrijven. ‘Strenge Min’? Dat klinkt al beter, laat ik dat eens proberen. Dan wordt de eerste zin ‘Dat ghij de strenge Min’, dat klinkt goed.”
En zo ging hij verder, woord voor woord, regel voor regel. Nadat hij alle lijstjes gezien had en na het proberen van heel veel combinaties was dit het resultaat:
Dat ghij de strenge Min
Die niemant wt en sondert
Die van verstant en sin
Berooft soo menich hondert,
Wiens naem op Aerden dondert,
Sonder sijn wapen siet,
En sijt daer van verwondert,
Noch van dit wapen niet.
Snel zette hij zich aan zijn schrijftafel en schreef een antwoord aan Constantijn Huygens.
Toelichting
Het gedicht van Hooft is het eerste vers van de Mommerij, een kort toneelstuk over de liefde, gespeeld in Amsterdam in 1602. De beschreven methode voor het vinden van semantisch verwante woorden maakt gebruik van het principe van word embeddings, in dit geval met het algoritme van Word2Vec zoals ontwikkeld bij Google. Als trainingsmateriaal voor de getallenlijsten (word vectors genaamd) is het oeuvre van Hooft gebruikt, maar ook bijvoorbeeld de werken van Vondel en Cats. Uiteraard is de procedure zoals hier beschreven in werkelijkheid andersom toegepast: van het gedicht van Hooft is met behulp van de meest gelijkende word vectors de variant gemaakt van de ‘Pomobot’.
Wat laat dit zien? Uiteraard niet dat Hoofts creativiteit werkelijk gevoed moest worden door algoritmes. Maar wél dat moderne digitale technieken gebruikt kunnen worden om nieuwe gedichten te produceren, die nota bene op zeventiende-eeuwse leest geschoeid zijn. En dat is niet alleen een leuk weetje voor wie nog op zijn Sinterklaasgedichten zit te ploeteren. De methode kan computationeel taalkundigen ook helpen om semantische velden in de zeventiende-eeuwse literatuur te ontdekken die soms met het blote oog niet meteen zichtbaar zijn, en om categorieën van samenhangende teksten te ontdekken: had Hooft een andere schrijfhand dan Vondel, kan de computer een liefdesgedicht van Hooft onderscheiden van een politiek gedicht? In het project Language Dynamics in the Dutch Golden Age verkennen wij manieren om met word embeddings-technieken de zeventiende-eeuwse taal verder te doorgronden.
Ben nog benieuwder naar de criteria (methodes) die door de onderzoekers worden gehanteerd om de verschillende verschijnselen statistisch waarneembaar aan elkaar te knopen.
Anders. De vraagstelling in de laatste link gaat er nl. al vanuit dat de oude en de nieuwe negatie bij Hooft is te koppelen aan andere dingen. Bewijs voor die H1?