De dichter Ester Naomi Perquin pleitte in haar Kees Fens-lezing onlangs voor ‘harteloos lezen’. Wat betekent dit in een tijd dat AI inmiddels gedichten schrijft die mensen mooier vinden dan door mensen geschreven gedichten?
Dank voor interessante uiteenzetting over de (on) mogelijkheid een gedicht van een mens en een gedicht gemaakt door AI (uiteindelijk wel gevoed door menselijke producten) te onderscheiden. hvb
Interessant vlog-essay (want dat is het wel in zijn aftastend onderzoeken), waardoor ik ook wat aan het peinzen raakte. Ik ben zo vrij mijn overpeinzingen hier te delen, voor wat het waard is.
Ten eerste komt bij mij, n.a.v. beschreven experimenten, meteen de gedachte op: hoe makkelijk zijn we als mensen op het verkeerde been te zetten, met name als het om “menselijke intentie” gaat. Maar ook: blijkbaar is er (ook) bij poëzie geen essentieel “objectief” kenmerk te identificeren dat een tekst tot (als kunstzinnig ervaren) poëzie maakt (behalve dat ‘poëzie’ als genre gekenmerkt wordt door de vrije regelval, die niet bepaald wordt door de bladspiegel). Dat wisten we natuurlijk eigenlijk al vanuit de pogingen van de literatuurwetenschap van de laatste eeuw om dit soort essenties te abstraheren, maar toch. Met behulp van generatieve kunstmatige intelligentie (GenAI) kunnen dit soort hypothesen wellicht nog veel beter getoetst worden. Wat Marc van Oostendorp duidt, namelijk dat we als mensen blijkbaar die menselijke intentie en inspanning, erg belangrijk vinden om iets als een (waardevol / betekenisvol) gedicht te ervaren (alle “neutrale” ergocentrische benaderingen ten spijt).
Ten tweede vraag ik mij af wat het effect op genoemd onderzoek is van die ‘non expert readers’, of beter: wat zou er gebeuren als je wél – min of meer geschoolde – lezers met enige tot veel bekendheid met de (wereld)literatuur in dit experiment zou gebruiken. Zouden zij beter het verschil kunnen maken tussen door AI en door mensen gemaakte poëzie? Of zou dat alleen betekenen dat zij leunen op herkenning en herinnering en zegt dat weinig tot niets over hun onderscheidingsvaardigheid? Hoe belangrijk oftewel bepalend is in dit opzicht geletterdheid?
Dat de proefpersonen in een aantal beschreven testopstellingen een voorkeur lijken te hebben voor de AI-gegenereerde gedichten, is niet eens zo vreemd. ChatGPT en andere GenAI software werkt op basis van Large Language Models (LLM’s) en is feitelijk “statistiek”. Deze modellen voorspellen wat het meest voor de hand liggende volgende woord is van een tekstuele output, op basis van een heel omvangrijk tekstcorpus. Je krijgt dus het resultaat dat ‘logisch’ lijkt, maar feitelijk de grootst gemene deler is.
Ik heb het door Van Oostendorp aangehaalde onderzoek niet geraadpleegd, maar interessant is dat hij de hypothese opwerpt dat de voorkeur van de proefpersonen voor AI-gedichten te maken zal hebben met het feit dat deze over het algemeen “simpeler” (toegankelijker) zijn; dat lijkt mij ook plausibel in het licht van het voorgaande. Dat heeft eveneens te maken met ‘voorspelbaarheid’ en de grootst gemene deler. De meeste lezers lijken een duidelijke voorkeur te hebben voor teksten die minder complex zijn en een zekere voorspelbaarheid, waarbij ‘herkenning’ en ‘identificatie’ belangrijke waarderingsnormen zijn. Een groot deel van het corpus dat aan de basis ligt van de LLM’s zal ook taalcombinaties omvatten die minder complex zijn dan b.v. een gedicht van Gerrit Kouwenaar of Hans Faverey, waardoor een gegenereerd gedicht die lagere complexiteit weerspiegelt.
Tot slot en wellicht ten overvloede: kunstmatige intelligentie lijkt (!) intelligent, kan heel aardig wat kunstjes, maar het blijven (weliswaar complexe) trucjes, ook al zijn de resultaten soms verbijsterend en boeiend.
hvb zegt
Dank voor interessante uiteenzetting over de (on) mogelijkheid een gedicht van een mens en een gedicht gemaakt door AI (uiteindelijk wel gevoed door menselijke producten) te onderscheiden. hvb
Danny Habets zegt
Interessant vlog-essay (want dat is het wel in zijn aftastend onderzoeken), waardoor ik ook wat aan het peinzen raakte. Ik ben zo vrij mijn overpeinzingen hier te delen, voor wat het waard is.
Ten eerste komt bij mij, n.a.v. beschreven experimenten, meteen de gedachte op: hoe makkelijk zijn we als mensen op het verkeerde been te zetten, met name als het om “menselijke intentie” gaat. Maar ook: blijkbaar is er (ook) bij poëzie geen essentieel “objectief” kenmerk te identificeren dat een tekst tot (als kunstzinnig ervaren) poëzie maakt (behalve dat ‘poëzie’ als genre gekenmerkt wordt door de vrije regelval, die niet bepaald wordt door de bladspiegel). Dat wisten we natuurlijk eigenlijk al vanuit de pogingen van de literatuurwetenschap van de laatste eeuw om dit soort essenties te abstraheren, maar toch. Met behulp van generatieve kunstmatige intelligentie (GenAI) kunnen dit soort hypothesen wellicht nog veel beter getoetst worden. Wat Marc van Oostendorp duidt, namelijk dat we als mensen blijkbaar die menselijke intentie en inspanning, erg belangrijk vinden om iets als een (waardevol / betekenisvol) gedicht te ervaren (alle “neutrale” ergocentrische benaderingen ten spijt).
Ten tweede vraag ik mij af wat het effect op genoemd onderzoek is van die ‘non expert readers’, of beter: wat zou er gebeuren als je wél – min of meer geschoolde – lezers met enige tot veel bekendheid met de (wereld)literatuur in dit experiment zou gebruiken. Zouden zij beter het verschil kunnen maken tussen door AI en door mensen gemaakte poëzie? Of zou dat alleen betekenen dat zij leunen op herkenning en herinnering en zegt dat weinig tot niets over hun onderscheidingsvaardigheid? Hoe belangrijk oftewel bepalend is in dit opzicht geletterdheid?
Dat de proefpersonen in een aantal beschreven testopstellingen een voorkeur lijken te hebben voor de AI-gegenereerde gedichten, is niet eens zo vreemd. ChatGPT en andere GenAI software werkt op basis van Large Language Models (LLM’s) en is feitelijk “statistiek”. Deze modellen voorspellen wat het meest voor de hand liggende volgende woord is van een tekstuele output, op basis van een heel omvangrijk tekstcorpus. Je krijgt dus het resultaat dat ‘logisch’ lijkt, maar feitelijk de grootst gemene deler is.
Ik heb het door Van Oostendorp aangehaalde onderzoek niet geraadpleegd, maar interessant is dat hij de hypothese opwerpt dat de voorkeur van de proefpersonen voor AI-gedichten te maken zal hebben met het feit dat deze over het algemeen “simpeler” (toegankelijker) zijn; dat lijkt mij ook plausibel in het licht van het voorgaande. Dat heeft eveneens te maken met ‘voorspelbaarheid’ en de grootst gemene deler. De meeste lezers lijken een duidelijke voorkeur te hebben voor teksten die minder complex zijn en een zekere voorspelbaarheid, waarbij ‘herkenning’ en ‘identificatie’ belangrijke waarderingsnormen zijn. Een groot deel van het corpus dat aan de basis ligt van de LLM’s zal ook taalcombinaties omvatten die minder complex zijn dan b.v. een gedicht van Gerrit Kouwenaar of Hans Faverey, waardoor een gegenereerd gedicht die lagere complexiteit weerspiegelt.
Tot slot en wellicht ten overvloede: kunstmatige intelligentie lijkt (!) intelligent, kan heel aardig wat kunstjes, maar het blijven (weliswaar complexe) trucjes, ook al zijn de resultaten soms verbijsterend en boeiend.
Marc van Oostendorp zegt
Gedicht in de stijl van Hans Faverey, volgens ChatGPT:
I
licht in z’n hoedanigheid als licht: weeft zich verder in die chaos, een bewegend verzuim
II
ik zeg je niets verdwijnt, slechts haalt men adem buiten bereik
III
ik herken de vorm niet meer, maar vind het teken. En vergaat.
https://chatgpt.com/share/677e4a53-4ff4-800e-90d2-a7d9b1a064e0