Waarom ik dacht dat ChatGPT schrijvers overbodig maakt (en waarom dat niet zo is)

In 2021 deed ik een experiment met AI. Met behulp van een ChatGPT-tool probeerde ik mezelf als schrijver overbodig te maken. Dat bleek verrassend goed te lukken. Dacht ik. Een paar jaar verder, denk ik niet dat ChatGPT me overbodig maakt – of andere schrijvers tot de WW veroordeelt.

Hoe ik op het idee voor dit AI-experiment kwam

Ik heb jarenlang voor IT-bedrijven gewerkt en een paar jaar een eigen tech-startup geleid. Hoe langer ik in de tech-industrie werkte, hoe meer ik me verwonderde over de invloed van technologie op ons leven. In 2021 gooide ik het roer om en besloot ik fulltime te gaan spreken en schrijven over hoe technologie onze maatschappij verandert. Mijn eerste boek over technologie was de dichtbundel Dit algoritme deugt niet. Daarin deed ik op vervreemdende, humoristische, talige (kortom: poëtische) wijze verslag van een wereld van influencers, maaltijdbezorgers, streamingdiensten en datingapps. Ik wilde het publiek laten stilstaan bij de manier waarop we omgaan met technologie. Het leek me interessant om dat ook met een experiment te doen: kan AI betere of populairdere teksten maken dan ik?

Daarbij werd ik geïnspireerd door de podcast van Alexander Klöpping en Ernst-Jan Pfauth, die een aflevering van hun Podcast Over Media (POM) lieten maken door ChatGPT-3. De podcasters lieten een aantal afleveringen van hun podcast transcriberen met behulp van een AI-tool, gaven die tekst als input aan ChatGPT en gaven de tool de opdracht een nieuwe aflevering te schrijven. Die aflevering spraken ze in en zonden ze uit, zonder daarbij te vermelden dat het geen reguliere podcast was. In de door AI-gemaakte podcast vertelt Pfauth dat zijn betovergrootvader werkzaam was als astronaut, uit de lucht viel en dat dat ongeluk ervoor zorgde dat we nu veilige gebouwen kunnen maken. Toen ik deze wartaal hoorde, dacht ik: wat hebben die gasten in hemelsnaam gebruikt? Dat bleek dus AI te zijn.

De Turingtest voor ChatGPT

De vraag die het podcast-experiment van POM oproept is of AI in staat is teksten te maken die zo goed lijken, dat we niet doorhebben dat ze door een machine gemaakt zijn. Dat is in feite het principe van de Turing-test, waarbij een algoritme, AI of chatbot ‘slaagt’ als het in gesprek is met een mens en dat mens niet doorheeft dat hij niet met een machine praat, maar denkt dat hij met een ander mens praat. Het experiment van de podcastmakers is nuttig, omdat het een goede toets is voor de kwaliteit van tools als ChatGPT. Dit soort generatieve AI-tools maken gebruik van grote taalmodellen (ook wel large language models genoemd, LLM’s). Als zo’n AI-tool in staat is om een goede tekst te maken, dan zegt dat iets over de kwaliteit van de tool en de data (een grote verzameling teksten) waarmee het getraind is.

Als neerlandicus durf ik te beweren dat (om Paulien Cornelissen te parafraseren) taal zeg maar echt mijn ding is. Ik lees veel, van pulp tot klassiek en denk geregeld na over hoe taal werkt en zich ontwikkelt. Ik denk dat je onderscheid kan maken tussen verschillende soorten teksten en dat dat onderscheid gemaakt kan worden op basis van het niveau van de teksten:

– Makkelijke en korte teksten, zoals losse woorden en korte zinnen. Deze teksten zijn makkelijk (na) te maken. Als je nu een aantal woorden in WhatsApp schrijft, zie je dat de chatdienst ‘meedenkt’ en suggereert welk woord je hierna wil schrijven. Dat is best simpel.

– Langere en iets ingewikkeldere teksten, zoals podcasts, handleidingen, reisgidsen en andere boeken. Die zijn langer en complexer dan losse woorden of zinnen, maar volgen altijd een bepaalde structuur en zijn in die zin enigszins voorspelbaar. Een roman heeft een plot, een podcast is vaak een gesprek.

– Bovenaan deze piramide staat poëzie (en dat denk ik niet alleen omdat ik een dichtbundel schreef). Poëzie maakt gebruik van tegenstellingen, negeert soms grammaticaregels en is weleens in strijd met de logica. Poëzie gebruikt beelden in plaats van heldere communicatie. Poëzie vermijdt teksten als: ‘ik houd van je’ en gebruikt teksten als die van Paul Éluard: ‘Wie van ons twee heeft de ander bedacht?’ Voor de goede orde: niemand bedenkt zijn geliefde. Je kan wel het gevoel hebben dat jullie zo goed bij elkaar passen, dat het lijkt alsof je de ander bedacht hebt. Da’s poëzie.

Als kunstmatige intelligentie in staat is om ook goede poëzie te maken, dan slaagt het voor de ultieme proef en is het in staat om een soort Turing-test 2.0 te doorstaan. Daarom besloot ik om mijn gedichten te laten bewerken door AI en te onderzoeken of deze door het publiek beter gewaardeerd worden dan mijn eigen teksten (zonder daarbij mijzelf als de maat der dingen te willen nemen).

Algoritme maakt mij overbodig

Voor dit experiment gebruikte ik eveneens GPT-3 en in het specifiek de software van Copy.AI, een tool die gratis te gebruiken is. Copy.AI maakt het mogelijk om marketingteksten te (her)schrijven, maar het programma leent zich ook voor meer kunstzinnigere uitingen. Het werkt heel simpel: input (een tekst) plus prompt (opdracht) zorgt voor output (een nieuwe tekst). Ik voerde mijn teksten in en liet deze bewerken door AI. Vervolgens zocht ik naar een relevant publiek om deze poëzie aan te tonen, zodat ik kon meten wie er beter scoorde: AI of ik.

Acht procent van de Nederlanders leest wel eens een gedicht, waarmee het populairder is dan bijvoorbeeld tennis. Instagram kent een grote gemeenschap van poëzie-liefhebbers, die elkaar vinden via hashtags als #instagedicht en #dichtersvaninsta. Zo kwam ik al snel in contact met mijn doelgroep en kon ik gaan experimenteren met AI-poëzie. Je leest het goed: mijn gedichten over algoritmes liet ik bewerken door een algoritme en deelde ik vervolgens op het algoritme van Instagram. Ik turfde welke gedichten meer likes scoorden, die door AI gemaakt waren of die ik zelf maakte. Wat bleek?

Over het algemeen maakte kunstmatige intelligentie gedichten die meer likes scoorden dan die van mij.

Ik concludeerde dat ik zelf niet meer nodig ben. Het idee dat een machine de mens overbodig maak verwoord ik ook in mijn gedichten. Als abstract gegeven is dat interessant, de mens die ingehaald wordt door de machine. Maar het is allesbehalve geruststellend om te ervaren dat je als maker niet meer nodig bent. Daarom was mijn eerste reactie ook: ontkenning. Misschien is het niet zo relevant dat de AI-teksten meer likes scoren dan mijn teksten. Justin Bieber heeft immers ook meer volgers dan Mick Jagger, maar dat maakt hem niet per definitie een betere zanger dan de Rolling Stones-voorman.

Een goed AI-gedicht

Ik besloot dieper in de data te duiken en de teksten te analyseren die ChatGPT maakte. Ik ontdekte een uiting waarvan ik kan beargumenteren dat het goede poëzie is. Het algoritme maakte de tekst: ‘Je bent een bushalte midden in een besneeuwde woestijn. Dit jaar ben je maar één keer gebruikt.’ Ik weet niet hoe het met jou gaat, maar ik stond vanochtend niet op het met het idee dat ik een bushalte was. Dat is al een eerste indicatie van poëzie; een absurdistische situatie.

Als ik deze tekst als student Nederlands zou hebben geanalyseerd, dan zou mijn analyse zijn dat het een gedicht over eenzaamheid is. Iemand is een bushalte op een afgelegen plek en wordt maar één keer per jaar bezocht: dat is best eenzaam. Vervolgens vinden we een paradox in de tekst, namelijk: een besneeuwde woestijn. Dat is opvallend. Waarom ligt er sneeuw in die woestijn? Wat is de eigenschap van sneeuw? Het is koud, het is wit én het dempt geluid. Misschien is dit wel een gedicht over iemand die eenzaam is, om hulp roept, maar door niemand gehoord wordt. ChatGPT slaagt er dus in om een verhaal te vertellen met behulp van beelden (een bushalte, sneeuw in een woestijn) en daarmee een gevoel uit te drukken, zonder dat gevoel expliciet te benoemen. Dat zijn eisen die gesteld mogen worden aan een tekst om te kwalificeren als poëzie. Het vermijdt daarbij clichés, bevat genoeg aanwijzingen om het mysterie te ontrafelen en de beelden (een bushalte in een besneeuwde woestijn) zijn vrij uniek. De vraag of een gedicht geslaagd is, is per definitie subjectief maar deze uiting heeft alle tekenen van een goed gedicht.

De betekenis van dit experiment

In 2021 schreef ik over dit experiment voor media als Emerce, Neerlandistiek.nl en HP/ De Tijd. Mijn conclusie destijds was dat we als schrijvers, creatieven, makers (dus in feite: als mensen) wel kunnen inpakken. AI is in staat om teksten te maken die populairder zijn dan die van mensen en de teksten zijn kwalitatief ook meer dan in orde. Het appelleert aan de angst die veel mensen hebben om overbodig gemaakt te worden door AI.

Een paar jaar ouder, wijzer en grijzer, ben ik tot inkeer gekomen. De waarheid is genuanceerder en mijn eerste conclusies waren wat voorbarig. Ten eerste is niet elke uiting die AI maakt de moeite waard, waardoor het niet per definitie beter is in het maken van teksten dan mensen. Sommige teksten die AI-systemen maken slaan werkelijk nergens op, staan vol kromme redeneringen en fouten die mensen niet zouden maken. Als je een schrijver vraagt om een tekst te schrijven over voetbal en de eerste versies van die tekst gaan over fruit of verre reizen, dan noemen we dat ook geen goede schrijver. Ten tweede, zo bedacht ik, is er een neerlandicus nodig die kaf van koren kan onderscheiden. Er is iemand nodig die leest over een besneeuwde woestijn en die denkt: dat is geen onzin, dat is poëzie (al is het verschil tussen die twee voer voor discussie).

Het verhaal over de kwaliteit van ChatGPT is kortom veel genuanceerder. Zo’n AI-tool maakt schrijvers niet overbodig, maar zou het werk van schrijvers kunnen veranderen. AI zou als een assistent gebruikt kunnen worden. Dat is het verhaal achter het verhaal, dat we ontdekken als we iets langer bij de feiten stilstaan, nieuwsgieriger én kritisch zijn. Zodat we technologie niet onderschatten zoals bij de opkomst van de smartphone en het internet, maar het ook niet overschatten.

Die nuance – AI maakt makers niet overbodig, maar verandert het maakproces misschien – is nodig om te begrijpen wat de echte impact van deze technologie is op kunst, werk en de maatschappij. En dat is precies de nuance die ik probeer te bieden in mijn lezingen en nieuwe boek (AI, voorbij de hype). Ik verheug me erop om samen met je opzoek te gaan naar het verhaal achter het verhaal over AI. Want er is nog genoeg te ontdekken.

Dit artikel verscheen eerder op https://www.aaronmirck.com/

Gerelateerd

Reacties

Ronald V. zegt

22 februari 2024 om 11:29

Extended mind

Straks iedereen zijn eigen elektronische hulphond. Zijn eigen EHH. Aangepast aan zijn eigen niveau. Dementerende ouderen hebben dan een EHH die voortdurend naar hen luistert, hen min of meer begrijpt en weet hoe te reageren. Filosofen een EHH, die met ze meedenkt, corrigeert en indien gewenst, orde in de conceptuele chaos aanbrengt. Wellnessmoeders een spiriwiri lifecoach. Elk kind een vriendelijk, speels denkend vriendje dat ook iets van een wijze ouder heeft. En dan maar hopen dat al die EHH-en geen deel uit maken van een Big Brother-systeem. Maar wat dat laatste betreft, heb ik, wellicht samen met mijn toekomstige EHH, een hard hoofd in.

Beantwoorden
- Robert Kruzdlo zegt
  
  23 februari 2024 om 11:26
  
  Daarnaast blijft het organisme mens, zichzelf organisch, neurologisch en fysisch regelen, geeft het brein zijn eigen antwoord op wat de mens in elkaar frunnikt, denkt dat hij is, droomt, beleeft. Goddank zal het brein overleven.
  
  Beantwoorden
Hennie zegt

22 februari 2024 om 12:35

Het schrijven van betekenisvolle proza of poëzie is een vak, ‘prompt engineering’ ook. Wellicht glijden die twee ambachten naar elkaar toe.

Beantwoorden