Op het Meertens Instituut moesten we vroeger altijd een beetje gniffelen als er weer een bobo van het Hoofdbureau langskwam om ons te vertellen dat de digitalisering ‘revolutionaire nieuwe inzichten’ in ons onderzoek ging bieden (en dat we zo snel mogelijk zoveel mogelijk geld hiervoor binnen moesten zien te slepen). Natuurlijk gebruikten we de computer als hulpmiddel, maar dat had geen invloed op onze fundamentele onderzoeksvragen: de computer hielp ons alleen om betere en diepere antwoorden te vinden, maar ‘revolutionair nieuw’, neuh.
Maar nu is er dan Chattie, zoals ik hen familiair noem, doopnaam ChatGPT. Wat of wie Chattie is, leg ik hier niet uit: wie dat nu nog niet weet, heeft de laatste weken onder een steen geleefd en zal dit stukje niet uitlezen.
Wat Chattie kan is verbazingwekkend. Iedereen kent de hallucinante ‘dialogen’ met chatbots van klantenservices, die als enige resultaat hebben dat je, twijfelend aan je verstandelijke vermogens, wanhopig telefonisch contact zoekt met een mens. Hoe de wereld vandaar in één stap tot Chattie is gekomen, is me een raadsel. Chattie lijkt namelijk in niets op die chatbots. Terwijl die chatbots niet verder komen dan het ad nauseam herhalen van een woord uit de gestelde vraag, geeft Chattie op iedere vraag een uitgebreid antwoord dat, in ieder geval op het eerste gezicht, redelijk to the point lijkt.
Belofte
Om te bezien wat Chattie vermag, heb ik hem een aantal lexicografische en etymologische vragen gesteld. Stel, je zoekt een synoniem voor een bepaald woord. Kan Chattie je daarbij helpen?
De suggesties van Chattie zijn interessant, met name omdat ze afwijken van wat de vele Nederlandse synoniemenwoordenboeken op internet noemen; daar vind je voor belofte synoniemen als eed, erewoord, gelofte, toezegging, verbintenis en woord. Dat maakt erg nieuwsgierig naar de onderliggende data van Chattie, maar daar kunnen gebruikers helaas niet bij. Hoe dan ook: Chattie biedt nieuwe alternatieven, waar je als gebruiker je voordeel mee kunt doen.
Ook een vraag over woordverbindingen weet Chattie te pareren:
Het antwoord is vrij adequaat maar niet foutloos: doen, breken, houden en nakomen worden inderdaad het vaakst gecombineerd met belofte. Een belofte maken is echter een letterlijke vertaling uit het Engels voor wat in het Nederlands een belofte doen heet, maar – daar heeft Chattie wel een punt – dat anglicisme komt inderdaad in het Nederlands voor. Wat ik niet (her)ken is een belofte weigeren. Daarentegen heeft Chattie het normale een belofte afleggen gemist, net als een belofte inhouden (voor de toekomst) – terwijl dat zo mooi de positie van Chattie samenvat…
Politiek correct
Van hun meest betuttelende zijde betoont Chattie zich in de toevoeging hierboven: ‘Het is belangrijk om beloften serieus te nemen en ze na te komen, aangezien ze vaak gebaseerd zijn op vertrouwen en integriteit.’ Dat Chattie is doordrenkt van politieke correctheid, bleek me toen ik Chattie om advies vroeg naar aanleiding van mijn Etymologica van 26 december over moraalridder en fatsoensrakker. Desgevraagd definieerde Chattie fatsoensrakker als volgt:
De beschrijving begint en eindigt met het zogenaamd beledigende karakter van het woord fatsoensrakker dat moedertaalsprekers volgens mij niet voelen: de keuze voor rakker – een woord uit de kindertaal – geeft de samenstelling een spottende en verzachtende lading. Bovendien verslikt Chattie zich in de definitie: ‘iemand beschrijven als iemand die zich niet aan de regels houdt’, en dat dan in verschillende bewoordingen herhaald: een menselijke lexicograaf komt met zo’n onheldere definitie niet weg.
Ook de bedillerige toon waarop het computeralgoritme in de laatste zin vertelt dat het beter is op een respectvolle en beleefde manier met anderen om te gaan, werkt op de lachspieren, in ieder geval bij mij. De makers van Chattie hebben bewust politieke correctheid ingebouwd, om zo het debacle te voorkomen dat het einde betekende van IBM’s supercomputer Watson: Watson nam van internet namelijk binnen de kortste keren de explicietste vloeken en scheldwoorden over, en gebruikte die vrijelijk in al zijn dialogen. Dat wilden de makers van Chattie voorkomen maar daarbij zijn ze doorgeschoten naar de andere kant: Chattie plaatst zoveel waarschuwingen over potentieel ongepast of discriminerend taalgebruik, dat het gebruikers op ideeën brengt waar ze uit zichzelf nooit op zouden zijn gekomen (a dirty mind is a joy forever).
Associëren
Wat in de beschrijving van fatsoensrakker verder opvalt zijn de wijdlopige formuleringen en herhalingen van telkens hetzelfde in andere bewoordingen – dat is trouwens een van de redenen waarom ik hen ‘Chattie’ heb gedoopt. Samenvatten van de hoofdgedachte is niet Chatties ding. Hierdoor komt de informatie vaak onbeholpen over, alsof ze is opgeschreven door een onervaren schrijver.
Soms schemert ook de ontstaansgeschiedenis van de omschrijvingen door in het taalgebruik. Chatties teksten komen namelijk tot stand op basis van frequentie: Chattie kiest telkens als volgende woord het meestgebruikte woord uit de enorme berg aan data waarover hun beschikt. Dat zie je duidelijk aan Chatties antwoord op de vraag wat een scheve schaats rijden betekent. Op 9/12 luidde het antwoord:
“Een scheve schaats rijden” is een uitdrukking die wordt gebruikt om te verwijzen naar het handelen op een onethische of onfatsoenlijke manier. Het suggereert dat iemand zich op glad ijs bevindt en moeite heeft om zijn evenwicht te bewaren, wat kan leiden tot valpartijen of andere problemen. Dus, als iemand wordt beschuldigd van “een scheve schaats rijden,” betekent dit dat hij of zij wordt beschuldigd van onethisch of onfatsoenlijk gedrag.
Je ziet direct de associaties: schaatsen > ijs, glad, valpartijen… Maar Chattie heeft de overdrachtelijke betekenis van de uitdrukking niet helemaal gemist. Vreemd genoeg deed hen dat wél toen ik dezelfde vraag op 19/12 opnieuw stelde. Toen luidde het antwoord namelijk:
“Een scheve schaats rijden” betekent dat je op een onstabiele of ongebalanceerde manier op schaatsen bent. Dit kan bijvoorbeeld gebeuren als je op één been staat of als je niet in staat bent om rechtuit te blijven rijden. Het kan ook betekenen dat je onhandig of onbeholpen op schaatsen bent. Het uitdrukking kan ook gebruikt worden om iemand te beschrijven die niet goed op zijn of haar benen staat of die moeite heeft met het behouden van het evenwicht.
Chattie verzint dus op dezelfde vraag telkens een ander antwoord – het lijkt wel een mens! Dit is echter wel een groot bezwaar als je Chattie ooit wilt citeren in een artikel. Zover zijn we nu misschien nog niet, maar ik sluit niet uit dat het eens zover komt. Tegen die tijd moeten we overigens wel veel meer weten over de bronnen van Chattie. De onvoorspelbaarheid van Chattie is voor scholieren en studenten ongetwijfeld een pre: een hele klas kan dezelfde vraag aan Chattie stellen, en iedere leerling krijgt dan een ander antwoord. Arme docenten…
Etymologie
Een prangende vraag voor mij is natuurlijk of ik als etymoloog nog toekomst heb, of dat ik mij moet omscholen omdat Chattie mij overbodig heeft gemaakt. Daarom heb ik Chattie gevraagd: Wat is de herkomst van “fatsoensrakker”? Het antwoord stelde me gerust:
Het woord “fatsoensrakker” is afgeleid van het Nederlandse woord “fatsoen,” wat “decency” of “propriety” betekent in het Engels. Het woord “rakker” is een verkleinwoord van het Nederlandse woord “raken,” wat “to touch” betekent in het Engels. Samen betekent “fatsoensrakker” letterlijk “little toucher of propriety,” of iemand die zich bezighoudt met het handhaven van fatsoenlijk gedrag en het tegengaan van onfatsoenlijkheid. De herkomst van het woord “fatsoen” is onduidelijk, maar het kan mogelijk worden teruggevoerd op het Latijnse woord “fas,” wat “divine law” betekent.
Hier is Chatties fantasie wel erg met hen op de loop gegaan, door als een hedendaagse Goropius Becanus een relatie te leggen tussen rakker en raken.
Humor
En hoe zit het met overdrachtelijke betekenissen? Al in 1978 formuleerde Hugo Brandt Corstius immers als eerste wet van de ‘Computer-taalkunde’: ‘Wat je ook doet, de semantiek gooit roet’. Kan Chattie omgaan met niet-letterlijke betekenissen? De beste manier om dat te testen is om Chattie te vragen een mop te tappen, want moppen draaien om woordspelingen en onverwachte betekenisrelaties. Dus ik vroeg Chattie: vertel een mop over een poes. Het resultaat is absoluut hilarisch, maar dan vanwege het totale gebrek aan humor in Chatties antwoorden.
Chattie antwoord 1: Hier is een korte mop over een poes:
Waarom was de poes zo dol op verjaardagsfeestjes?
Omdat ze dan lekker de kaarsjes kon uitblazen!
Chattie antwoord 2:
Waarom was de poes zo verbaasd toen ze een stukje kaas zag liggen?
Omdat ze dacht dat alle kaas in de koelkast zat!
Chattie antwoord 3:
Waarom zat de poes op het dak?
Omdat hij zijn muis had verloren!
Chattie antwoord 4:
Waarom was de poes zo blij toen hij een leeuw tegenkwam?
Omdat hij eindelijk iemand had gevonden om mee te spelen!
It boggles the mind! Ik zou echt dolgraag inzicht wil hebben in het achterliggende algoritme om enige chocola te kunnen brouwen van de manier waarop deze ‘humoristische’ antwoorden tot stand zijn gekomen… Maar wie weet proesten Chattie en zijn vriendjes het ondertussen in een digitaal parallel universum wel uit van het lachen om deze kapitale grappen.
Workflow
Na al dat gekat van mij op die arme Chattie lijkt het epitheton ‘revolutionair’ misschien niet gepast. Toch verdient hen dit, volgens mij. Wat Chattie aan ondersteuning biedt is ongekend. En we hebben het nu over kleine Chattie 1.0: Chattie is nog lang niet volwassen. Terwijl we elkaar pas twee weken kennen, heb ik hen al opgenomen in mijn workflow, samen met Google Translate en allerlei corpusapplicaties. De resultaten bekijk ik uiteraard met de nodige menselijke achterdocht. Ondertussen heeft Chattie al goede diensten bewezen. Zo moest ik voor een internationaal anglicismenproject onderzoeken of het Nederlands bepaalde leenvertalingen uit het Engels kent, bijvoorbeeld voor chain hotel. Mij zei het niets en woordenboeken en GoogleTranslate lieten verstek gaan, maar Chattie wees mij de weg naar ketenhotel, waarvan Google het gebruik in het Nederlands bevestigt.
Chattie is dus zeker waardevol, zolang een gebruiker de suggesties van Chattie controleert op basis van gegevens uit real life. Maar daar zit wel een voetangel. Hoe kunnen we menselijk taalgebruik onderzoeken en onderscheiden van automatisch gegenereerde tekst, als het internet straks overstroomt raakt van door Chattie gegenereerde teksten? Die vraag heb ik maar eens gesteld aan Chattie. Chattie ziet de toekomst zonnig in, en toont opmerkelijke zelfkennis:
Zelf denk ik dat het computergegenereerde taalgebruik van Chattie en het menselijke taalgebruik op termijn naar elkaar toe zullen groeien, met als gevolg dat beide varianten zullen veranderen. Zoals ook de sociale media en texting het menselijke taalgebruik aantoonbaar beïnvloeden. Voer voor de volgende generatie historisch-taalkundigen.
Gert Rijlaarsdam zegt
Wat een prettig en mooi onderzoekend stukje!
Nicoline van der Sijs zegt
Dank je, Gert!
Ine Sijben zegt
Ben ik nou gek of klopt Chatties definitie van ‘fatsoensrakker’ voor geen meter? Niemand opgevallen?
Ina Schermer zegt
Volgens mij is de definitie van Chattie van ‘fatsoensrakker’ nogal onjuist. Dat is iemand die zich er op laat voorstaan zich juist wel aan fatsoensnormen en regels te houden en daarmee anderen irriteert omdat het twijfelachtig is of hij dat inderdaad doet.
Nicoline van der Sijs zegt
Beste Ine en Ina, Klopt hoor, de definitie van Chattie is onjuist, ik was daar misschien te impliciet in.