AI herkent emoties in historische brieven

Het Guido Gezellearchief van de Openbare Bibliotheek Brugge werkt samen met het Gezellegenootschap, de KANTL en de UAntwerpen sinds 2017 aan een digitale uitgave van Gezelles brieven. Meer dan 2600 brieven zijn al getranscribeerd en van notities voorzien. Ze zijn te raadplegen via GezelleBrOn en bevatten een schat aan informatie over Guido Gezelle, zijn teksten en gedichten, zijn netwerk en de socioculturele en politieke situatie in de 19de eeuw.
“Maar zou je, naast de vele feitelijke en historische informatie die je uit de brieven kan halen, ook kunnen onderzoeken welke emoties schuilen in de duizenden brieven die Gezelle kreeg van zakenrelaties, leerlingen, biechtelingen, familie en vrienden? Die vraag vormde de aanleiding voor de medewerkers van het Gezellearchief om contact op te nemen met LT3, het Language and Translation Technology Team van de Universiteit Gent.”, vertelt schepen van cultuur Nico Blontrock.
In samenwerking met LT3 werd onderzocht hoe generatieve AI kan helpen om emoties te identificeren in deze 19de-eeuwse briefwisseling. Omdat Gezelles brieven sterk variëren in taal, spelling en stijl, werd eerst een basis gelegd via manuele annotatie. Medewerkers van de bibliotheek labelden bijna 1.500 brieffragmenten met sentiment (positief, neutraal, negatief, gemengd) en met een brede set mogelijke emoties. Op basis van die rijke variatie werd een genuanceerde emotiecategorisatie ontwikkeld, die veel verder gaat dan de klassieke zes basisemoties.
Vervolgens werd onderzocht hoe generatieve AI, zoals ChatGPT, deze historische teksten automatisch kan analyseren. ChatGPT bleek in staat om de 19de-eeuwse taal te ‘standaardiseren’ door de brieven naar het hedendaags Engels te vertalen, zelfs wanneer ze dialectische of verouderde vormen bevatten. Daardoor werden de emoties in de brieven beter herkenbaar. In een tweede stap werd ChatGPT ook rechtstreeks ingezet als emotie-annotator. Met zorgvuldig ontworpen instructies kon het model een brede waaier aan emoties onderscheiden en zo een verrassend genuanceerd emotieprofiel van de brieven produceren. Zo werd per brief berekend welke proportie van de tekst met welke emotiecategorie overeenkomt.
De resultaten van het project werden omgezet in een ‘emotiebarometer’ op gezelle.be. Daar kan de bezoeker de gedigitaliseerde brieven filteren op emotie. Zo krijgt het publiek een nieuwe, intuïtieve ingang tot de collectie en wordt tegelijk de emotionele rijkdom van Gezelles netwerk zichtbaarder. Voor onderzoekers biedt het een kans om emotionele patronen binnen Gezelles netwerk op een nieuwe manier te bestuderen.
“Dit project is een mooi voorbeeld van hoe generatieve AI historische collecties op een vernieuwende manier toegankelijk kan maken.”, besluit de schepen.
Laat een reactie achter