In dit jubileumjaar vertellen bekende DBNL-gebruikers over een schat die zij gevonden hebben in de DBNL. Deze maand Mike Kestemont van de Universiteit Antwerpen, die DBNL-teksten gebruikt heeft om te onderzoeken wie de auteur van het Wilhelmus zou kunnen zijn.
‘Mijn schat in de DBNL is de grote hoeveelheid middeleeuwse literatuur. Die verzameling is uniek, andere landen hebben zo’n overzicht helemaal niet. De dekkingsgraad is ook heel hoog, bijna alles staat erin. Voor mij en mijn vakgenoten is dat fantastisch. Ik werk namelijk veel met computertechnieken en heb dus digitale teksten nodig.
Mijn werk richt zich op de stylometrie, waarbij de schrijfstijl van teksten wordt onderzocht met de computer. Ik richt me daarbij specifiek op auteursherkenning en probeer met behulp van algoritmes anonieme teksten toe te schrijven aan auteurs. Zo heb ik bijvoorbeeld samen met collega’s uit Amsterdam en Utrecht in 2016 onderzoek gedaan naar het Wilhelmus. Dat is een anonieme tekst, maar er waren heel veel hypotheses over wie de auteur zou kunnen zijn. We hebben toen met behulp van de DBNL een corpus teksten samengesteld van schrijvers die ooit genoemd waren als mogelijke auteur, van bijvoorbeeld Philips van Marnix van Sint Aldegonde en Coornhert. Ter controle hebben we ook teksten toegevoegd van auteurs die nog nooit met het Wilhelmus in verband waren gebracht. Van theoloog Pieter Datheen bijvoorbeeld, die eerst bevriend was met de Oranjes, maar later niets meer met hen te maken wilde hebben. We lieten het algoritme los op de teksten en tot onze verbazing kwam hieruit naar voren dat deze voor ons onbekende Datheen de vermoedelijke schrijver is. Dit terwijl niemand aan hem dacht.
Het leuke aan de DBNL is dat er dus ook teksten van auteurs als Datheen in staan, er wordt zonder vooroordelen gedigitalisee rd. We zijn heel bevoorrecht dat wij zoiets in ons taalgebied hebben. Zo’n onderzoek zou in andere talen namelijk helemaal niet mogelijk zijn op dit moment.
Het zou voor mij als onderzoeker wel fijn zijn als ik niet altijd een browser nodig had om teksten te vinden. Ik zou wel een API willen toevoegen, een zogeheten application programming interface. Dan kan ik gewoon zeggen ‘geef me alle teksten van na 1550 en voor 1600’ en dan krijg ik die. Nu moet ik gaan zoeken op de site. Oftewel: ik zou de databank meer complex willen kunnen ondervragen. Verder wil ik de DBNL graag houden zoals ze is, gestaag uitbreidend. We mogen echt trots zijn op zo’n interessant project.’
Mike Kestemont doceert digitale tekstanalyse aan de Universiteit Antwerpen. Hij promoveerde op een proefschrift over auteursherkenning in Middelnederlandse epiek. Zijn huidige onderzoek richt zich op toepassingen van kunstmatige intelligentie in de studie van de letterkunde. Recent verscheen zijn eerste roman De zwarte koning bij uitgeverij Lannoo (2019). Over het onderzoek naar het Wilhelmus en het vermoedelijke schrijverschap van Datheen hield hij in 2016 de Louis Peter Grijp-lezing.
Laat een reactie achter