Of de verspilling van wetenschapsgeld en vrijwilligersinzet

Data verdwijnen soms van de ene op de andere dag van internet. Vaak gaat het dan om data van particulieren die niet langer in staat zijn een website in de lucht te houden. Maar het overkomt ook institutionele data, die met veel moeite en energie zijn gedigitaliseerd zodat iedereen ervan kan profiteren. De lotgevallen van de Vragenlijstenbank van het Meertens Instituut vormen hiervan een wrang voorbeeld.
De vragenlijsten
Toen ik rond 2010 op het Meertens Instituut ging werken, kreeg ik voor het eerst inzicht in de honderden (227 om precies te zijn) vragenlijsten die tussen 1931 en 2005 door dit instituut waren uitgezonden naar informanten, verspreid over de Lage Landen. Op maar liefst 15.638 vragen over dialectgebruik, volksgebruiken en namen hadden informanten gedetailleerde, handgeschreven antwoorden gegeven. Het in kaart brengen van de taal- en cultuurvariatie in Nederland was in 1930 dan ook de reden geweest om het zogeheten Dialectenbureau op te richten. Generaties taalkundigen hadden ijverig vragenlijsten opgesteld en rondgestuurd. Het resultaat mocht er zijn: wat een prachtig materiaal, wat een weelde aan informatie! En wat jammer dat niet iedereen – onderzoekers, dialectsprekers, belangstellenden – daarvan kennis kon nemen!
Digitalisering
Nu was de academische wereld net op dat moment doordrongen geraakt van het belang van open access en citizen science. Hier lagen mogelijkheden. Kortom: toen ik aan toenmalig directeur Hans Bennis voorstelde binnen het instituut een project ‘Vragenlijstenbank’ op te zetten, viel dat direct in goede aarde. Het kostte een paar centen, maar dan had je ook wat. Het idee was de scans van alle vragen en antwoorden op te nemen in een openbaar toegankelijke ‘Vragenlijstenbank’, en bovendien de antwoorden geleidelijk digitaal doorzoekbaar te maken.
Om te beginnen werden de microfiches die in de jaren tachtig gemaakt waren van de antwoorden op 148 vragenlijsten omgezet naar scans. Dat microficheproject was uitgevoerd onder leiding van onderzoeker Jan Berns en op kosten van de KNAW. Vervolgens liet bibliothecaresse Lidy Jansen de overgebleven papieren vragenlijsten scannen door een gespecialiseerd bedrijf.
Citizen science
Voor het overtikken van de antwoorden van de scans was mankracht nodig, veel mankracht. De computer kon de handgeschreven antwoorden (nog) niet lezen. Via nieuwsbrieven werden vrijwilligers opgeroepen mee te werken aan het overtikwerk. Door hun werk maakten ze kennis over hun lokale dialect en lokale tradities beschikbaar voor volgende generaties, zo vertelden we ze. De oproep had succes, en via het platform van VeleHanden besteedden meer dan 550 deelnemers duizenden uren aan het zorgvuldig overtikken van de soms slecht leesbare gegevens.
In januari 2020 was het dan zover: de eerste versie van de Vragenlijstenbank werd met de nodige tamtam gelanceerd. Op dat moment bevatte de Vragenlijstenbank alle ooit gestelde vragenlijsten en vragen, de scans met handgeschreven antwoorden van 25 vragenlijsten (in totaal 27.799 scans) en de overgetikte, doorzoekbare antwoorden van 6 vragenlijsten. Alle antwoorden waren uiteraard geanonimiseerd, dus de namen en adressen van informanten waren weggelaten of zwartgemaakt.
Via de Vragenlijstenbank kon iedereen vinden welke dialectbenamingen er bijvoorbeeld zijn voor het begrip hond, en welke gebruiken of bijgeloof er rond honden spelen. Zo bleek men in sommige regio’s te geloven dat het voor een zwangere vrouw ongeluk brengt als ze een hond schopt. En natuurlijk vind je er informatie over de vraag waar boeren de nageboorte van het paard in een boom hangen, verbranden of begraven: een kwestie die Voskuil in Het Bureau langdurig bezighield.
De Vragenlijstenbank kreeg een warm onthaal in de pers, en ook de volgende directeur, Antal van den Bosch, investeerde in de uitbreiding ervan. Daardoor kon in de daaropvolgende jaren dankzij het harde werk van de vrijwilligers een reeks nieuw overgetikte antwoorden toegevoegd worden. Nadat ik was weggegaan bij het Meertens Instituut, nam Etske Ooijevaar de coördinatie over.
Gebroken beloftes
Een succesverhaal van de open science, zou je denken. Maar wie nu naar de Vragenlijstenbank surft, stuit op de mededeling ‘Let op: vanaf juni 2025 is de Vragenlijstenbank niet meer zomaar toegankelijk.’ Alle data blijken achter slot en grendel te staan, zelfs het overzicht van de vragen en vragenlijsten. Navraag leert dat de redenen hiervoor zijn het toenemende risico op een datalek en potentiële AVG-kwesties.
Huh?! Welke AVG-risico’s lopen geanonimiseerde data van tientallen tot honderd jaar oud, aangeleverd door informanten die de term AVG niet kenden maar vrijwillig hun namen en gegevens opschreven, er trots op waren zich ‘correspondent’ van het Dialectenbureau of het P.J. Meertensinstituut te mogen noemen, die bij openbare bijeenkomsten hun gegevens bespraken en deelden, en hun namen doorgaven voor de jaarverslagen van het instituut. Lees er Jo Daans Geschiedenis van de dialectgeografie uit 2000 maar eens op na.
Het offline halen van de Vragenlijstenbank laat zien dat het promoten van open science niet heel serieus wordt genomen, of in ieder geval moet wijken voor ‘potentiële’ AVG-kwesties. Het klinkt als zorgvuldigheid, maar lijkt voort te komen uit onnodige angst. Angst die het harde werk van heel veel mensen onzichtbaar maakt. En hoe staat het met de belofte van het Meertens Instituut aan de vrijwilligers dat hun werk voor volgende generaties beschikbaar komt?
Als initiatiefnemer zou ik graag zien dat het werk van onderzoekers en vrijwilligers en het al geïnvesteerde overheidsgeld niet voor niets zijn geweest. Als het Meertens Instituut het niet aandurft, is er misschien een andere instantie die de Vragenlijstenbank wél wil voortzetten.
Gebrek aan moed bij de wetenschap en kwaadwilligheid bij de politiek. Blijf je er tegen verzetten!
Helemaal mee eens Nicolien. Ik heb trouwens ook al tijden niets meer gehoord van de eveneens op kaartjes genoteerde veldnamen.
Van harte mee eens. Er zijn mogelijkheden genoeg om deze databank toegankelijk te maken. Ik ben niet zo thuis bij de overheid waaronder het Meertensinstituut valt. Op gemeentelijk niveau was toestemming van het College van B&W voldoende.