Door Marc van Oostendorp
Het gaat de laatste tijd in de kringen waarin ik verkeer over bijna niets anders dan over GDPR, de General Data Projection Regulation van de EU die eind deze maand van kracht wordt en die u niet alleen moet vrijwaren van Mark Zuckerberg, maar ook van wetenschappelijk onderzoek.
Mijn Antwerpse collega Reinhild Vandekerckhove vertelde er onlangs een indrukwekkend verhaal over tijdens een workshop. Reinhild doet al geruime tijd onderzoek naar de taal van de jeugd in Vlaanderen. Wanneer je wil weten hoe het onder die mensen aan de hand is, wil je natuurlijk het liefst weten hoe zij praten onder elkaar zijn, en er geen volwassene in de buurt is. Al is het maar omdat je wil voorkomen dat ze zich bewust of onbewust aanpassen.Moeilijk
De laatste jaren lijkt dat gemakkelijker te worden: jongeren communiceren veel via WhatsApp, Messenger en andere apps met elkaar, en die apps slaan de gesprekken op. De jongeren hoeven ze alleen maar aan je door te geven, en je hebt zo bergen materiaal dat je eindeloos kunt bestuderen. Bovendien kun je dat materiaal bewaren om te vergelijken met hoe jongeren over tien of twintig jaar of honderd jaar zullen praten. Lang leve het digitale tijdperk.
Reinhild is dan al meer dan tien jaar bezig met dit onderzoek. Maar de GDPR, en de consequenties die haar universiteit eraan verbindt, gaan het haar enorm moeilijk maken.
Geen boodschap
Van het bewaren van gegevens kan in de eerste plaats geen sprake meer zijn. Je moet persoonlijke gegevens altijd op zeker moment vernietigen. Reinhild heeft dat in haar geval weten uit te stellen tot het moment van haar pensioen, en dat duurt gelukkig nog lang, maar toekomstige generaties zullen dus niet kunnen weten hoe Vlaamse jongeren met elkaar spraken in onze tijd.
Tot die tijd mogen alleen Reinhild en haar medewerkers naar de gegevens kijken. Dat is natuurlijk in tegenspraak met de wetenschappelijke wens om data zoveel mogelijk te delen, om onder collega’s te kunnen controleren of iemand wel de juiste conclusies uit de gegevens trekken. Maar daar heeft de EU geen boodschap aan.
Slot en grendel
Er zijn meer tegenstrijdigheden: zo moet alle data volkomen geanonimiseerd worden, maar tegelijkertijd moeten mensen die gegevens hebben bijgedragen op ieder moment hun eigen woorden uit de database kunnen laten verwijderen. Alleen: hoe vind je die data als ze helemaal anoniem zijn? En hoe anonimiseer je honderdduizenden woorden als jongeren namen op allerlei onvoorspelbaar expressieve manieren schrijven (Soooooffieeee!)
Het is al met al bijna onmogelijk om dit soort onderzoek nog te doen. Reinhild begrijpt dat het nodig is om gegevens die jongeren haar doodgemoedereerd geven – het gaat soms om intieme gesprekjes, ook over anderen. Maar moet dat nu allemaal echt helemaal achter slot en grendel?
Jona Lendering zegt
Ik vind het eigenlijk heel prettig dat neerlandici over deze dilemma’s nadenken. Lang niet alle wetenschappers hebben in de gaten dat wetenschap één belang is onder vele.
R. van Dongen zegt
Dit is een interessant artikel, als is het alleen maar omdat je haast nieuwsgierig word hoe deze data verzameld word.
“De jongeren hoeven ze alleen maar aan je door te geven, en je hebt zo bergen materiaal dat je eindeloos kunt bestuderen.”- ik kan me haast geen enkele reden bedenken waarom jongeren hun chats door zouden geven, en zelfs als ze dat doen dan is er nog de uitdaging dat de tegenpartij niet expliciet ingestemd is.
Benieuwd hoe het verloop van dit onderzoek gaat zijn, en ook benieuwd hoe er ge-checked kan worden of je bijvoorbeeld al in de database staat van deze onderzoeksgroep.
WebredMiet zegt
Ik begrijp het probleem niet goed. Als transparant is welke gegevens gebruikt worden en waarvoor, als de rest geanonimiseerd wordt èn de jongeren hun expliciete toestemming hebben gegeven, waar zit de knoop dan precies? Want dat is waar GDPR over gaat. Plus: er is nog een hele hoop onduidelijk over hoe die regels in de praktijk moeten worden toegepast, voor alle sectoren.
Dat die gegevens alleen toegankelijk zijn voor Reinhild Vandekerckhove en haar team, dat is als ik me niet vergis al van in het begin van het project het geval, dus daar heeft gdpr helemaal niets mee te maken.
Als (amateur-)verzamelaar van taalgegevens èn als leverancier van taaldiensten (en dus bezitter van persoonlijke klantgegevens) ben ik ook vrij intensief bezig met die gdpr-toestanden. Ik weet er dus wel iets van, genoeg om te weten dat er nog heel veel vragen zijn, dat die onduidelijkheden niet gaan opgelost worden tegen 25 mei en dat de sleutelwoorden ’transparantie’ en ‘expliciete toestemming’ zijn. Als jullie meer weten, dan lees ik dat heel graag.
Lucas zegt
Waarom gaat het om jongeren? De regeling is toch bescherming van persoonsgegevens in brede zin, van 18 tot 80? Wat maakt het probleem uniek voor jongerentaal?
Verder vertelt Google mij dat er provisies zijn waardoor je als wetenschapper gegevens wel mag bewaren en de impact minder is: https://iapp.org/news/a/how-gdpr-changes-the-rules-for-research/. Er lijkt genoeg ruimte te zijn voor de wetenschap om data te bewaren, inclusief persoonsgegevens, zolang dat maar op een technisch adequate manier gebeurt (dingen als beveiligde externe harde schijf of USB-stick bijvoorbeeld).
Als leek heb ik nu dus vooral vragen.
Marc van Oostendorp zegt
Het probleem is niet uniek voor jongerentaal, al zitten er daar nog wel wat extra twists aan (bijvoorbeeld dat de ouders toestemming moeten geven). Verder: er zijn inderdaad allerlei provisies voor wetenschap. Misschien is het probleem tijdelijk, in de zin dat juridische afdelingen van universiteiten de regels nu superconservatief interpreteren, maar ik hoor van verschillende kanten en verschillende universiteiten dat dit dus wel gebeurt.
WebredMiet zegt
Dus het probleem is niet de GDPR en ‘Europa’ op zich, maar de manier waarop die juridische diensten de regels nu interpreteren. Dat is wat anders. Niet abnormaal overigens, in ‘mijn wereld’ krijg je ook de meest uiteenlopende reacties en maatregelen, van paniekerig ‘ik ga alles beveiligen wat maar van ver op persoonlijke gegevens lijkt’ tot ‘och, mij zullen ze niet snel controleren, ik wacht wel af tot de eerste boetes vallen.’ Zodra die juridische diensten ontdekken dat het zo’n vaart niet loopt, zullen de teugels wel weer wat gevierd worden. Hoop ik toch.
Lucas zegt
Dat ouders toestemming moeten geven lijkt me doodnormaal en ik mag hopen dat dat nu ook al een regel is. (Van wat ik zie bij collega’s is dat ook zo).
Maar goed, het moet dus aangekaart worden bij universiteiten; de verantwoordelijkheid ligt hier niet bij de EU.
Berthold van Maris zegt
Is het maatschappelijk belang van dit onderzoek groter dan het belang van de privacy van mensen? Dat is hier de cruciale vraag, waar de collumnist helaas niet op in gaat.
Hoe Romeinse jongeren in het jaar 65 na Christus met elkaar spraken weten we ook niet. Hoe erg is dat? Willen we naar een taalwetenschap waarin álles interessant is en álles onderzocht moet worden?
Marc van Oostendorp zegt
De columnist beantwoordt die vraag niet, maar maakt natuurlijk wel duidelijk dat die vraag er is. Dat lijkt deze columnist in dit geval voldoende, over het belang van dat onderzoek valt veel te zeggen: welk onderzoek is er sowieso écht belangrijk? Het belang van ‘de privacy van mensen’ is vaak overigens ook enigszins overtrokken. Het gaat hier over vrijwillig afgestane bestanden, waarvan duidelijk is dat ze in een database komen voor onderzoek. De deelnemers kunnen zelf selecteren wat ze te gevoelig vinden of wat niet. Ik ken ook projecten waarin mensen worden opgeroepen om mee te doen, om zichzelf op te nemen en waarin zij dat doen omdat ze het leuk vinden om hun eigen dialect voor het nageslacht te bewaren. Dan nog gelden echter al die regels.
Ik zou best graag willen weten hoe Romeinse jongeren in het jaar 65 na Christus met elkaar spraken en in het algemeen lijkt mij inderdaad dat alles interessant is, en vooral: dat het onmogelijk is om objectieve criteria te bedenken voor wat interessant genoeg zou zijn om te onderzoeken.
Berthold van Maris zegt
Geldt hier niet, zoals Thomas a Kempis al eens in ongeveer vergelijkbare woorden zei: Wie alles interessant vindt, vindt niets interessant.