Open Source-neerlandistiek

Door Marc van Oostendorp

Dat het door het internet mogelijk is geworden, is niet de enige reden waarom wetenschappelijke publicaties anders moeten. Natuurlijk, we kunnen nu gratis onze artikelen ter beschikking stellen van iedereen die ze wil lezen; en dat moet ook zo snel mogelijk gebeuren. Ook met al gepubliceerd werk. En zonder dat onderzoekers duizenden euro’s per te publiceren artikel moeten betalen.

We zijn ook wel op weg naar die toekomst. De ‘belangrijke partijen’ – ja, zo heet dat: de universiteitsbesturen en de politiek en zo – vinden het allemaal ook. Maar eigenlijk is het natuurlijk nog lang niet genoeg.

We zouden bijvoorbeeld ook nu eens uit het eigenaardige kader van ‘het artikel’ kunnen stappen. Ook op dit moment zitten overal ter wereld onderzoekers inleidingkjes en conclusietjes te formuleren bij artikelen; niet omdat ze zoveel inleidends of concluderends te zeggen hebben; niet omdat behalve de beoordelaars voor de redactie iemand die honderdduizenden inleidingen en conclusies leest – iedereen stoomt onmiddelijk door naar de hoofdmoot van het artikel, want niemand heeft tijd voor al dat geklets. En toch worden die al die dingen geschreven, omdat je nu eenmaal ‘artikelen’ moet publiceren in ’tijdschriften’.

Aan de slag

Bovendien verdwijnt achter de gladgepoetste oppervlakte van die artikelen van alles wat je eigenlijk zou willen weten. Wat heeft de onderzoeker precies nog meer overwogen, maar verworpen? Hoe zien alle gegevens eruit die ze heeft onderzocht, in plaats van alleen de selectie die ze laat zien?

Het is al een oud idee, maar onlangs verscheen er een aardig artikel in het tijdschrift Slate waarin ervoor werd gepleit dat onderzoekers al hun materiaal documenteren: de computerscripts die ze schrijven om de gegevens te analyseren; die gegevens zelf; hun oorspronkelijke hypothesen; de manier waarop deze eventueel moesten worden bijgesteld, enzovoort. De bezoeker op zo’n website hoeft dan niet alleen kennis te nemen van iemands bevindingen, maar kan het ook allemaal zelf nakijken, narekenen en naberedeneren. En hij kan eventueel ook zelf met dat werk aan de slag.

Pleidooi

De schrijver in Slate verwijst naar de zogeheten open source-beweging onder programmeurs, die al hun in programmeertaal gestelde programma’s openbaar maken, niet alleen de versies die je kunt kopen en op je computer laten draaien. Je kunt die computerprogramma’s dan kopiëren en veranderen, er je eigen versies van maken of ze integreren in nog veel ingewikkeldere programma’s. Open source-programma’s zijn daarom gratis, al kan iemand ze in sommige gevallen ook verbeteren en dan verkopen.

Het maakt het ook makkelijker voor niet-professionele wetenschappers om mee te doen. Ze hoeven niet alleen artikelen te lezen, ze kunnen ook met onze gegevens aan de slag, en met de programma’s die we maken. (Rosanna Hertzberger had daar onlangs een interessant pleidooi voor.)

Kleiner

Wat de schrijver in Slate gek genoeg niet meldt is dat wat hiervoor nodig is al bestaat. Althans, hij noemt wel een wetenschappelijk project (The Reproducibility Project) dat doet wat hij wil; maar hij zegt er niet bij dat dit project draait op een site waarop iedereen nu al datgene kan doen wat nodig is: het Open Science Framework. Je kunt er gratis een account aanmaken, en dan kun je al je werk gaan publiceren. Ik heb een paar dagen geleden een account aangemaakt; er staat nog niks op, maar ik beloof dat ik daar wat aan ga doen.

Hiermee zijn we er natuurlijk nog niet. Er moet ook iets aan de cultuur veranderen, waardoor onderzoekers niet bang zijn om alles te delen omdat anderen dan met hun resultaten ervandoor gaan en roem en eer verwerven. Ieder klein stukje dat je aan de wetenschap bijdraagt moet een mens tot eer strekken. Ook al is dat stukje kleiner dan een artikel.

Gerelateerd

Reacties

Lucas Seuren zegt

4 mei 2017 om 12:43

Het is niet alleen een kwestie van eer, het is ook een kwestie van een systeem dat hier volstrekt niet op is afgesteld. Veel data in de toegepaste taalkunde is enorm privacygevoelig en mag niet zomaar gedeeld worden (dat wil zeggen, inzage is mogelijk, maar publiekelijk delen niet). Onderzoekers en vakgroepen worden beoordeeld op hun output en de impact daarvan: als je gelijk deelt wat je hebt, dan weet je niet of jij de vervolgstap moet doen, of iemand anders, en in welke fase dat onderzoek is. Bovendien, waarom zou een ander er ‘met de roem en eer vandoor gaan’? Het lijkt me niet meer dan logisch dat als iemand anders het materiaal verzamelt en voorwerk doet, je hem/haar daar ook credits voor geeft.

Het is een mooi ideaal dat we onderzoeksmateriaal delen, en natuurlijk zou dat meer kunnen gebeuren, maar het is niet realistisch om te denken dat het überhaupt haalbaar is om alles te delen, noch om dat van de ene op de andere dag te doen.

Tevens, ik lees inleidinkjes en conclusies wel degelijk, dan weet ik namelijk of ik me nog moet gaan verdiepen in de daadwerkelijke analyse. Een goede inleiding biedt het framework waarbinnen je de analyse moet interpreteren.

Beantwoorden