Ben je wetenschapper, en wil je eens goed depressief worden, lees dan het nieuwe boek The science of science van Dashun Wang en Albert-László Barabási (gratis). Althans, de auteurs zelf slaan de enthousiaste toon aan die om Joost mag weten welke reden hoort bij de moderne wetenschap – hoe verfrissend zou het niet zijn om eens een wetenschapper te horen die sceptisch is over de vooruitgang in het eigen vak –, maar dat maakt het er niet beter op, net zo min als de reclamepraatjes die collega’s hebben aangeleverd op de kaft (‘an insightful and comprehensive book’, ‘It’s a book that every boundary breaker, scientist, innovator, investor, and inventor will learn from ‘, dat soort werk).
Maar het is uiteindelijk toch vooral de inhoud van het boek die treurig stemt. Wat Wang en Barabási hebben gedaan: de technieken van big data toepassen op de wetenschap zelf. Wat voor patronen duiken er op als we heel veel gegevens op een rijtje zetten, over publiceergedrag, over citaties, over de manier waarop mensen carrière maken in de wetenschap?
Niemand
Te denken geeft om te beginnen dan dat het hier inderdaad gaat over heel veel data. De figuur hierboven laat zien hoe sterk het aantal wetenschappelijke artikelen is gegroeid. Voor degene die denkt: oh, maar die curve loopt toch niet zo sterk omhoog, zou ik zeggen: kijk naar de Y-as. Het gaat hier om exponentiële groei, iedere eenheid op die as betekent een vermenigvulding met tien. Zoals Wang en Barabási in de toelichting zeggen: de hoeveelheid wetenschappelijke literatuur verdubbelt iedere twaalf jaar.
Met andere woorden: de afgelopen twaalf jaar zijn er ongeveer evenveel artikelen verschenen als in de gehele geschiedenis van de wetenschap daarvoor.
Wie leest dat? Niemand.
Als je, rekenen Wang en Barabási voor, de eerste pagina van ieder artikel die in 2014 in de database Web of Science afdrukt, heb je een berg die bijna zo hoog is als de Kilimanjaro. Alleen de bovenste meter bestaat uit artikelen die meer dan duizend keer geciteerd worden, en de bovenste anderhalve centimeter meer dan tienduizend keer. De top-100 van alle artikelen die op dat moment verschenen zijn werden meer dan 12 000 keer geciteerd – feitelijk nog steeds niet vaak, met de miljoenen artikelen die er in de database staan. Ook het aantal wetenschappers wereldwijd groeit overigens exponentieel.
Een artikel waarvan de eerste pagina in bovenstaand plaatje op de top van de Eiffeltoren ligt, of zelfs van de Burj Khalifa, wordt echter door geen van die wetenschappers gelezen.
Ontdekkingen
Het eigenaardige is dus dat Wang en Barabási alleen maar positief zijn over deze enorme exponentiële groei. Er kan nog veel meer groeien! juichen zijn. Gelukkig is de grondstof van de wetenschap niet iets eindigs zoals olie of metaal, maar het zijn ideeën. En van ideeën bestaat kennelijk een oneindige voorraad.
Waar ze echter niet op ingaan: je kunt niet zeggen dat ons inzicht in de werkelijkheid iedere twaalf jaar verdubbelt. Hebben we, zelfs als we de periode ruimer nemen en de hele 21e-eeuw bekijken, nu dingen geleerd die we voor die tijd niet wisten en die de bevindingen van Galileo, Newton, Grimm, Darwin, Einstein, en die allemaal samen, evenaren? Doet iemand die een geschiedenis van de wetenschap schrijft er goed aan de helft van haar boek te reserveren voor de eenentwintigste eeuw? Ik vind het, nog helemaal los van mijn eigen vak, lastig om zelfs maar één ontdekking te bedenken die in de schaduw van het genoemde kan staan.
Misschien komt dat doordat die grote ontdekkingen nog niet tot mij als lid van het grote publiek zijn doorgedrongen, maar in de eerste plaats sta ik ook als het gaat over de laatste decennia van de twintigste eeuw nog met de mond vol tanden, en in de tweede plaats is er zoveel wetenschapscommunicatie en journalistiek dat toch wel de vraag rijst, waar al die ontdekkingen dan zijn.
Ideeën
De grote bevindingen lijken toch vaak te gaan over technische middelen om iets te bevestigen wat we al vermoeden – een ‘foto’ van een zwart gat, of over toepassingen van de wetenschap. De medische wetenschap heeft bijna 700.000 papers geproduceerd over Covid-19 en dat heeft een aantal kennelijk werkzame vaccins opgeleverd en inmiddels ook al de eerste aanzetten tot medicijnen. Dat is heel fijn, maar het is vooral toegepaste wetenschap. Ik geloof niet dat het ons beeld van wat ziekte is, of wat gezondheid, fundamenteel heeft veranderd.
Anders dan Wang en Barabási geloof ik dat ideeën juist wel schaars zijn. Wel kun je ideeën eindeloos hergebruiken, en ik denk dat dit de exponentiële groei verklaart, en dat het zo bovendien zo ook nog wel een tijd door kan gaan: meer wetenschappers betekent nóg meer papers, een nóg hogere berg met nóg meer artikelen die niemand leest.
Ik denk dan ook dat een science of science, een wetenschapologie, wel degelijk nodig is, maar dat die niet zelf ook weer gebaseerd moet zijn op al die bekende technieken, nóg meer data, nóg meer analyses van die data, maar op pogingen het geheel meer te integreren. En vooral: manieren te vinden om mensen weer op ideeën te laten komen zoals dat in het verleden kennelijk wel lukte.
msvandermeulen zegt
Wat een toeval: in het boek dat ik nu lees, A Tale For the Time Being van Ruth Ozeki, wordt het volgende, zeer toepasselijke citaat van Milan Kundera aangehaald (uit The Book of Laughter and Forgetting): “Once the writer in every individual comes to life, we are in for an age of universal deafness and lack of understanding”.
Jona Lendering zegt
Ik denk dat er wel iets aan te doen valt, namelijk bredere peer review. Dat baseer ik niet op publicaties uit de neerlandistiek, maar uit mijn vakterrein, de oudheidkunde. Als archeologen intensiever zouden kijken naar wat classici produceren en vice versa, zal een zeer groot aantal publicaties worden tegengehouden: ze zijn te beperkt, te klein, en op voorhand irrelevant.
Concrete voorbeelden zijn de publicaties die classici wijden aan papyri zonder dat archeologen eerst het materiële aspect hebben onderzocht. Dat blijken nogal eens vervalsingen. Een ander voorbeeld is de archeoloog die beweerde de keutels van Hannibals olifanten te hebben opgegraven: het kwam keurig door de peer review omdat er geen classicus was die erop attendeerde dat hij bij de verkeerde Alpenpas had lopen zoeken.
Ik weet niet of iets dergelijks mogelijk is in de neerlandistiek (of andere disciplines) maar zou denken dat scherpere peer review wel een hoop onvoldragen publicaties kan tegenhouden.
dominieks zegt
Ik ben het helemaal met je eens, Marc. Helemaal. Een dwang om te schrijven (wanneer zal ‘men’ snappen dat wetenschap geen bedrijf is?) maar een chronisch gebrek aan tijd om te lezen. Veel teksten en massa’s projectaanvragen, weinig echte ideeën. Weinig diepgaande reflectie in artikels ook. Het is bijna komisch, ware het niet dat het tegelijk intriest is.
Maikel Peppelenbosch zegt
Ik denk wel dat we afgelopen decennia elke twaalf jaar een verdubbeling van inzicht in de werkelijkheid hebben gezien. Neem de biologie, in 1950 hadden we eigenlijk nog niets: de incomplete inzichten in evolutie van Darwin maar we wisten zelfs niet welke substantie de erfelijkheid droeg. In de daarop volgende decennia werd het centrale dogma van de biologie ontrafelld, rond 2000 kenden we het volledige genoom en twintig jaar later hebben we min-of-meer dat hele genoom functioneel geannoteerd. Neem de immunologie in 1970 hadden we alleen wat vage Mechnikoviaanse inzichten maar wisten we eigenlijk niks. Er stond in leerboeken dat het zelfs niet duidelijk was of witte bloedcellen een functie had. Nu 50 jaar later begrijpen de immunologie bijna volledig en zijn talloze patiënten geholpen door de deze inzichten. Neem de celbiologie in 1960 hadden we louter de vage tekeningen van Golgi, nu zestig jaar later begrijpen bijna volledig voor alle celtypen in het lichaam welke subcellulaire structuren er zijn en hoe biomoleculen deze bereiken. Zelfs de exponentiele toename van het aantal artikelen in acht nemend, denk dat de hoeveelheid inzicht gegenereerd per wetenschappelijk artikel eigenlijk moet zijn toegenomen. Deze gedachte wordt ook gesteund door bijvoorbeeld een Nature artikel uit 1931 en 2021 met elkaar te vergelijken. De eerste zijn meestal best pruts, terwijl dat nu eigenlijk niet meer voorkomt. Ik denk dus dat de auteur zich geen zorgen hoeft te maken over de toekomst van de wetenschap.
Termorshuizen Cor zegt
Sinds eind jaren 60 zijn er geen grote wetenschappelijke ontwikkelingen geweest. Computers en half geleiders daar gelaten. En nadeel van het automatiserings “geweld” is dat het uitblijven van echte serieuze wetenschappelijke doorbraken niet zichtbaar is.
En nee de snaar theorie is leuk en er gaan heel veel slimme koppen helemaal in op maar leidt wederon niet tot grote wetenschappelijke doorbraken.
Wetenschappelijke stagnatie is waar we nu in zitten en het publiek begint dat de laatste jaren ook te merken.
Het “geloof” in de wetenschappelijke vooruitgang is behoorlijk tanende.
Hierdoor is het perspectief van de mens ah verdwijnen.
DirkJan Vos zegt
Willen we meer, of minder info?
Ik ben geen wetenschapper, of een groot denker, maar ik kan de negativiteit van Van Oostendorp niet goed volgen, maar deel wel t enthousiasme van de auteurs over de exponentiële groei van kennis in de wetenschappelijke wereld. Ik kan dat eenvoudig motiveren, maar eerst tussendoor wat Robbert Dijkgraaf vanmiddag twitterde over een artikel van hem dat vandaag in de NRC verscheen.
@RHDijkgraaf) Tweeted:
Mijn hypothese is dat de pandemie bestaande onderzoeksprojecten heeft versneld, maar de opkomst van nieuwe heeft bemoeilijkt. Kortom, corona was goed voor de gevestigde orde, maar slecht voor alle nieuwkomers – zowel voor mensen als ideeën.
Terug naar waarom ik vind dat er niet genoeg onderzoek, proefschriften en wetenschappelijke artikelen mogen zijn. Van Oostendorp schrijft over die groeiende massa met geleerde gedachten, zinnen en woorden:
Wie leest dat? Niemand.
Marc bedoelt dan – neem ik aan – dat niemand dat /allemaal/ kan lezen, maar dat heb je ook al met – pak m beet – 10.000 artikelen per jaar. Ik kan z’n bewering ook niet anders interpreteren, want een artikel over het Jiddish van Poolse marskramers in de 19e eeuw bijvoorbeeld, zal toch zeker wel met veel interese gelezen worden door kenners van t Jiddish, Van Oostendorp incluis. Of leest niemand dit omdat er een mogelijke boterberg bestaat met Jiddish onderzoek? Maar ook dan, Waarom dan niet Marc?
Hoe dan ook, net zoals het World Wide Web groeit, neemt ook de wetenschappelijke kennis toe, fantastisch toch? Als ik wat wil weten over de vorm van de eieren van het winterkoninkje dan kan ik daar op googelen en ondanks de al bestaande miljarden pagina’s met info (inclusief alle open-access wetenschappelijke artikelen en proefschriften) zou ik teleurgesteld zijn als ik er nu niets over kan vinden. In mijn optiek kan er dus nooit te veel info op internet staan, of een teveel aan wetenschappelijke kennis zijn, maar alleen te weinig.
MEER, MEER, MEER!
MP zegt
De assumptie van de auteur dat niemand dat allemaal leest is geheel naast de kwestie.
De nieuwe wetenschap maakt gebruik van machines en geoptimaliseerde algoritmen om efficiënt ALLE informatie te doorzoeken.
Je kan als onderzoeker mbv de juiste methodologie (lees nieuwe wetenschap, e.g. AI, ML, NLP, …) ALLE informatie analyseren om tot nieuwe inzichten te komen. Taalkundig gezien lees je dus niet alle teksten maar je raadpleegt ze wel allemaal.
Marc van Oostendorp zegt
Die ‘assumptie’ (ik zou zeggen: constatering, want u ontkent niet dat het waar is) is precies de kwestie. Uw uitleg maakt dat nog maar eens duidelijk. Het soort wetenschap dat u beschrijft levert informatie, steeds weer meer informatie (‘data’), op die je kunt ‘analyseren’. Natuurlijk kan dat inzicht opleveren, maar voor dat inzicht is vervolgens geen plaats in het bouwwerk, tenzij we die inzichten opnieuw zien als ‘data’.
Ik zou zeggen: aan data hebben we voorwaar geen gebrek in deze wereld. Mij lijkt het niet het doel van de wetenschap om steeds maar weer toe te voegen aan die eindeloze berg gegevens. Wat we nodig hebben is inzicht, en dat komt eerder van lezen dan van het analyseren of verwerken van data.
Ik ontken dus niet dat het analyseren van grote hoeveelheden data iets kan opleveren, en dat wetenschappelijke artikelen óók data zijn. Maar ik constateer dat de gewonnen inzichten sterk achterblijven bij al die prachtige technieken.
“The endless cycle of idea and action,
Endless invention, endless experiment,
Brings knowledge of motion, but not of stillness;
Knowledge of speech, but not of silence;
Knowledge of words, and ignorance of the Word.
(…)
Where is the wisdom we have lost in knowledge?
Where is the knowledge we have lost in information?”
(T.S. Eliot, Choruses from ‘The Rock’, 1934)