Zijn de bots van NBD Biblion een goede ontwikkeling?

12 maart 2022 door Karina van Dalen-Oskam, Marijn Koolen, Julia Neugarten en Joris van Zundert 2 Reacties

De beslissing van NBD Biblion om boekrecensies voortaan uitsluitend te laten produceren door algoritmen uit de hoek van de kunstmatige of artificiële intelligentie (AI) leidt tot heftige reacties. We zien die reacties niet alleen bij de ruim zevenhonderd mensen die Biblion tot nu toe van boekbeschrijvingen voorzagen. Ook literatuuronderzoekers, docenten en lezers mengen zich in het debat dat zich ontvouwt via blogs, Twitter en ander media. Natuurlijk trekt de discussie ook de aandacht van literatuuronderzoekers bij het Huygens Instituut.

Als literatuuronderzoekers zetten we zelf bij bijna al ons onderzoek computationele technologie in. Nut, zin en effectiviteit van zulke toepassingen valt moeilijk te betwisten. Vanuit die ervaring en expertise menen we dat de stap van Biblion om computeralgoritmes te gebruiken voor de beschrijving van boeken niet alleen een interessante, maar ook een logische, en zelfs een goede ontwikkeling is. Maar er zijn wel wat mitsen en maren.

Eerst maar wat we toejuichen.

Toepassen als hulpmiddel

De jaarproductie van boeken is inmiddels zo groot dat zelfs met een verveelvoudiging van het aantal professionele recensenten niet aan elk boek recht gedaan kan worden met een beoordeling. De meeste boeken worden niet gesignaleerd omdat de menscapaciteit daarvoor ontbreekt. Hun kansen om aangeschaft en gelezen te worden zijn daardoor drastisch verminderd – ze worden eigenlijk gelijk al uitgesloten. Als digitale technologie kan helpen om meer zicht te krijgen op dat enorme aanbod, dan moeten we die technologie volgens ons vooral ontwikkelen en toepassen als hulpmiddel.

Onderzoekers en programmeurs die deze technieken toepassen en ontwikkelen kennen over het algemeen heel goed de beperkingen en gebreken van de techniek. Een flinke internationale gemeenschap van alerte filosofen, ethici, sociale wetenschappers, mediawetenschappers en (digitale) geesteswetenschappers volgt deze ontwikkelingen bovendien nauwlettend en kritisch. Misverstanden, misbruik en misstanden in de toepassing van machine learning en AI-technieken worden daarom meestal snel ontmaskerd. Het lijkt ons nuttig als we deze experts ook aan het woord laten voordat we plannen voor de toepassing van algoritmen aan de schandpaal nagelen.

Menselijke black box

Maar laten we het probleem daarnaast ook eens vanuit een ander perspectief bekijken. Presteert een groep van om en nabij de zevenhonderd mensen beter dan een paar digitale bots die boeken beschrijven? In de zevenhonderd menselijke hoofden in deze groep zitten allerlei cultureel bepaalde aannames over wat een goed geschreven boek is. Er zitten ook allerlei subjectieve meningen in over welke onderwerpen belangrijk en interessant zijn, over welke verhalen saai zijn, wat cliché-beeldspraak is en over wat een mooie stijl is.

Die zevenhonderd mensen vormen welbeschouwd een beangstigend kleine doorsnee van het lezerspubliek dat zij zeggen te bedienen. Als het voorbeeld in Tzum als doorsnee mag gelden, dan valt er over de kwaliteit van de menselijke black box nog wel wat te discussiëren. Die review getuigt van nogal wat zelfverzekerdheid. “Meesterwerk” is het oordeel. Maar wie bepaalt dat dan? En op grond waarvan? Hoeveel zou een reviewer die het heeft over lekker lezen “bij een knapperend haardvuur en gedempt licht” weten over de leesgewoonten van de honderdduizenden heel verschillende lezers die boeken lenen bij de bibliotheken? Ons menselijke brein is vrij aardig in het maken van effectieve keuzes binnen één beperkte context. Maar ons individuele brein is eigenlijk slecht toegerust om zich een representatief en pluriform beeld te vormen van de duizelingwekkende diversiteit van het lezerspubliek en de grote verscheidenheid in leesbehoefte van dat publiek, en dus weinig geschikt om te bepalen welk boek ‘goed’ is voor welke lezer. Er is niet één archetypische lezer waarvoor we reviews kunnen schrijven, maar bij het schrijven van reviews gaat de menselijke recensent wel uit van zo’n archetypische lezeres. Recensenten schrijven onbewust en onbedoeld toch vaak reviews voor mensen die het lekker vinden om een dik boek bij het knapperend haardvuur te lezen. Daar heb je als hiphop minnende jongere echt heel weinig aan. (En ook dat is al weer een aanname.)

Elite van recensenten

Het publiek voor Nederlandse boeken is steeds groter en steeds diverser geworden en heeft leesbehoeftes die veranderen door tijd, cultuur, maatschappij en gebeurtenissen. Dat publiek laat zich daarom ook steeds minder gelegen liggen aan wat een elite van recensenten lezenswaardig en goed vindt. Liever kijken ze even op Goodreads wat andere lezers van een boek vonden en reiken ze de NS Publieksprijs uit aan een roman die de professionele kritiek het nog niet waard vond om dat gezellig knapperende haardvuur mee aan te steken.

Wij denken daarom dat bibliotheken die een steeds diverser publiek moeten bedienen en die overspoeld worden door een gigantisch boekenaanbod inderdaad veel behoefte hebben aan goed vergelijkbare scores voor boeken op een aantal vaststaande aspecten die gevalideerd zijn op de bevindingen van duizenden lezers.

Algoritmen hebben in dit opzicht in ieder geval één onbetwistbaar voordeel: ze kunnen integraal alles lezen wat geproduceerd wordt aan boeken, en ze kunnen dat binnen een paar seconden. De kunst is natuurlijk om ze vervolgens iets nuttigs te laten doen met die informatie. Dat is het moeilijke stuk: het meetbaar en repliceerbaar aanwijzen van eigenschappen van teksten die relateren aan observeerbare leeservaringen bij lezers met verschillende maar bekende achtergrond. We doen hiernaar bij het Huygens Instituut al een flink aantal jaar onderzoek. Door die ervaring weten we hoe moeilijk het is om dat te doen. Wat we ook weten is dat algoritmen er nog niet al te best in zijn, maar dat menselijke recensenten er nog slechter in zijn.

En dat brengt ons tenslotte bij wat we minder vinden aan de situatie.

Radicale keus

De radicale keus van Biblion om alle menselijke recensenten eruit te gooien en even bruusk te kiezen voor uitsluitend machinaal geproduceerde beschrijvingen, wekt ook bij ons wat verbazing, want we weten dat de kwaliteit van recommender-systemen staat of valt bij voortdurende evaluatie. Steeds weer opnieuw blijkt dat zulke systemen voortdurend kritisch getest moeten worden om zeker te weten dat een algoritme wel doet wat je verwacht dat het doet. En evalueren doe je door je resultaten steeds weer te vergelijken met wat menselijk beoordelaars vinden. Maar die heeft Biblion met een niet al te handige ‘move’ in de communicatie behoorlijk tegen zich in het harnas gejaagd. Hoe gaat Biblion waarborgen dat hun lerende algoritme niet binnen de kortste keren een hyper-radicale leesvoorkeur ontwikkelt als er geen duidelijk proces is voor continue evaluatie?

Zorgvuldig geheim

Omdat Biblion de software van Bookarang gebruikt, is zowel het primaire machine learning-proces als het evaluatie-proces onbekend. Uit bedrijfsbelang hield Bookarang de werking en de bron van zijn software namelijk altijd zorgvuldig geheim. Met betrekking tot die transparantie hebben wij dan ook wel vraagtekens en twijfels, bijvoorbeeld ook omdat de metadata die Bookarang gebruikt, afkomstig is van uitgevers. En we weten dat uitgevers sommige metadata met het oog op de verkoop ‘pragmatisch’ toekennen. Denk aan non-fictie boeken die het label “literaire roman” krijgen als ze daarmee meer kans maken om zichtbaar te zijn in de fysieke of online boekwinkel. Daarmee is die metadata al behoorlijk biased, zoals dat heet. Het is onduidelijk hoe het geautomatiseerde proces met zulke bevooroordeelde data omgaat.

Daarnaast is onduidelijk hoe Bookarang zijn algoritme weerbaar heeft gemaakt tegen de culturele en maatschappelijke vooroordelen die zonder uitzondering zijn ingebouwd in data. Let wel: in data, niet in het algoritme. Een lerend algoritme kan nog zo goedbedoeld, correct ontwikkeld en geëvalueerd zijn, als je vervolgens dat algoritme uitsluitend voedt met fascistische teksten krijg je vanzelf een recommender-systeem met een licht rechts extremistische leesvoorkeur. En dat is een stuk minder gechargeerd gesteld dan je misschien denkt. De boeken die wij lezen zijn ook data die getuigen van onze vooroordelen en voorkeuren. Hetzelfde geldt voor de uitgevers en hun beslissingen over welke boeken ze wel en welke ze niet uitgeven. Eventueel elitarisme en systematisch racisme in onze leescultuur wordt feilloos door computer-algoritmen overgenomen en gepropageerd.

Transparantie is key

Onze conclusie is daarom: ja, we moeten vooral gebruikmaken van nieuwe computationele en digitale technieken, want die bieden veel mogelijkheden om tot betere afstemming tussen leesvraag en leesaanbod te komen. Maar we moeten dat alleen doen als we die technologie ook transparant en kritisch kunnen bestuderen en evalueren.

Dat laatste lijkt in het geval van Biblion en Bookarang nog niet te kunnen. Wij zouden graag zien dat NBD Biblion een audit (formele software-inspectie) van de Bookarang-technologie door onafhankelijke externe experts laat uitvoeren. Die experts kunnen dan inventariseren hoe het proces er nu uitziet en welke data er worden gebruikt om de beschrijvingen te genereren. Expertise voor zulk kritisch onderzoek van AI-technologie is in Nederland ruim voorhanden. De onderzoekers van het Huygens Instituut die zich bezighouden met boeken, lezers en AI zijn van harte bereid om een rol te spelen bij zo’n audit en hun bevindingen met iedereen te delen. Boeken, lezers en alle technologie die hen verbindt liggen ons na aan het hart.

Dit stuk verscheen eerder op de website van het Huygens Instituut]

Gerelateerd

Reacties

johan velter zegt

12 maart 2022 om 16:24

Is dit ‘artikel’ een uiting van de ‘wetenschappelijke geest’ van het Huygens Instituut ?
Per alinea, het cijfer duidt de alinea aan:
1. Men spreekt over ‘heftige’ reacties – het woord heftig is hierbij denigrerend want emotioneel bedoeld, dommeriken dus die reageren op een niet-rationele wijze. Men verwijst naar ‘blogs, Twitter en ander media’ (sic) – men kan doorklikken en men krijgt 1 twitter-bericht te lezen, dat noem ik doelbewuste desinformatie en verenging van de blik.
2. Zelf is men natuurlijk geletterd, volgens het instituut dus zijn deze medewerkers computationele techneuten, de criticasters dus niet – de vergissing is natuurlijk dat het computationele (om dat lachwekkende woord verder te gebruiken) op een juiste manier moet ingezet worden : technologie is hier een achteraf-methode, natuurlijk handig in het tellen en formeel analyseren (al kan het kwantitatieve wel zeker naar inhoudelijke inzichten leiden). In deze alinea wordt al, zonder enig bewijs, beslist dat de NBD-Biblion-beslissing om recensies niet meer te schrijven maar te laten genereren een goede evolutie is. Omkering van bewijslast.
3. De derde alinea is kort en niet krachtig, ‘Eerst maar wat we toejuichen.’. Eerst zullen de experten zeggen wat ze toejuichen – net alsof het gaat om een circusoptocht, een carnavalviering, een optreden van Nina Nannini – als we een rationele verdediging verwacht hadden, dan zijn we er aan voor de moeite – vertaal ‘Eerst maar wat we toejuichen.’ naar een kantiaans Duits en begrijp dan in welke categorie men ons wil trekken.
4. Hier spreekt men over een zogezegd nieuw feit (dat helemaal niet nieuw is): ‘De jaarproductie van boeken is inmiddels zo groot […]’ – vermits dit geen nieuw fenomeen is, kan dit in deze toejuiching niet geldig zijn. Maar stel dat we het enge kader van deze auteurs aanvaarden, dan nog is wat ze hier betogen onzin: men moet een onderscheid maken in recenseerbare en andere boeken – het grootste deel der boeken wordt terecht niet opgenomen, hoeft ook niet gerecenseerd te worden en veel boeken mogen in de duisternis blijven. Het is ook nog nooit de ambitie geweest van een openbare bibliotheek om alle boeken te verzamelen – en als men alle boeken zou recenseren, en als de bibliothecarissen (tiens, zijn die er nog?) al die recensies zouden lezen, dan hebben ze geen tijd meer om hun belevingsbibliotheek te versieren met hartjes en lintjes. Het argument klopt niet, het woord ‘inmiddels’ louter ideologisch ingezet.
Dus : de redenering dat boeken niet gerecenseerd worden ‘omdat de menscapaciteit daarvoor ontbreekt’ is géén argument, want men zou wel degelijk alles kunnen recenseren, men moet wat meer recensenten vinden, men kan ze ook betalen (schaf dat management voor meer dan de helft af), is een vals argument want het neemt de politiek van het bedrijfsmanagement van NBD-Biblion gewoon over. Maar de valse redenering, dient natuurlijk een doel – en dat doel moet zijn: ‘toejuiching’, het tromgeroffel zal van NBD-Biblion zelf komen. We wachten op de aap die komen zal.
De auteurs stellen het voor dat wanneer die ‘massale productie’ gelezen wordt door machines er plots een fantastische ‘output’ aan hoge literatuur of interessante wetenschap zal komen – laten we echter zeggen: wat niet is, zal niet zijn. Ook dit non-argument is een demagogisch middel om een doel te bereiken: toejuichingen met bis-nummer.
5. Hier worden we aan een groep goede mensen voorgesteld, weer worden de criticasters als achterlijken voorgesteld. Wist men dan niet dat er zovelen reeds met deze problematiek bezig zijn? ‘Een flinke [sic] internationale gemeenschap van alerte [sic] filosofen, ethici, sociale wetenschappers, mediawetenschappers en (digitale) geesteswetenschappers volgt deze ontwikkelingen bovendien nauwlettend en kritisch.’ – en daar zullen die dwaze bloggers, twitteraars, schrijvers en letterkundigen het wagen hun kleine gedachten tegenover te stellen? O, hubris der dwazen. En bovendien, als er al een snoodaard is, wordt hij ‘ontmaskerd’. In deze alinea hebben we een variant op het gezagsargument – al krijgen we geen inhoudelijk argument te lezen, noch gebaseerd op wat gaande is in de Nederlandse bibliotheekwereld (die uiteraard ook invloed heeft op de Belgische, al even gedreven door geldzucht en domheid).
Wat is dan de (voorlopige) oplossing? Men wil experts aan het woord laten – een uitbreiding van het gezagsargument en een uitsluiting van de belanghebbenden. Om in de clichétaal van deze ‘onderzoekers’ te blijven: waar is het draagvlak gebleven?
6. De verdachtmaking gaat nu verder: de onzin van de ‘objectieve’ geest van de machine (blijkbaar hebben de Huygens-onderzoekers wel een zeer eenzijdige blik op ‘het veld der experts’ – laten we zeggen dat er naast de tulpen ook wel vergeet-me-nietjes bestaan) wordt gesteld tegenover de zevenhonderd recensentenhoofden die o schande vol zitten met oordelen over literatuur, stijl, maatschappelijke problemen, … We kunnen het ook anders verwoorden : die recensenten hebben allemaal kennis, ervaring, ze weten iets over het publiek, waarom en waarvoor ze iets schrijven, ze hebben zelfs een leesgeschiedenis, een cultuur en zijn opgevoed – hier wordt de menselijkheid, het subjectieve, verdacht gemaakt. Men kan dit ‘wetenschap’ noemen, ik noem dit ideologie (gevoed door een godsdienstige mensenhaat).
Alinea 7. begint met door te gaan op het voorgaande. Zou men 700 veel kunnen vinden, deze wetenschappers noemen dit ‘een beangstigend kleine doorsnee van het lezerspubliek dat zij zeggen te bedienen.’ – ‘beangstigend’? ‘klein’? ‘doorsnee’? ‘zeggen te bedienen’? : is dit een objectiverend argument? Nee, dit is zeggen: wat een pretentieuze snollen zijn die recensenten. Omgekeerd zou men kunnen stellen dat deze recensenten hun werk doen.
In de rest van deze alinea wordt 1 voorbeeld aangehaald om nog meer van hetzelfde te zeggen : het cultuurrelativisme wordt nu in dienst van de macht gesteld – want de uitkomst van het stuk zal moeten zijn dat de NBD-technologie, kom ja, misschien wel hier en daar gewijzigd zal kunnen worden, we moeten immers vooruitgaan, maar toch wel schitterend en toejuichbaar is. Money makes the world go round – zouden die programmeurs ook ‘gratis en voor niets’ gewerkt hebben?
De Huygens-onderzoekers doen zich voor als wetenden, de anderen weten natuurlijk niets ‘over de leesgewoonten van de honderdduizenden heel verschillende lezers die boeken lenen bij de bibliotheken’ (de experten schrijven alsof ze aan de kant van die o zo zwakke en schuldeloze, slachtofferige lezers staan) – feit is dat we heel wat weten over het lezen van lezers in openbare bibliotheken en we weten ook hoe leesgedrag gevormd en misvormd is door het bibliotheekmanagement en hoe enkele bibliotheekmedewerkers (we kunnen niet meer spreken van bibliotheekbeleid) daartegen in gaan en aan gedegen leesbevordering doen, niet door ‘belevingen’ te ‘promoten’ wel door over boeken te spreken. ‘Toejuichingen’, zoals die opgelegd worden, werken averechts.
De auteurs zijn dus niet op de hoogte van wat vakkennis is.
De auteurs gaan verder op een belerende toon (maar argumenteren naast de kwestie) : ‘Ons menselijke brein […]’ en dan volgt een leugen : de mens is wel degelijk in staat om buiten zichzelf te treden en zich een ‘pluriform’ leespubliek voor te stellen. Het is namelijk geweten dat een boek van Tonnus Oosterhoff niet moet aangeprezen worden aan een publiek dat Margrietjes leest – dit is géén denigrerende uitspraak, maar wel realistisch én doet recht aan verschillende leespraktijken.
De Huygens-auteurs liegen ook wanner ze spreken van ‘de duizelingwekkende diversiteit van het lezerspubliek en de grote verscheidenheid in leesbehoefte van dat publiek’ – die diversiteit is bijlange na niet ‘duizelingwekkend’ (de auteurs verwarren het getal van de individuele lezers met het getal van de ‘leesgroepen’) – en verkondigen hier de religieuze onwaarheid van de ‘atomistische’ maatschappij. Het argument dat hier gegeven wordt, heeft geen uitstaan met waarover het gaat : de uitschakeling van mensen voor het schrijven van recensies, het lezen van boeken ten voordele van een commercieel opgezet model. Door deze zinnen te schrijven, wil men nu reeds de lezer impliciet voorbereiden : de machine kan dat wel – wat uiteraard onzin is, want de maatschappelijke constellatie verandert niet of een recensie nu door machines gegenereerd wordt of niet. Weer moeten we wijzen op de valsheid van de argumentatie. Ook het werkwoord schrijven wordt op een ideologische manier gebruikt.
Het wereldbeeld van de huichelende Huygen-experts gaat van een lezeres aan het knapperend haardvuur naar de lezende hiphopper en het is volgens hen onmogelijk om een recensie te schrijven die beide personen zou kunnen informeren. Er wordt daarvoor geen inhoudelijk argument gegeven, slechts wordt geïnsinueerd. Blijkbaar is de hiphopper een ander soort mens.
8. Ook deze alinea begint met een leugen: de bibliotheken hoeven niet een ‘steeds diverser publiek te bedienen’ – die diversiteit was er al van in het begin, dat is namelijk de essentie van wat een ’openbare bibliotheek’ is – als het past wordt diversiteit als argument ingezet, al blijft het argument leeg en loos. Men gebruikt dit valse argument om zaken door te voeren die haaks op het bibliotheekwerk staan – zie belevingsbibliotheek, zie het bochtenwerk van de bibliotheekmanagers die boeken als decoratie zien. De auteurs herhalen zichzelf met ‘het gigantische boekenaanbod’ en ik herhaal mezelf daarom ook: van dat gigantisme is slechts een deel (nl. niet de wetenschappelijke uitgaven, niet beneden de ondergrens (dat magische woord) van wat literatuur is (en daar roepen de Huygens-wetenschappers: o, gij hovaardige, gij mens, die de goden uitdaagt, hoe durft gij te zeggen wat literatuur is) geschikt voor de openbare bibliotheek. Hier dien ik dan toch de hele alinea te citeren: ‘Wij denken daarom dat bibliotheken die een steeds diverser publiek moeten bedienen en die overspoeld worden door een gigantisch boekenaanbod inderdaad veel behoefte hebben aan goed vergelijkbare scores voor boeken op een aantal vaststaande aspecten die gevalideerd zijn op de bevindingen van duizenden lezers.’ omdat hier het commerciële Amazon-model tevoorschijn komt: een boek is volgens deze ‘auteurs’ geschikt als het door velen geschikt gevonden wordt – de Huygens-experts willen dus een middle-of-the-road-literatuur (al vinden ze dat anderen het woord literatuur niet mogen gebruiken, toch doen ze het zelf) (als zevenhonderd recensenten angstaanjagend weinig is, dan ‘duizenden lezers’ toch ook?). Bovendien zijn die ‘vaststaande aspecten’ binnen literatuur (ruimer: de menselijke ervaring) beperkend, wat deze Huygens-experten voorstaan is ‘meer van hetzelfde’, ‘dertien in een dozijn’ – die boeken ‘uit dat gigantische aanbod’ die anders zijn, moeten geweerd worden. De liberale ideologie van deze auteurs (en uiteraard NBD-Biblion) is daarmee duidelijk gemaakt – dat ze dit zelf niet willen expliciteren, maakt hun werk waardeloos want gebaseerd op een leugen. Huygen-huichelaars. Chirpy Chirpy Cheep Cheep.
9. Nu zeggen de experten dat machines alles in een paar seconden kunnen lezen en daarom moet de NBD-Biblion-ravage toegejuicht worden. Dat dit argument niet geldig is, is evident uit de aard van de zaak: een recensent mag zoveel lezen als hij wil, als hij geen recensie schrijft, is hij geen recensent. Lezen en schrijven (en begrijpen) zijn onderscheiden zaken – zouden daar geen studies over geschreven zijn die deze experts hadden kunnen lezen? Lezen?
Tegelijkertijd zeggen deze experten: wij (wij de wetenden) doen al langer aan dat soort onderzoek en nog lukt het ons niet iets ernstigs te zeggen. Maar hoe slecht ‘algoritmen’ het ook doen, menselijke recensenten doen het nog slechter – weer worden géén argumenten voor deze beschuldiging gegeven en weer worden ‘algoritmen’ voorgesteld als metafysische platoonse ideeën die ergens boven ons in het wolkendek zweven en totaal belangeloos, leeg en toch vol, onbevooroordeeld en toch cultureel onderlegd zijn – algoritmen als witte konijnen met de maagdelijke lelie als embleem.
10. ‘En dat brengt ons tenslotte bij wat we minder vinden aan de situatie.’ – ‘minder’ maar toch nog goed. Ernstiger is het gebruik van het woord ‘de situatie’ – men doet alsof de situatie onvermijdelijk is, dat deze situatie er gewoon gekomen is zonder enige bedoeling of beslissing, dat dit onontkoombaar is. De situatie moet men dan ook aanvaarden. Religieuze onderdanigheid.
11. De Huygens-experten zeggen verwonderd geweest te zijn over de bruuske werkwijze van Nina Nannini (directrice NBD-Biblion) die met vrouwelijke fijngevoeligheid de recensenten een schop onder de kont gaf, dat had niet zo moeten gebeuren. Maar anders. Toch hetzelfde. Had men niet beter een machine met een ontslag-algoritme kunnen gebruiken? Want machinegerelateerde output, zeggen deze hogepriesters, moet steeds geëvalueerd worden door mensen, dat een redacteur (zo noemt men dat) soms ook een boek moet lezen om te kunnen evalueren, oh, dat weten de Huygens-huichelaars niet, bezig als ze zijn met zichzelf te evalueren. De redenering van de onderzoekers is niet consistent: mensen kunnen niet schrijven voor een groot en divers publiek maar ze kunnen wel evalueren.
In deze alinea komen de zinnen na elkaar te staan, maar er is géén argumentering, veel herhalen (al dan niet met fouten : ‘ En evalueren doe je door je resultaten steeds weer te vergelijken met wat menselijk beoordelaars vinden.’ – dat men niet ‘menselijke’ schrijft, oh Freud) is nog niet gelijk aan een krachtig argument. Dan worden de Huygens-experten ook nog hypocriet: ze vragen zich namelijk af hoe NBD-Biblion zal verhinderen dat er één model steeds weer herhaald wordt – hypocrisie omdat (zie supra, de Amazon-ideologie) deze Huygens-experten zélf de werking van de algoritmen als dusdanig hebben beschreven. De pot verwijt de ketel dat die zwart ziet.
12. Terecht verwijten de onderzoekers dat ‘het algoritme’ (dat heilig schrijn) geheim gehouden wordt – dat is nu eenmaal de commerciële logica, wie met de hond slaapt, krijgt zijn luizen (de ‘bot’ zegt dat deze tekst huiselijke taferelen oproept en diervriendelijk is, het doelpubliek bestaat dus uit honden), en de auteurs bevestigen hiermee dat NBD-Biblion niet het algemeen belang dient en dus geen partij kan en mag zijn voor en in de openbare sector – zo ver gaan de experten echter niet, ze moeten te vriend houden, de rok is nader dan het hemd. (De ‘bot’ : we krijgen nuttige wenken voor onze kledij.)
13. Daarna draaien de auteurs de discussie om : niet alleen de recensenten zijn onbekwaam en kwaadwillend, ook de data zijn dat. De machines moeten niet alleen boeken lezen, ook, ja wat ook? Ik citeer hun verwarring, waarbij de ideologische vooringenomenheid van de auteurs al te duidelijk blijkt: fascisme noemen ze ‘licht-rechts extremistisch’ : ‘Een lerend algoritme kan nog zo goedbedoeld, correct ontwikkeld en geëvalueerd zijn, als je vervolgens dat algoritme uitsluitend voedt met fascistische teksten krijg je vanzelf een recommender-systeem met een licht rechts extremistische leesvoorkeur. En dat is een stuk minder gechargeerd gesteld dan je misschien denkt. De boeken die wij lezen zijn ook data die getuigen van onze vooroordelen en voorkeuren. Hetzelfde geldt voor de uitgevers en hun beslissingen over welke boeken ze wel en welke ze niet uitgeven. Eventueel elitarisme en systematisch racisme in onze leescultuur wordt feilloos door computer-algoritmen overgenomen en gepropageerd.’ De auteurs zijn hier niet consequent: hun machines hebben immers alles gelezen (wat, herinner u, de recensenten verweten wordt), hoe kunnen de data dan eenzijdig zijn? Let wel: over het algoritme worden geen vragen gesteld, terwijl het algoritme natuurlijk wél bepalend is – daarom moeten de boeken ook door mensen gelezen en geëvalueerd worden (en niet moet het resultaat van algoritmen geëvalueerd worden – de auteurs trappen hier in de bureaucratische val van de paraplu).
Hun ‘eventueel elitarisme en systematisch racisme’ is dan toch ook onmogelijk? En was dit (het alles lezen) niet hun zwaarwegendste argument? De Huygens-experten zijn dus niet in staat om coherent te denken. Dat ‘elitarisme’ overigens, is dat geen ideologisch overblijfsel van de loden jaren, waren we dat al niet voorbij? En het ‘systematisch racisme’ toont aan hoe modieus men wil zijn – brave hond, hier een snoepje.
14. De tussentitel (de vorige heb ik niet vermeld) luidt ‘Transparantie is key’, daarvan afgeleid – ‘Inspiratie is key’ – ‘Transpiratie is key’ – ‘Transsiberië is key’ – ‘Presentatie is key’ – ‘Abdicatie is key’ – ‘Acclimatisatie is key’ – ‘Droge haring is de sleutel’.
15. Zeg maar ja tegen het leven en tegen de nieuwe technologie. Helaas hebben de auteurs geen argumenten gegeven en is de conclusie dus onjuist, want in hun stuk zelf hebben ze moeten toegeven dat de NBD-Biblion-software geheim gehouden wordt en dus niet geëvalueerd kan worden, dus onbruikbaar is. De zin ‘Maar we moeten dat alleen doen als we die technologie ook transparant en kritisch kunnen bestuderen en evalueren.’ is dan ook naast de kwestie – had men zelf de algoritmen ontwikkeld, was er een openbaarheid van bestuur mogelijk. Men kan na de storm wel zeggen dat er beter geen storm geweest was, de bomen zijn toch uitgerukt. De onbekwaamheid van het NBD-Biblion-management heeft dus een directe negatieve invloed op de cultuursector.
16. De eeuwige truc: de experten roepen op dat experten de experten moeten controleren (wie zal Arthur Koestler lezen?) en daarmee is hun kous gebreid. Dat een commissie in het leven roepen de zaak niet oplost, is deze experten nog niet ter ore gekomen. Weer zijn de huygenaars inconsequent, want de experten die de experten controleren moeten controleren over welke data het gaat – maar het gaat over ‘alles’, althans volgens deze experten, want machines lezen alles, (mensen zijn verstandiger). En daar komen de apen uit de mouw: de Huygens-experten dienen zichzelf aan als experten die de experten op de goede weg zullen zetten (al hebben ze eerder toegegeven dat ze nog niet veel bereikt hebben). Als kers op de taart ‘geven’ de onderzoekers ‘mee’ dat ze van goede wil zijn, dat ze een groot hart hebben en dat ze veel geld willen verdienen op de kap van meedogen- en hersenloze managers : ‘De onderzoekers van het Huygens Instituut die zich bezighouden met boeken, lezers en AI zijn van harte bereid om een rol te spelen bij zo’n audit en hun bevindingen met iedereen te delen. Boeken, lezers en alle technologie die hen verbindt liggen ons na aan het hart.’ Dat is misschien nog het ergste, dat ze moeten besluiten met een sentimenteel inwerken op ons gemoed – dat al zo veel te verduren had.

De auteurs van het stuk, onthou de namen, Karina van Dalen-Oskam, Marijn Koolen, Julia Neugarten en Joris van Zundert, ‘Makelaer[s] in ongesiene waren’.

Beantwoorden
Abbring zegt

13 maart 2022 om 11:22

Wat ik mij afvraag… Worden boeken geschreven voor mensen, of voor robots ? Willen we dat de jeugd “weer” gaat lezen, of dat de robots dat wel even voor ze doen ? Willen we een cijfer geven voor elk boek dat geschreven is ? Of willen we dat mensen met plezier een boek kunnen vinden, lezen, pakken, ontdekken en daar zelf een mening over mogen hebben en geven die niet meteen overboord wordt gegooid door een ‘bot’? Dat ze met anderen over die mening kunnen discussieren? Zou het niet gewoon een idee zijn dat panel van recensenten uit te breiden, tot een diversere groep mensen die wel een doorsnee kunnen vormen van de samenleving ? Of valt literatuur dan zeker niet meer te redden ? En wat als die bot uw boek of artikel afkraakt en afraadt ? Komt u dan in opstand ? Schrijft u dan een weerwoord aan diezelfde bot? Wordt uw weerwoord dan meegenomen in de volgende versie van die bot, die blij is uw formuleringen om te zetten in verse recensies, zonder uw daar overigens verder voor te bedanken ? Zullen we leerlingen dan maar leren bots te maken? Is dit dan die wereld waar we van dromen ? Ik vraag het me allemaal af.
Met vriendelijke groeten,
Een leraar.

Beantwoorden