Door Marc van Oostendorp
Gaat de wetenschap alle schrijvers rijk en beroemd maken? De literair redacteur Jodie Archer en de literatuurwetenschapper Matthew Jockers proberen de verwachtingen van hun lezers weliswaar wat te temperen, maar ze doen dat natuurlijk pas nadat ze die lezers eerst hun boek hebben binnengelokt met een titel (The Bestseller Code. Anatomy of the Blockbuster Novel) en een eerste zin (‘Back in the spring of 2010, Stieg Larson’s agent was having a good day’) die laten zien dat de auteurs zelf wel wat van hun onderzoek hebben geleerd.
Dat wil trouwens niet zeggen dat de aanschaf van The Bestseller Code een miskoop is. Het is een aanstekelijk geschreven boek, dat vertelt hoe je met een big data aanpak, gecombineerd met traditionelere literairkritische methodes, interessante nieuwe inzichten kunt opdoen over romans.
Toevalsfactor
De ‘Bestseller Code’ is een door Archer en Jockers ontwikkeld algoritme dat een boek op een groot aantal verschillende factoren onderzoekt: wat voor onderwerpen komen er aan de orde? Hoe gedragen de karakters zich? Hoe ontwikkelt het plot zich? Wat voor stijl hanteert de schrijver? Al die factoren leiden vervolgens tot een getal dat voorspelt hoe groot de kans is dat het boek een bestseller wordt, met een acuratesse van 80%, volgens Archer en Jockers: als je het 50 bestsellers van de wekelijkse lijst van de New York Times geeft en 50 minder goed verkopende boeken, zegt het van 10 van de bestsellers dat ze misschien niet in de markt zullen liggen terwijl het van 10 andere boeken voorspelt dat ze het weleens goed kunnen doen.
Ik weet niet waar ik die cijfers mee moet vergelijken, maar het klinkt niet slecht, zeker niet als je aanneemt dat er toch ook altijd een toevalsfactor in zal zitten, of in ieder geval een factor die je niet op deze manier kunt meten: dat de auteur bekend is van de televisie bijvoorbeeld.
Antibestseller
Aan de technische details besteden Archer en Jockers helaas niet heel veel aandacht, maar daarmee wordt The Bestseller Code wel een interessant essay, dat de computationele technieken combineert met ‘gewoon’, menselijk goed lezen, met respect voor oeuvres als die van John Grisham en Danielle Steel.
De manier waarop Archer en Jockers hun computationele technieken inzetten is inventief. Om het karakter van de ideale hoofdpersoon van een bestseller te ontdekken hebben ze alle zinnen in alle duizend door hen onderzochte boeken (bestsellers en niet bestsellers) laten ontleden, en vervolgens de zinnen beschouwd waarin een belangrijk, veel voorkomend, personage het onderwerp was, om dan te zien welke werkwoorden er werden gebruikt.
Vechtpartij
Wat blijkt? Hoofdpersonen in bestsellers willen (‘want’) meer dingen en hebben meer dingen nodig (‘need’) dan hoofdpersonen in andere boeken. In die andere boeken wordt juist meer geaarzeld. Hamlet is de antibestseller volgens deze formule: de mensen lezen liever over mensen die door hun wensen en verlangen voortgedreven tot handeling overgaan. Boeken over tobbers en machtelozen zie je niet veel bij de kiosk op het vliegveld liggen.
Om de behandelde thema’s te achterhalen kijken Archer en Jockers dan juist weer naar zelfstandig naamwoorden, of met name naar groepjes regelmatig bij elkaar in de buurt staande zelfstandig naamwoorden (bar, drinken, muziek, bier, vechtpartij). Zo ontdekken ze dat in bestsellers liefst niet al te veel verschillende onderwerpen aan de orde komen (hoe meer onderwerpen, hoe kleiner de potentie tot grote verkoop), maar ook dat vrijwel alle bestsellers van de afgelopen decennia gebouwd waren op eenzelfde soort spanning: er is huiselijk geluk dat op de een of andere manier bedreigd wordt.
Boekcultuur
Bovendien is hét populaire thema allerlei tijden wat Archer en Jockers ‘menselijke nabijheid’ noemen – de intimiteit van het goede gesprek, van het onderlinge begrip. Onderwerpen waarvan je op het eerste gezicht zou zeggen dat ze het goed doen, komen juist maar sporadisch voor: over seks wordt maar heel weinig geschreven of gelezen in de mainstream.
Dat is allemaal interessant, en geeft je als lezer aanleiding uitgebreid te mijmeren over wat dit alles precies zegt over onze cultuur, of beter gezegd: de Amerikaanse, want het boek gaat eigenlijk alleen over de Amerikaanse boekcultuur waar met een enkele uitzondering – de boeken van Stieg Larson –nauwelijks een vertaling in doordringt. (Archer en Jockers vragen zich ook geen moment af of hun observaties nu speciaal voor de Amerikaanse markt gelden of niet.)
Zoetebroodjesfactor
Een van de interessantste hoofdstukken van het boek is overigens, als ik het goed zie, nauwelijks gebaseerd op computationele methode. Die bespreekt de observatie dat er de laatste jaren zoveel bestsellers zijn over meisjes. Dat kun je al aan de titels zien (Gone Girl, The Girl in the Train, The Girl with the Dragon Tattoo), maar Archer en Jockers laten overtuigend zien dat de meisjes in kwestie allemaal iets met elkaar gemeen hebben. Ze hebben een uitzonderlijk talent (hacken, speuren), ze zijn in hun jeugd beschaamd in hun vertrouwen in de samenleving, in de loop van het boek lijken ze voor het eerst een stabielere relatie aan te gaan, maar dat wordt uiteindelijk toch gefrustreerd.
Maar alles bij elkaar bieden Archer en Jockers denk ik vooral een interessant methodologisch punt. Juist grote vragen als ‘wat is de zoetebroodjesfactor voor een boek’ kun je het best tegemoet treden met een gecombineerde techniek. Je moet als mens goed opletten en goed lezen om tot interessante hypotheses te komen. Maar vervolgens moet je binnen korte tijd duizend romans kunnen lezen om je hypothese te toetsen. En duizend bestsellers lezen, dat is waarschijnlijk alleen een computer gegeven.
Jodie Archer en Matthew L. Jockers. The Bestseller Code. Anatomy of the Blockbuster Novel. Macmillan, 2016. Meer informatie bij de uitgever.
Jona Lendering zegt
Ik schrik er een beetje van. De boekenbranche is al gestructureerd rond een verdienmodel dat het beste werkt als het aanbod zo smal mogelijk is (https://mainzerbeobachter.com/2016/02/24/de-voorlichting-in-het-gedrang-2/) en ik vrees dat, nu er zo’n formule is, uitgevers ook nog dezelfde soort boeken gaan uitbrengen. Originele boeken, waarin iets nieuws te lezen valt, zullen geen uitgever vinden en het verrassende zal nóg meer verdwijnen.
Ik hoop dat ik een grap niet heb herkend.
Redactie Neerlandistiek zegt
Nee, er is geen grap. Maar er lijkt me ook geen reden tot zorg, tenzij je inderdaad om de een of andere reden ‘de boekenbranche’ belangrijk vindt.
Drabkikker zegt
Zorgen zijn er al sinds 1954. 😉
WebredMiet zegt
Gek, ik heb daar vorige week zelf nog een blogje aan gewijd 🙂 http://taalverhalen.be/bedenkingen/machinetaal-en-roald-dahl/
Jona Lendering zegt
De boekenbranche an und für sich boeit me niet zoveel, maar via boekenbijlagen, culturele supplementen en dergelijke heeft ze wel enorme invloed op het culturele debat. Zonder dat ik het empirisch onderbouwen kan: ik vrees dat als boeken meer op elkaar gaan lijken, de culturele variëteit ook af neemt.