
Waaraan herken je een gedicht? Wat onderscheidt poëzie van proza? Aan het onderwerp ligt het niet: je kunt een gedicht schrijven over een wasknijper en een essay over de liefde. Of andersom. En aan rijm of metrum ligt het ook niet meteen — al meer dan honderd jaar schrijven dichters gedichten die geen gebruik maken van zulke middelen. Toch is er verschil.
Op papier kun je zeggen: het ligt aan de regelafbrekingen en het wit op de pagina, maar er zit ook iets in de klank van de taal en je kunt een indviduele versregel ook al als poëzie herkennen. De studie van ritme, klemtoon, lettergreep-bouw en woordlengte noemen taalkundigen prosodie. Poëzie is, volgens sommige geleerden (zoals de Schotse poëziegeleerde Nigel Fabb), taal waarin die prosodische laag systematisch anders georganiseerd is dan in proza.
Vingerafdruk
Ik probeer me genoeg statistiek aan te leren om daarvoor te gebruiken. Ik ben van huis uit opgeleid als een zogeheten kwalitatieve onderzoeker: een handjevol feiten is goed genoeg uit de enorme zandbak aan gegevens die de wereld is, als je er maar een goede analyse van maakt. Maar de laatste jaren heb ik mezelf met allerlei online-cursussen wat statistiek geprobeerd eigen te maken. Ik geloof nog steeds dat je vaak meer hebt aan een diepgaande analyse van een paar feiten om de wereld te begrijpen dan aan het verwerken van enorme bergen gegevens. Maar dat laatste is soms ook wel degelijk nuttig.
Een spectaculaire methodoloog zal ik bij dat alles wel nooit meer worden. Ik neem in dit geval openbare digitale bibliotheken voor een paar talen (voor het Nederlands de DBNL, voor het Engels Project Gutenberg, enzovoort), verdeel de teksten die daar staan automatisch in twee stapels — poëzie en proza uit dezelfde eeuw — en laat een computer van alles en nog wat uitrekenen. Elke meting wordt uitgevoerd op allebei de stapels, en uit het verschil leid je af of en hoe de poëzie van het proza afwijkt. Het is helemaal niet moeilijk om heel veel gedichten én heel veel proza online te vinden, dus statistiek is niet zo heel ingewikkeld. Het idee is dat er zo een soort vingerafdruk ontstaat: een profiel dat per taal en per periode laat zien waarop poëzie zich onderscheidt.
Lengte
Je kunt de klank van woorden niet altijd aan hun spelling aflezen. Schreeuw heeft acht letters en één lettergreep; idee vier letters en twee lettergrepen, en in die zin is idee een langer woord dan schreeuw. Voor betrouwbare metingen moet je voor elk woord tellen hoeveel klanken het heeft en niet hoeveel letters. Gelukkig is er in de jaren negentig in Nijmegen een uitvoerig elektronisch woordenboek gemaakt voor het Engels, Duits en Nederlands – de talen waar ik me in eerste instantie op richt. Het heet CELEX, en ieder woord is er in fonetisch schrift uitgeschreven, en er is aangegeven waar de lettergreepgrenzen liggen en waar de klemtoon valt. Dat maakt het bepalen van de klank van een woord een kwestie van opzoeken, optellen en middelen.
Ik probeer onder andere uit te zoeken hoe het zit met rijm, en de grammatica van poëzie en proza, en allerlei aspecten. Maar terwijl ik daarmee bezig was, viel me onlangs iets op waar ik niet aan had gedacht: dat er een verschil in lengte is.
Gegeven het bovenstaande is het lastig om te bepalen wat het gemiddelde aantal lettergrepen per woord in een tekst is. ? Je zoekt elk woord op in CELEX, tel tde lettergrepen, en neemt het gemiddelde. Ik heb dat gedaan voor de negentiende eeuw, een eeuw waarin proza en poëzie allebei volwaardig meededen in de literatuur (en de meest recente eeuw die te overzien is zonder voortdurend op auteursrechten te stuiten):

Proza ligt in de negentiende eeuw consistent tussen 1,70 en 1,85 lettergreep per woord; poëzie tussen 1,45 en 1,55. Er is geen overlap, al groeien de twee genres in de loop van de eeuw misschien (het effect is te klein om er met zekerheid iets over te zeggen) een klein beetje naar elkaar toe: de prozawoorden worden een klein beetje korter, die in de poëzie een klein beetje langer. Een verschil van ongeveer 0,3 lettergreep lijkt misschien klein, maar op een gemiddelde zin van vijftien woorden is het bijna vijf lettergrepen, en dat is de duur van bijna drie extra woorden. Cohen’s d — dat is een goede maat voor effectgrootte — komt ook aan het eind van de eeuw rond de 1,8 uit, wat ver boven de drempel ligt waar statistici “groot effect” zeggen. Het is een echt verschil tussen proza en poëzie.
Trucendoos
Het aardige is dat het verschil dus vrij stabiel is over de eeuw. Bilderdijk aan het begin en Gorter aan het eind zitten in dezelfde poëziebandbreedte; Van der Palm en Couperus lijken ook sterk op elkaar, ondanks alle stilistische veranderingen die er in de loop van de eeuw zijn opgetreden. Binnen het werk van één auteur zie je het ook: Potgieter haalt in zijn gedichten ongeveer 1,53 en in zijn proza 1,76.
Hoe dit te verklaren? Twee krachten werken vermoedelijk samen. Dichters hebben in de metriek een stimulans om korte woorden te kiezen: als je een regel moet schrijven met een vast aantal versvoeten, krijg je meer betekenis in een regel als je korte woorden kiest. Een of ander lang woord eet al snel de regel leeg. Prozaschrijvers hebben geen metrische rem, en de negentiende-eeuwse prozastijl moedigt juist lange Latijnse leenwoorden of Germaanse samenstellingen aan. Zo werden de twee genres uit elkaar getrokken, hoewel dus mogelijk naar het eind van de eeuw de dichters iets minder gebonden werden door de metriek en de prozaschrijvers juist wat meer huiselijke korte woorden gebruikten. (Het zou fijn zijn om de twintigste eeuw te onderzoeken, maar je komt dan al vrij snel tegen de beperking aan dat materiaal pas auteursrechtenvrij is als de schrijver meer dan 70 jaar geleden, dus voor 1956, overleden moet zijn. In de DBNL dunt het materiaal dan snel uit.)
Het is een klein resultaatje, maar zoiets simpels als het tellen van lettergrepen levert dus al een groot, stabiel contrast oplevert (voor het Engels en het Duits vind ik hetzelfde). En dan heb ik de trucendoos van al mijn online cursussen statistiek niet eens ingezet.
De getallen in de grafiek zijn illustratief; de complete analyse op de 19e eeuw is nog niet klaar.
Nog een mogelijke verklaring voor het verschil is dat in negentiende-eeuwse gedichten de langere woorden werden verkort om metrische redenen. Het jambische metrum was toen nog altijd dominant. Dactylische woorden moesten aangepast worden door middel van syncope: ‘kinderen’ werd ‘kindren’, ‘vreselijk’ werd ‘vreeslijk’, ‘Nederland’ werd ‘Neêrland’.
Ook bij verbogen lidwoorden en voornaamwoorden kon men makkelijk de laatste lettergreep laten vallen (apocope) wanneer het jambische metrum dit vereiste: ‘eene(n)’ werd ‘een’, ‘zijne(n)’ werd ‘zijn’.
Het resultaat is telkens metrisch korter maar het blijven inhoudelijk dezelfde woorden.
Hypothese: Toen het jambische keurslijf losser werd of geheel verviel, was het niet meer nodig dactylische woorden samen te trekken. De poëzie schoof toen op in de richting van het proza. Naarmate de verbogen vormen van lidwoorden en voornaamwoorden uit het Nederlands verdwenen, ging men in het proza steeds meer de kortere vormen gebruiken die al in de poëzie konden voorkomen. Het proza schoof toen op in de richting van de poëzie.
Dat het niet meer nodig werd dactylische woorden samen te trekken op een gegeven moment is niet mijn ervaring als poëzielezer: mij valt op dat die samentrekking bij het stil of luidop lezen nog steeds geldt, alleen maar niet geschreven wordt. Er komen meer gedichten m.a.w. met “kinderen” uitgeschreven waar nog steeds “kindren” klinkt (tot alle metrum suspect werd). Lijkt me lastig voor Marc om mee te nemen…
Nee, mijn scripts gaan er inderdaad van uit dat er wordt uitgesproken wat er staat, en met het metrum wordt (nog) geen rekening gehouden. Tegelijkertijd: uit de eerste berekeningen komt ook dat er in poëzie veel minder dactyli, anapesten en amfibrachen voorkomen dan je zou verwachten (als je de woorden in willekeurige volgorde zet, vind je meer van dat soort ritmes dan in de eigenlijke volgorde). Dat betekent dat ‘kinderen’-achtige vormen niet heel veel voorkomen.
Sorry dat deze reactie niet over de inhoud gaat, maar over een gebruikt zinnetje dat me opviel.
“Een spectaculaire methodoloog zal ik bij dat alles wel nooit meer worden”
Het is me als leek al eerder opgevallen dat we in het Nederlands “wel niet” of “wel nooit” kunnen zeggen waarbij het “wel” de “niet” of “nooit” versterkt. Het is dus geen “wel” maar “niet”.
Ook meen ik te zien dat we “niet” oneigenlijk kunnen gebruiken in uitdrukkingen als “zullen we maar niet naar huis gaan”. Je wilt dan “wel” naar huis gaan.
Toch is dat bij ons een keer gruwelijk mis gegaan. We waren aan het fietsen en ik vroeg welke van de twee alternatieve routes te kiezen. Mijn vrouw liet de keuze aan mij. Ik zei: “Zullen we maar niet naar links gaan?” En ik stuurde bij de afslag naar links, haar vol in de flank rakend. Haar reactie: “Je zei toch NIET.”