Door Marc van Oostendorp
Dus u wilt u heden vertreden? Dan gaan we eens zwelgen in nutteloze taalweetjes. Of, althans, ik ga dat doen: zien jullie maar of je zin hebt om mee te doen. De aanleiding is een blogpost van Milfje Meulskens van vorige week. Zij legde daarin een nieuw spel uit:
- Men neme een sequentie cijfers: 4 5 6 3 2 5 2
- Men make een grammaticaal kloppende zin waarbij de woorden precies het aantal letters hebben in de volgorde zoals in de opgave gevraagd is.
Milfje wijst er dan terecht op dat de techniek al gebruikt is voor ezelsbruggetjes, bijvoorbeeld voor het getal π, en verwijzen in dat kader naar deze mooie pagina met pareltjes als de volgende:
- Eva o lief, o zoete hartedief , uw blauwe oogen zyn wreed bedrogen.
- Zie, ‘k geef u thans, geleerden en leeken, ouden van dagen, frissche studenten, weinige regeltjes, die mij zijn gebleken, vaak nuttig te werken voor tal van docenten. Zie nu hoeveel decimalen.
Dat zijn leuke zinnen, maar ze zijn wel speciaal verzonnen.
In het Engels bestaat zelfs een hele roman die geschreven is volgens de eerste 10.000 cijfers van π.
In het Engels bestaat zelfs een hele roman die geschreven is volgens de eerste 10.000 cijfers van π.
De echt interessante vraag voor ons, jongens en meisjes van de big data, is: welke π-zinnen vinden we in de wilde natuur van de Nederlandse letterkunde? Voor het Engels blijkt dat, uit een artikel van Wired, nog niet mee te vallen: de meeste schrijvers blijken π-zinnen geschreven te hebben van hooguit een woord of vier.
Ook in de Nederlandse literatuur blijkt het er ongeveer zo voor te staan. Max Havelaar en Eline Vere bieden slechts een lengte van 3, allebei ook nog eens niet zo interessant (“Men ’t weet”, “Hoe ’t haar”). De langste fragmenten die ik tot nu toe heb kunnen vinden, hebben ieder vijf woorden; ze zijn ook alle vijf wel aardig:
- De leeuw van Vlaanderen: “Met u gaan, o vader”
- Een liefde: “God, o Heer, o Jezus”
- Midzomernachtsdroom (vertaling Burgersdijk): “gij, o Muur, o lieve”
De fragmenten lijken te laten zien waar het probleem zit: de schaarste aan eenletterige woorden in het Nederlands. Toch worden de resultaten niet beter wanneer ik de 1 eenvoudigweg negeer. In de Max Havelaar vind ik dan bijvoorbeeld alleen voir droit devant.
Wie kan er een langere onopzettelijke Nederlandse π-zinnen vinden?
Andre Engels zegt
Het probleem van het gebrek aan woorden van 1 letter kun je wellicht oplossen door ook woorden van 11 letters toe te staan. Als we dat ook bij de andere cijfers doen (dus 12 letters voor 2, 13 voor 3…) kom ik in de Max Havelaar "van 'n hoofdambtenaar, fabelachtig hooge". Niet echt een hoogvlieger (jouw 3 voorbeelden vind ik mooier), en niet méér dan 5, maar ik blijf nog even zoeken.
Mient Adema zegt
1 2 3 4 5 6 7 8 9 10 10 9 8 7 6 5 4 3 2 1
u is een zeer goede leraar geweest, ofschoon behoorlijk decadenter verzinsels menigmaal richting asemmer wilden rijden voor een pi, pfffff…..
Als raadseltje vind ik het wel grappig, als rekentaal ook wel, maar als taalbestudering vind ik het eigenlijk maar knap o.b.n.l.i.
Andre Engels zegt
Ik heb eens een scriptje over wikisource laten lopen, en dat levert de volgende resultaten op:
3-1-4-1-5:
Bosboom-Toussaint, De vrouwen van het Leycestersche tijdvak: "als u door 't hoofd", "die ’t voor ’t minst"
Bredero, Lucelle: "van u Heer u Vader"
Frederik van Eeden, Lioba: "bij d 'ebbe 't zwart"
Overijssels volkslied: "Heb u lief; g' omvat"
Onder mijn versoepelde regels kom ik ook niet verder dan 5. Een mooie vind ik nog wel:
Arnold Houbraken, De Groote Schouburgh Der Nederlantsche Konstschilders En Schilderessen: "Van Biezelingen naar 't Leven"
Plutarchus, Parallelle levens (vertaler niet gegeven): "als 't ware opgegroeide drang"
David van der Vliet (@puntnl) zegt
Een zijweggetje: al je pi zou beperken tot zeg tien cijfers, dan kun je tellen hoe vaak elk cijfer voorkomt. Zoek dan een taal die ongeveer dezelfde verdeling heeft in woordlengte. Wellicht heb je dan de juiste taal gevonden voor spontane pi-zinnen.
Mient Adema zegt
Toch trekt dat 314159265358979323846…-gedoe me wel wat.
Ik vond de zin in een roman van mijn hand die aanstaande is en de bestraffing beschrijft van een doorgedraaide taalcriticus. Het begin gaat als volgt:
Zeg, u moet u beter instellen op andere feiten die zeker aandacht verdienen, voordat onderzoek een te fel schijnsel door dommer……(u controleert niet, dus ik ga maar niet verder).
Marc van Oostendorp zegt
Bij die eerste tien zitten twee 1en en twee 5en (en gelukkig geen 0). Die 1en wegen echter zwaarder omdat ze meer in het begin zitten.
Andre Engels zegt
'Feiten' is een letter te veel. Veranderen naar 'zaken'?
Anoniem zegt
Voor sequentie hebben wij een mooi Nederlands woord "rij".
Mient Adema zegt
Steekproef gelukt, maar bedankt voor de attentheid 🙂
Wildplasser zegt
De decimalen van pi zijn (in ieder getalstelsel) willekeurig verdeeld. Voor het decimale stelsel dus: allemaal 1/10 kans. En een monster van tien decimalen is natuurlijk gewoon te klein.
Marc van Oostendorp zegt
Ja, natuurlijk zijn de decimalen van pi willekeurig verdeeld. Maar het gaat er in dit geval om dat je in eerste instantie de eerste tien decimalen doorkomt. We moeten die verdeling dus veel lokaler bekijken, en in dat kader heeft het wel degelijk zin om ons tot die eerste tien te beperken. De eerste spontane π-sequentie van die lengte moeten we immers nog tegenkomen.
Wildplasser zegt
Voor de eerste 10 decimalen verwacht je (bij benadering): 10/3 cijfers die eenmaal voorkomen+ 10/3 die meermalen voorkomen + 10/3 die nooit voorkomen.
(bij benadering; is in eigenlijk 10 maal {1/e, 1/e, 1-2/e}, IIRC)
Ik denk dat dat met een customised versie van Hubert Both niet onmogelijk is, zelfs voorbij tien decimalen. De betekenis van de gegenereerde tekst zal te wensen over laten, vrees ik.
Anoniem zegt
Pi heeft op de 36e en 55e plaats al een nul. De langere pi-zinnen laten die weg. Is dat niet flauw?
Marc van Oostendorp zegt
Ja, dat is flauw, maar ik weet ook niet zo gauw een oplossing. Men zou eventueel kunnen zeggen dat daar woorden van 10 letters kunnen staan, zoals André Engels hierboven suggereert, maar het blijft onbevredigend. Voor pi-zinnen in het wild maakt het vooralsnog niet zo veel uit. De eerste zin die toevallig tot de 35e plaats komt is in geen enkele taal nog gevonden, voor zover ik nu kan zien.
Wildplasser zegt
Lijkt mij redelijk om voor een 0 een punt, komma, of ander leesteken te nemen.