De Britse wiskundige Alex Bellos schreef gisteren in The Guardian een artikel dat ook in Nederland enig stof deed opwaaien. In dat stuk besprak Bellos het feit dat de Engelse spelling triviaal is: als je ieder woord ziet als een vermenigvuldiging, en iedere letter als een variabele in die vermenigvuldiging, dan kun je bewijzen dat de waarde van iedere letter gelijk is aan 1.
Neem bijvoorbeeld de woorden aisle en isle, zegt Bellos. Die spreek je op dezelfde manier uit, en dus kun je zeggen aisle=isle. Omdat je ieder woord ziet als een vermenigvuldiging van de letters, krijg je dan:
- axixsxlxe = ixsxlxe
De vraag werd gesteld op dit leuke wiskundige weblog, en de Taalprof probeerde hem te beantwoorden op zijn eigen weblog. Zoals ik in het commentaar daaronder zeg, denk ik dat zijn bewijs niet helemaal klopt, en uiteindelijk kom ik niet verder dan de volgende letters:
d (want pat=pad)
c (want rock=rok)
k (want rocken=rokken)
r (want verrassen=verassen)
l (want grill=gril)
n (want rasse=rassen)
m (want impasse=inpassen)
q (want qat=kat)
p (want kampt=kamt)
b (want lab=lap)
e: re = ree -> e = 1
o: doodde = dode -> o = 1 (want d = 1)
a: laadde = lade -> a = 1 (want d = 1)
j: hij = hei -> j = 1 (want e = 1)
s: rees = race -> s = c = 1 (want a = e = 1)
h: shock = sjok -> h = j = 1 (want c = 1)
g: lag = lach -> g = h = 1 (want c = 1)
w: kou = kauw -> w = 1 (want o = a = 1)
x: boxer = bokser -> x = ks = 1
y: yen = jen -> y = j = 1
z: lezer = laser -> z = s = 1 (want e = a = 1)
Maar nu kunnen we toevoegen:
v (want wreed=vreet, en v=d=t=1)
f (want lef=lev)
Ik dacht oorspronkelijk dat het Nederlands niet triviaal zou zijn, maar we hebben hiermee al 22 van de 26 letters triviaal verklaard. De i en de u zijn nog problematisch. Je zou ze kunnen oplossen als je een beetje structuralistisch met de sjwa rommelt:
u (want hut=het)
i (want katterig=katterug)
Maar ik vind dat toch minder bevredigend.
Zoals ik vrijwel zeker weet dat het Italiaans of het Spaans helemaal niet triviaal zijn. Daarvoor hebben die talen teveel een één-op-één relatie van klank en letter. Er zijn in het Italiaans bijvoorbeeld eigenlijk geen ‘onuitgesproken’ letters, en ook nauwelijks letters die op dezelfde manier worden uitgesproken als een andere letter. En dan valt het hele systeem in duigen. Het Frans en het Engels hebben allebei juist relatief veel verschillende manieren om dezelfde klank te schrijven én veel onuitgesproken letters in allerlei woorden.
We hebben hiermee dus een eenvoudige rekenkundige maat in handen van hoe fonologisch de spelling van een bepaalde taal is, die we kunnen uitdrukken met de eenvoudige formule:
φ = Λ / (λ+Λ)
Hierin staat Λ voor het totaal aantal letters in de taal en λ voor het aantal letters dat triviaal is. Hoe meer van dat soort letters, des te kleiner de maat φ, dus omgekeerd: hoe groter φ, des te duidelijker drukt het alfabet het klanksysteem van de taal uit. De waarde kan variëren tussen 1 (heel fonologisch systeem) en 1/2 (triviaal systeem). Het Nederlands heeft vooralsnog een φ van 0,52.
De trivialiteitsindex kan zelfs nog een échte toepassing hebben. Er wordt immers wel beweerd dat er in talen als het Italiaans minder mensen kampen met dyslexie dan in talen als het Engels. Je zou nu kunnen meten of er een correlatie bestaat tussen φ en het aantal dyslectici in de bevolking.
Taalprof zegt
Ik heb ook nog iets beter nagedacht, maar uit roux=roe volgt dat ux=e, en u en e zijn al 1. Dus u is ook 1. En uit het feit dat Oirschot=oorschot ("schot in het oor") volgt i=1.
Taalprof zegt
Er is wel nog iets fundamenteels mis met die formule als maat voor de spelling, want er is niet in verdisconteerd dat letters voor verschillende klanken kunnen staan. De trivialiteit bv van de e bewijs je door een woordpaar waarin de e voor /e/ staat, maar de /e/ kan voor (ten minste) twee andere klanken staan.
Taalprof zegt
In mijn laatste reactie bedoelde ik met de tweede /e/ natuurlijk de letter e.
Marc van Oostendorp zegt
De h heeft na een g en een c wel degelijk altijd een functie voor de klank. Uit HO=O volgt inderdaad wel dat h=1. De andere dingen die je noemt leiden misschien tot equivalentieklassen, maar niet tot trivialiteit. Vooralsnog lijkt de φ van het Italiaans me 0,96.
Peter-Arno Coppen zegt
Ik geloof dat we nog iets bewezen hebben. We hebben uit de uitspraakgelijkheid van gespelde woorden (bijvoorbeeld DODE=DOODDE) afgeleid dat alle letters de waarde 1 hebben. Maar daaruit zou dan eigenlijk moeten volgen dat alle woorden de waarde 1 hebben, dus dat AAP=NOOT bijvoorbeeld. En dat klopt niet. Dus, er is geen andere conclusie dan dat het uitgangspunt (woorden zijn vermenigvuldigingen van letters en uitspraak is een indicatie voor gelijkheid) onjuist is.
Marcel Plaatsman zegt
Het Italiaans kent toch ook gewoon onuitgesproken letters? De -h wordt op zich vrij handig gebruikt om de dubbelzinnige c en g minder dubbelzinnig te maken, maar het blijft gedoe, en het gebruik van de h- bij het werkwoord voor "hebben" is ook wat onnodig. Ook de s en de z zijn dubbelzinnig. Wat te denken van de combinatie -gl-? De -i- is ook dubbelzinnig: soms een klinker, soms een halfklinker, soms een medeklinker (in combinaties als ciao). Met -e- en -o- worden ook weer twee klanken aangegeven, trouwens, maar ze zijn iets minder makkelijk weg te strepen. Al kan in sandhi natuurlijk een hoop.
Het valt me vaker op dat de Italiaanse spelling wat wordt overschat, alsof ze een toonbeeld van duidelijkheid en regelmaat zou zijn. Dat valt nogal tegen in de praktijk.
Marc van Oostendorp zegt
Het probleem zit in de dubbelzinnigheid van het =-teken. In DOODDE=DODE betekent X=Y: X en Y zijn homoniem. Maar in e=1 betekent X=Y: de variable X heeft de waarde Y. Doordat je die dingen door elkaar kunt halen krijg je jouw probleem. In echte wiskunde zijn ambigue symbolen daarom natuurlijk niet toegestaan.
Freek Van de Velde zegt
Deze reactie is verwijderd door de auteur.
Freek Van de Velde zegt
Dag Peter-Arno,
Ik heb dit ook al aan Marc gestuurd, maar misschien interesseert het jou ook:
– voor de i: 'heer' – 'heir'
– voor de u: 'leus' – 'löss'
Groet,
Freek.
Marc van Oostendorp zegt
Dat is een goed punt. Je moet dus eigenlijk ook nog het omgekeerd doen: bepalen in hoeverre symbolen in fonetische transcripties 'triviaal' zijn als je de spelling als uitgangspunt neemt.