Voornamendrift 97
Het is moeilijker om te zien dat de familienamen Gietermans en Meestringa een anagram vormen, dan de familienamen Zwieserijn en Swiezerijn. Dat komt omdat in de eerste twee namen bijna alle letters een andere plaats hebben gekregen, terwijl in de laatste namen alleen de z en de s omgewisseld zijn. Ik zou graag een getal hebben dat aangeeft hoeveel er gehusseld is in een anagrampaar, de complexiteit van het anagram.
Omdat in een anagram dezelfde letters voorkomen, moet je voor een verschil een grotere eenheid nemen. Een bigram, de combinatie van twee opvolgende letters, is een goede optie. Gietermans bevat de bigrammen gi, ie, et, te, er, ma, an, ns en Meestringa de bigrammen me, ee, es, st, tr, ri, in, ng, ga. De negen bigrammen van Gietermans en Meestringa zijn allemaal verschillend: er is geen bigram gemeenschappelijk. Dat is een indicatie dat er veel veranderd is tussen de namen. Zwieserijn en Swiezerijn hebben wi, ie, er, ri, ij, jn gemeenschappelijk, dat zijn 5 van de 9 mogelijke bigrammen, deze namen verschillen niet heel veel.
De lengte van een naam bepaalt het aantal bigrammen er in. Hoe langer de naam, hoe meer gemeenschappelijke bigrammen er kunnen zijn. Om daarvoor te corrigeren kan het aantal gemeenschappelijke bigrammen gedeeld worden door het aantal mogelijke bigrammen (dwz lengte – 1). Om een maat te krijgen die 100 is bij maximale complexiteit en 0 bij geen verschil, kan gekozen worden voor:
anagramcomplexiteit = 100 * (1 – aantal gemeenschappelijke bigrammen/(lengte-1))
Bij de familienamen zijn Gietermans en Meestringa de langste namen die wel alle letters maar geen bigram gemeenschappelijk hebben, met anagramcomplexiteit 100. Met een lengte van 9 letters geldt dat ook voor Barmentlo/Lamberton, Bartelson/Rosenblat, Camerlink/Rinckelman, Darneviel/Van der Lei, Dimmendal/Middelman, Korenstra/Ronkaerts en Liebregts/Steilberg. En zo zijn er in totaal 3.954 naamparen die een anagram vormen met complexiteit 100.
Lange familienamen van 11 letters met 1 gemeenschappelijk bigram zijn Antheunisse/Steinhausen. Eenshuistra/Steinhauser en Garstenveld/Van der Slegt, met anagramcomplexiteit 90. Het is boeiend om alle 26.012 familienaam anagrammen langs te lopen, ze kunnen hier gedownload worden. Er zijn in totaal 16.371 verschillende familienamen met een anagram, met daarbij familienamen met meerdere anagrammen.
Een lage anagramcomplexiteit van 6 heeft het langste anagram Droogleeverfortuijn/Fortuijndrooglever. Een omwisseling van samenstellingen herkennen we direct en is ook niet heel intrigerend. Alleen de bigrammen rf en nd zijn niet gemeenschappelijk.
Voornamen
Ook de complexiteit van voornaam anagrammen is te onderzoeken. Met meer dan vier naamdragers, zijn er 2.965 anagrammen van mannennamen en 6.968 van vrouwennamen die eveneens opgenomen zijn in het te downloaden bestand. Dat er meer anagrammen zijn van vrouwennamen zit deels in de grotere variatie in het naameinde van vrouwennamen zoals in Willemeintje/Willemientje en Alberdien/Alberdine.
Er zijn 1.039 anagrammen van vrouwennamen die geen enkel bigram gemeenschappelijk hebben, waaronder de lange namen Mariandel/Lamerdina, Adrianne/Arendina, Carolein/Cornelia, Coralien/Carolein, Kniertje/Trijneke, Tjerkien/Trijneke en Kniertje/Trijneke. Kortere anagrammen met maximale complexiteit zijn bijvoorbeeld Mariken/Remkina, Elsina/Liesan, Cylia/Caily, Myra/Mary en May/Amy.
Dat geldt ook voor 790 anagrammen van mannennamen met onder andere de lange Wolterus/Trouwels, Eltinus/Luitsen, Leandro/Renaldo, Leonard/Roeland, Renaldo/Roeland. Kortere anagrammen met maximale complexiteit zijn bijvoorbeeld Teunis/Tienus, Claus/Lucas, Elko/Loek, en Rob/Bor.
Wanneer een voornaam meerdere anagrammen kent, is er een onderscheid te maken naar complexiteit. Zoals voor Nelie, waar Ileen geen bigram gemeenschappelijk mee heeft, gevolgd door Eleni, Lenie en Ilene met 1 bigram, en Elien, Liene, en Eline met 3 gemeenschappelijke bigrammen. Dat klopt naar mijn gevoel intuïtief wel met het ervaren verschil met Nelie.
Nu hoeft mijn intuïtie niet maatgevend te zijn, maar er is onderzoek gedaan waarbij proefpersonen een non-woord kregen en uit de letters daarvan een bestaand woord moesten vinden (anagram solving). Welk woord er valt er met de letters in sinum te maken? Eigenschappen van bigrammen in het gegeven woord en het doelwoord bepalen (mede) de mogelijkheid en de snelheid van oplossing. Dus bigrammen als basis voor anagramcomplexiteit is zo’n slecht idee nog niet.
- Het bestand dat gedownload kan worden is een zip-file met daarin drie tekstbestanden (26.012 familienaamanagrammen en 9.933 voornaamanagrammen voor mannen- en vrouwennamen) die uitgelegd worden in vooraf_lezen.txt, en een Excel-bestand met dezelfde gegevens.
- Uit sinum is minus te maken.
Ferguut zegt
Het merkwaardigste anagram in het Nederlands, vermeld door Battus in Opperlandse taal- & letterkunde, is waarschijnlijk aalscholver/schollevaar. De woorden vormen niet alleen een anagram, maar zijn ook synoniem. Complexiteit: 50.
Paulus Voerman zegt
Ik vond hem niet in het exelbestand, maar ik was ooit getrouwd met een TREURIGE GEERTRUI