Voornamendrift (26)
Door Gerrit Bloothooft en David Onland
Welke voorletter genereert de meeste verschillende voornamen? Deze vraag werd gesteld naar aanleiding van een eerdere bijdrage over chocolade letters: hoeveel stuks moeten fabrikanten per letter maken. Het aantal verschillende namen per beginletter valt te tellen en dat deden we voor alle geboorten tussen 2005-2014 en ter vergelijking ook voor de periode 1925-1934. Dit zijn de lijstjes van veel naar weinig:
2005-2014:
Vrouwen: S, J, A, M, D, L, R, N, C, E, K, T, F, G, I, Y, B, H, Z, P, V, W, O, Q, X, U
Mannen: J, D, S, R, A, M, T, G, K, L, C, B, E, N, Y, F, H, I, P, Z, O, V, W, Q, X, U
1925-1934:
Vrouwen: A, M, E, L, H, G, S, J, T, R, W, B, F, D, C, I, K, P, N, O, V, Z, U, Y, Q, X
Mannen: A, H, G, R, E, J, S, M, L, W, T, B, F, C, D, I, P, K, N, O, V, U, Z, Y, Q, X
Er zijn opvallend veel overeenkomsten tussen de reeksen. De positie van een letter verschilt zelden meer dan vijf voor mannen en vrouwen in een periode (en vaak ook tussen de perioden met uitzondering van D, N, H, W, Y). Maar het is informatiever om de aantallen erbij te geven, en ook het totaal aantal naamdragers per beginletter. Dat doen we in figuur 1 voor 2005-2014.
We zien niet helemaal onverwacht dat beginletters met veel naamdragers ook veel verschillende namen genereren, iets meer voor meisjes dan voor jongens. Maar ook dat er een flinke spreiding is. Als een beginletter veel topnamen genereert is dat een flinke bijdrage tot het totaal aantal naamdragers, en de ene letter is daarin wat meer succesvol dan de andere. Bij jongens is de J het meest productief met Jayden, Jesse, Julian, Jens, Jan, Jurre, Joep, Jack, Jason, Joey, Jasper, James, Johannes, Jip, Joris, Jelle allemaal in de top-100. Bij meisjes is dat de S met Sophie, Sara, Saar, Sarah, Sanne, Sofie, Suze, Sophia, Sofia, Suus, Senna.
Het beeld voor 1925-1934 (figuur 2) is heel anders. Alhoewel het totaal aantal (beschikbare) geboorten in beide periode redelijk overeenstemt [1925-1934: mannen 715.359, vrouwen 724.739; 2005-2014: jongens 890.713, meisjes 849.137], verschilt het totaal aantal verschillende voornamen een factor vijf tot zeven [1925-1934: mannen 7.611, vrouwen 12.038; 2005-2014: jongens 50.382, meisjes 59.752]. In 1925-1934 zijn er veel minder verschillende voornamen dan nu, en er zijn de nodige uitschieters wat betreft het aantal naamdragers. De J springt eruit met verhoudingsgewijs veel naamdragers voor mannen (door Johannes/ Jan). Bij de meisjes zijn dat J (Johanna), A (Anna/Adriana, Adriaan ook voor mannen) en M (Maria), en voor beide geslachten in wat mindere mate P,C, W, G, H waar de traditionele topnamen Pieter/Petrus/Petronella, Cornelis/Cornelia/Catharina, Willem/Wilhelmina, Gerrit/Geertje en Hendrik/Hendrika mee verbonden zijn.
De algemene toename van het aantal verschillende voornamen tussen vroeger en nu komt enerzijds omdat ouders creatiever kunnen zijn sinds verplichte vernoeming is losgelaten. Anderzijds hebben andere talen en culturen hun eigen naamvoorraad ingebracht. Dan is het is opvallend dat de huidige relatieve productiviteit per beginletter ondanks enige verschillen toch veel overeenkomsten heeft met die van 80 jaar geleden.
- We bespraken eerder de Zipfiaanse relatie tussen het aantal verschillende voornamen met een bepaald aantal naamdragers. In deze bijdrage gaat het over het totaal aantal verschillende voornamen en het totaal aantal naamdragers, per beginletter. Daar moet een verband tussen zitten. De Zipfiaanse verdeling voor een beginletter B is nB(f) = nB(1)/ fα , met nB het aantal verschillende namen, f het aantal naamdragers en α als coëfficiënt. Het totaal aantal naamdragers TB = ∑ nB(f) * f = nB(1)/ ∑ fα-1, met sommatie over f van 1 tot fB,max, de frequentie van de topnaam met beginletter B. Het totaal aantal verschillende namen NB = ∑ nB(f) = nB(1)/ ∑ fα met dezelfde sommatiegrenzen.Daaruit volgt dat NB = TB * ∑ fα-1 / ∑ fα . Als fB,max en α voor elke beginletter B gelijk zouden zijn, dan is ∑ fα-1 / ∑ fα constant en zijn NB en TB evenredig. Die lineaire relatie vinden we een beetje in figuur 1. Nu varieert α niet zo veel (wel iets tussen mannen en vrouwen), maar als een voorletter een topnaam met grote fB,max genereert kan dat NB onevenredig vergroten. Het effect daarvan zien we in de spreiding, vooral in figuur 2.
De invloed van topnamen is klein als we alleen kijken naar nieuwe namen met nog maar heel weinig naamdragers. De relatie staat in figuur 3 voor namen die in de periode 2005-2014 voor het eerst zijn gegeven.
DirkJan zegt
Ik had de vraag destijds gesteld. Hartelijk dank voor het antwoord.