Voornamendrift (31)
Door Gerrit Bloothooft
Met een model moet je ook kunnen voorspellen. Omdat ik denk populariteitsverdelingen van voornamen goed te kunnen modelleren als verspreiding door een sociaal netwerk, wil ik me wel eens wagen aan het voorspellen van de top-20 van jongensnamen in 2018 die in januari 2019 bekend zal worden gemaakt. Ik denk dat die er zo uit zou kunnen zien (met ter vergelijking de lijst van 2017):
2017 2018
1 Noah (635) Noah (692)
2 Sem (631) Daan (591)
3 Lucas (629) Lucas (583)
4 Finn (615) Sem (548)
5 Daan (614) Luuk (545)
6 Levi (609) Jesse (532)
7 Milan (583) Adam (532)
8 Bram (573) Finn (530)
9 Luuk (572) Levi (495)
10 Jesse (532) Milan (489)
11 Liam (510) Liam (486)
12 Mees (475) James (475)
13 Thomas (471) Mees (458)
14 Sam (466) Bram (450)
15 Thijs (462) Sam (445)
16 Adam (461) Noud (425)
17 James (452) Thijs (423)
18 Max (437) Benjamin (414)
19 Noud (426) Dex (414)
20 Julian (419) Mason (392)
Veranderingen in voorkeuren gaan relatief langzaam en in het lijstje is het vooral stuivertje wisselen, alhoewel Noah zich stevig aan de top heeft genesteld. De verschillen in aantal zijn klein, en de plaatsen kunnen gemakkelijk meerdere posities anders worden dan ik voorspel. Niettemin dalen veel namen en verdwijnen Thomas, Max en Julian uit de top-20. Daarentegen zijn Adam en James sterke stijgers en komen Benjamin, Dex en Mason binnen. Daarvan zullen Benjamin en Dex niet, maar Mason over een aantal jaar wel door kunnen stoten. Omdat meerdere processen een rol kunnen spelen bij populariteit zijn de variabelen voor het modelleren van de verdelingen handmatig en niet automatisch bepaald. Dat laat ik per naam zien. Verschillende namen hebben onderscheiden aanloopperioden wat kan duiden op een groep ouders met een voortrekkersrol. En af en toe heeft de naamkeuze van een BN’er een kort maar hevig additioneel effect.
(1) De topnaam Noah is al een paar jaar vrij stabiel in de top van de verdeling. Dat blijft nog een paar jaar zo voordat de daling inzet. In de beginjaren was er een snelle stijging met kleine terugval, wat duidt op twee processen. Een extra piekje in ongeveer dezelfde tijd is ook te zien bij Lucas, Daan, Jesse en Sem, en door mij alleen voor de laatste verklaarbaar.
(2) Daan is er al vanaf de jaren 70 met een voorloper van zo’n 1600 jongens. De hoofdstroom kwam een paar jaar later op gang. Met een extra piekje in 2002. Daan was tussen 2001 en 2014 lang een top-3 naam, maar zakt nu weg. Omdat andere namen nog sterker dalen, stijgt Daan zelfs naar plaats 2.
(3) De naam Lucas was er natuurlijk al lang, en werd stabiel aan jaarlijks zo’n 130 kinderen gegeven. Ik ga er in het model vanuit dat dat zo blijft. Aan het einde van de vorige eeuw kwam Lucas als modenaam op, waarschijnlijk voor een andere groep ouders. Er was een extra piekje in 2003. Ook deze mode loopt inmiddels terug. Vergelijk met Luuk op 5.
(4) Sem laat ook een uitschieter zien, maar dan vlak voor de top van de verdeling. Dat is waarschijnlijk het gevolg van de geboorte in 2003 van Sem, zoon van BN’er Wendy van Dijk. Het is een tijdelijk effect, vergelijkbaar met het al besproken Britney. Er is een groep ouders die reageert op de in de media aangekondigde geboorte van Sem van Dijk en noemt hun zoon ook zo. Na een paar jaar is dat effect verdwenen. Inmiddels is Sem op zijn retour. Sem is in dezelfde periode ook aan meisjes gegeven met een piekje van 48 in 2002. Daarna was het snel afgelopen, en wonnen de jongens overduidelijk.
(5) Als korte vorm van Lucas doet ook Luuk het goed. De naam startte in de jaren zestig van nul en bouwde rustig aan de populariteit. Opmerkelijk is dat Luuk als modenaam eerder opkwam dan Lucas zelf. Het lijkt er op dat Luuk na 2008 een extra, nog onverklaard zetje kreeg waarvan het effect nu wel weer verdwenen is.
(6) Jesse heeft vanaf na een aanloopfase in de jaren 80 vanaf 1995 tussen de 500 en 750 naamdragers. Omdat die periode erg lang is, wordt het met twee opmerkelijk identieke populariteitsgolven gemodelleerd. Tenzij er nog zo’n golf komt zal Jesse nu dan wel gaan dalen.
(7) Waar alle voorgaande namen in of voorbij hun top zitten, is Adam nog onderweg naar boven. Waar dat toe leidt is moeilijk te voorspellen. Ik geef twee alternatieven waarbij de top in 2023 of 2027 bereikt zal worden en houd de conservatieve route aan. In het laatste model zou Adam mogelijk de populairste naam kunnen worden in zijn toptijd. Adam was er trouwens altijd al met z0’n 20 geboorten per jaar, tot hij eind jaren 80 mode werd.
(8) Finn is een snelle stijger en brak na 2000 echt door. Het is naar verwachting ook een snelle daler, en dat zal dit jaar moeten blijken. Toch nog wel een achtste plaats.
(9) Levi is een van de snelst stijgende namen geweest en haalde in 2013 plaats 3 in de lijst. Net zoals Daan (en verderop Milan, Liam, Bram en Thijs) is er een korte voorloper van een groep van ca 1150 ouders die Levi op de kaart zette.
(10) Ook Milan steeg snel met een klein aanloopje naar zo’n 750 naamdragers. Maar de daling is inmiddels duidelijk ingezet.
(11) Liam had een opzetje van 1300 ouders nodig, maar brak toen supersnel door. In 10 jaar de top halen is uitzonderlijk. Maar zo gewonnen zo geronnen, Liam zal snel verdwijnen, die zien we in 2019 niet meer in de top-20 maar in 2018 nog wel.
(12) James is een klassieke Engelse naam met toekomst. Hij was altijd aanwezig met 15 naamdragers per jaar maar is vanaf 2010 mode en nog lang niet aan de top. Hij kan wel eens een concurrent worden van de ook al oude nieuwkomer Adam. Als stijger zijn er voor James ook andere scenario’s mogelijk maar dat maakt voor 2018 nog niet veel verschil. De top zal tussen 2024 en 2026 liggen.
(13) Mees schommelt wat rond zijn maximale waarde en staat op het punt om af te glijden, maar nog niet in 2018.
(14) Als roepnaam van Abraham maakte Bram evenals Luuk (van Lucas) en Daan (van Daniël) in de jaren zestig zijn officiële entree. Net als Daan begon Bram in dezelfde tijd met een een aanjager met 3000 kinderen, terwijl gelijktijdig de wat tragere hoofdstroom op gang kwam. Rond 2010 was Bram maximaal populair. Toen in 2011 in Goede Tijden Slechte Tijden Bram Bouwhuis werd geboren had dat een extra piek in de populariteit van Bram tot gevolg. Maar dat effect is voorbij en nu daalt Bram definitief.
(15) Sam heeft extra ouders aangeboord rond 2000, maar heeft nu zijn langste tijd gehad. Blijft in 2018 nog wel even hangen. Sam liep in de beginjaren iets voor op Sem waar hij in de Engelse uitspraak vrijwel gelijk aan is. De Nederlandse of Engelse uitspraak kan wel eens gekoppeld zijn aan verschillende groepen ouders.
(16) Ook Noud had een kleine aanjager van 650 ouders, maar brak daarna snel door. Deze korte vorm van Aarnoud zit nu aan zijn top en een beetje op de wip in de top-20.
(17) Thijs heeft twee onderscheiden pieken gehaald (die nog duidelijker eerder al eens bij Femke besproken zijn, opmerkelijk genoeg in ongeveer dezelfde jaren), en sprak blijkbaar twee achtereenvolgende groepen ouders aan. Hij is al meer dan 10 jaar dalend, en zal spoedig uit de top-20 zakken, maar nog niet in 2018. De naam Thijs werd al lang gegeven als korte vorm van Matthijs, aan zo’n 20 jongens per jaar. Modelmatig neem ik aan dat die basis, net als bij Lucas, blijvend is.
(18) Ook Benjamin was er jaarlijks altijd al met 40 jongens, maar had in de jaren 80 een eerste modetop, en zit nu in de top van de tweede. Veel meer namen dan 400 jongens zijn er jaarlijks niet meer te verwachten en Benjamin zal ook weer snel de top-20 verlaten.
(19) Zonder noemenswaardige aanloop brak Dex (kort van Dexter) in 2008 door om na 10 jaar de top te bereiken, en daarmee net de top-20 te halen. Hierna moet het de komende jaren snel bergafwaarts gaan en na 2018 weer uit de top-20.
(20) Nieuwkomer Mason zit nog niet aan de top, dat kan wel tot rond 2024 duren. De voortgang van de stijging is moeilijk te voorspellen, Mason zou ook op plaats 16 kunnen binnenkomen.
Er zijn 17 namen in de top-20 die dalen of aan de top zitten. Dat geeft de komende jaren ruimte voor nieuwe namen. Maar stijgende namen laten zich moeilijker voorspellen, dat houdt de toekomst toch nog een beetje spannend.
De ontwikkelingen in Nederland staan overigens niet op zichzelf. In België staan Noah, Liam (landelijk de topnaam), Adam (sterk op 1 in Brussel), Lucas en Finn in de top-20 van 2017. Daarmee houdt de overeenkomst wel op.
- De gegeven aantallen zijn genormeerd voor het totaal aantal geboorten per jaar en wijken daarom iets af van de getallen die in de voornamenbank te vinden zijn. Het geboortecijfer varieerde na 1980 tussen 206.000 (in 2000) en 169.000 (in 2017) kinderen per jaar.
- In de legenda is j het modelmatige startjaar van de verdeling, v de imitatiesnelheid (de kans dat de naam van een kind binnen een jaar door andere ouders wordt gekozen voor hun kind), en n het modelmatig te verwachten totaal aantal kinderen dat de naam zal krijgen.
- Wanneer de voorloper niet heel sterk is, heeft de aanloop van de naam een exponentieel karakter (vgl Levi) en is een beschrijving met een logistische verdeling mogelijk. Maar voor veel namen is de voorloper goed herkenbaar, en zou ook modellering met twee logistische verdelingen vragen. Dit aspect is in de literatuur voor zover ik kan overzien nog niet opgemerkt cq behandeld, de aandacht ligt helemaal bij unimodale verdelingen.
Wouter van der Land zegt
Wat geweldig, dit is iets om ook als persbericht rond te sturen!
Een knagende vraag: zijn er ook trends wat betreft het aantal lettergrepen en bijvoorbeeld de beginletters en letter/klankfrequenties? Ik zie dat er volgens de voorspelling een afname van 1 in éénlettergrepige namen en zowaar een drielettergrepige. Ik heb het idee dat meerlettergrepig (afgezien van traditienamen als Mohammed) een tegentrend t.o.v. de monosyllabische kinderen is.
gerrit bloothooft zegt
Dank voor je enthousiasme! Volgende week eerst nog mijn voorspellingen voor meisjesnamen. Ik weet niet of de media voor een voorspelling warm lopen. Voor mij wordt het pas echt interessant in januari als de feitelijke jaarcijfers bekend worden. Als die redelijk overeenstemmen zou ik voorspellingen kunnen doen voor de komende jaren. Dat is wel spannend.
De populariteit van beginletters heb ik al eerder laten zien. En ook de lengte van de naam (die afneemt met de tijd). Dat is niet helemaal hetzelfde als lettergrepen maar geeft een goede indicatie dat dat aantal ook afneemt (alhoewel Benjamin inderdaad 3 lettergrepen heeft). Klanken is weer wat lastiger omdat de grafeem-foneem omzetting van namen niet met standaardregels gedaan kan worden (en ook nog rekening gehouden moet worden met meerdere talen).
Wouter van der Land zegt
Het is denk ik groot nieuws dat naamtrends (mogelijk) zeer voorspelbaar zijn. Ouders denken vaak dat ze de naam voor hun kind in vrijheid kiezen.
Een probleem is neem ik aan dat de namen in de voornamenbank niet verrijkt zijn met informatie over eventuele roepnaam e.d. Ik zie in de omgeving van mijn zoon (drielettergrepig, 7 jaar) dat er allerlei andere kinderen een drielettergrepige of zelfs vierlettergrepige naam hebben: Isabella, Alexander, etc, waarbij de ouders de naam ook altijd volledig uitspreken. Het kan denk ik zijn dat in het algemeen de lengte afneemt (door de afzakking van traditie staat Luuk niet meer als Lucas in de boeken), maar dat er wel degelijk ook een tegentrend is van mensen die bewust of onbewust de eenlettergrepige namen als te modieus zien. Een paar decennia was er vergelijkbaar de Jan-Diederik-trend om kinderen dubbele voornamen te geven. Mogelijk hebben ook namen als Mohammed en ‘Ghetto’-achtige namen invloed op meerlettergrepigheid. Het is een manier om aandacht af te dwingen, een algemeen menselijk streven. Eenlettergrepigen zetten in op laagdrempeligheid.
Een probleem met eenlettergrepig is ook dat die namen voor het gevoel eigenlijk te kort zijn, zeker als het ook nog eens een korte lettergreep is. Elke ouder van een Sem verlengt weleens tot Semmie. De nummer één ‘Noah’ is een bijna minimale tweelettergrepige naam, maar wel tweelettergrepig. Je kunt hem heerlijk uitschreeuwen over het voetbalveld (al is het een tennisnaam).
Roger van Bever zegt
@ Gerrit Bloothooft
Ik kocht lang geleden een boek met een verzameling lezersbrieven naar The Times toen deze krant nog wat eerbiedwaardiger was dan nu. Ieder jaar stuurde een lezer de frekwentie van de voornamen die in het voorafgaande jaar aan kinderen was gegeven.
Ik vraag mij af of uw voorspellingsmodel ook voor meisjesnamen van toepassing is en of de roepnaam daar vaker een rol speelt idan bij de jongens. Wordt bij meisjesnamen nog even vaak een diminutivum gebruikt als vroeger? Mathilde wordt Til of Tilleke, Anna wordt Anneke, Ansje, etc..
Is het ook mogelijk van de gegeven voornamen een uitsplitsing te geven naar socio-economische klasse. Waarschijnlijk niet, want ik neem aan dat zulks niet in de voornamenbank staat.
Ik heb het idee dat de invloeden zo snel wisselen dat er moeilijk een model op te stellen is dat voorspellend kan zijn.
gerrit bloothooft zegt
De voorspellingen voor meisjes komen de volgende week (en het werkt op dezelfde manier). De roepnaam is een andere kwestie. Het geval wil dat we er recent in geslaagd zijn een groot corpus aan te leggen van officiële naam en opgegeven roepnaam. Daar zullen we de komende tijd over rapporteren. Het is mogelijk om voornamen en sociale klassen indicatief met elkaar te associëren, zie Bloothooft, G. and D. Onland (2011), ‘Socioeconomic determinants of first names’, Names 59, 1, 25-41. Het model laat juist zien dat veranderingen voorspelbaar zijn, en eigenlijk vrij langzaam verlopen. Het kan tussen 10 en 40 jaren duren voordat een modenaam de top bereikt. Maar verrassingen zijn er ook op zijn tijd.
Willem van Maren zegt
In een zeer ver verleden heb ik veel te maken gehad met multimodale lognormale verdelingen. Die bleken redelijk goed uit elkaar te halen met behulp van een relatieve cumulatieve frequentie plot. Dat middel had ik gevonden in de literatuur. Auteur of titel kan ik me niet herinneren. Jammer, misschien had het u geholpen. Al in de jaren tachtig waren er voor die analyse ook pc-programma’s.
Ik lees uw artikelen met heel veel belangstelling.
gerrit bloothooft zegt
Ja, ik zou idealiter de modellering met een algoritme voor multimodale verdelingen willen doen. Dat is een wens voor de toekomst. Lastig zijn de ‘extra’ piekjes die door het algoritme niet over het hoofd gezien moeten worden, waarbij die piekjes een exponentieel dalende reactie kunnen zijn op een impuls (zoals bij Bram) en anders dan de grote pieken. Ook moet rekening gehouden worden met basislijn voor sommige namen. Daarom heb ik het ‘op het oog’ gedaan, en daar valt wat op af te dingen.