Door Roland de Bonth
Voornamen vormen een interessant onderzoeksobject. Dat heeft Gerrit Bloothooft de afgelopen jaren aangetoond in tientallen bijdragen op Neerlandistiek. Voor die column onder de titel Voornamendrift maakte Bloothooft gebruik van gegevens uit de Basisregistratie Personen (BRP) en – voor recentere namen – van gegevens van de Sociale Verzekeringsbank. Beide bestanden lagen aan de basis van de ook bij niet-neerlandici zeer populaire Nederlandse Voornamenbank. Voor veel voornamen is daarin de jaarlijkse populariteit vanaf 1880 opgenomen. Gaan we verder terug in de tijd dan zijn de gegevens onvollediger en boeten uitspraken over de populariteit van namen aan betrouwbaarheid in.
Nu zijn de afgelopen decennia duizenden vrijwilligers bezig geweest om geboorte-, huwelijks- en overlijdensakten uit de burgerlijke stand vanaf 1811 te ontsluiten. Binnen afzienbare tijd wordt het daardoor mogelijk de populariteit van een voornaam vanaf 1790 vast te stellen. Eind november 2019 presenteerden Bloothooft en Onland daarvan al een sneak preview op Neerlandistiek.
Bestaat er ook een manier om vast te stellen welke jongens- en meisjesnamen in de 17e en de 18e eeuw het populairst waren? Jazeker, daarvoor zou je álle nog bewaard gebleven doop-, trouw- en begraafboeken van de talrijke kerkgenootschappen in Nederland digitaal beschikbaar moeten maken. Dat zou een schat aan informatie opleveren, niet alleen over voornamen, maar bijvoorbeeld ook over de grootte van kerkgenootschappen, over sterftecijfers tijdens epidemieën en over bevolkingsgroei. Zover is het voorlopig nog lang niet.
Daarom heb ik een andere, minder voor de hand liggende en ongewone methode gekozen om de populariteit van voornamen uit het verleden te onderzoeken. Ik heb namelijk gebruik gemaakt van de metadata bij de tekstcorpora Brieven als Buit en Brieven als Buit-2, aanvullingen op het originele corpus.
Ik haast me om te zeggen dat dit onderzoek deels serieus, deels spielerei is. Uiteraard besef ik heel goed dat het door mij onderzochte materiaal te beperkt is om algemeen geldende uitspraken te doen over de voornamenkeuze in de Republiek. Wat ik met dit onderzoekje dan ook vooral wil laten zien is dat metadata bij tekstcorpora niet alleen waardevol zijn om uitspraken over taalgebruik te doen, maar ook geschikt zijn om andere vragen te beantwoorden.
Brieven als buit
Het materiaal voor dit onderzoek is afkomstig van de nieuwe, eind januari online gekomen versie van Brieven als Buit en de aanvullingen daarop, Brieven als Buit-2, eind februari online gekomen. Deze twee corpora bevatten een selectie uit de ongeveer 40.000 brieven die zeelieden en andere in het buitenland levende Nederlanders naar huis werden gestuurd. Omgekeerd werden ze ook verstuurd door achterblijvers die contact wilden houden met hun dierbaren. Veel brieven bereikten hun bestemming niet: ze werden als buit meegenomen door kapers tijdens de vier Engels-Nederlandse oorlogen in de 17e en 18e eeuw en geconfisqueerd door het Hooggerechtshof van de Admiraliteit (zie deze en deze aankondiging op Neerlandistiek).
Alle 1033 geselecteerde brieven uit Brieven als Buit zijn taalkundig verrijkt met lemma en woordsoort, en voorzien van uitgebreide metadata. Bij het corpus Brieven als Buit-2 heeft die taalkundige verrijking (nog) niet plaatsgevonden – je kunt deze 1386 brieven voorlopig dus alleen doorzoeken op woordniveau. Sommige metadata van Brieven als Buit-2 zijn deels onderzocht (zoals social class en age), andere zijn volledig nagegaan (zoals gender en text type).
Gender en Year
Hoe kunnen we met behulp van deze twee corpora nu onderzoek doen naar voornamen? Dat is eigenlijk heel eenvoudig als je gebruik maakt van de metadatacategorie Gender bij Sender. Ga naar het tabblad Extended Search, vul vervolgens in de zoekbalk bij Search for… geen enkele zoekterm in en druk dan op de knop Search. De zoekmachine gaat dan aan de slag, maar vindt uiteraard geen treffers. Wel wordt meegedeeld dat er gezocht is in 1033 documenten bij het oorspronkelijke Brieven als Buit-corpus. Groeperen we deze brieven op basis van het geslacht (Group docs by en dan bij Sender Group by Gender), dan blijkt dat 663 brieven (64,2%) zijn gestuurd door een man en 367 (35,5%) door een vrouw. Van 3 brieven (0,29%) is het geslacht van de afzender niet bekend. Eenzelfde exercitie kunnen we doen voor de 1386 documenten uit Brieven als Buit-2. Daarbij valt op dat het overgrote deel van die brieven is opgesteld door mannen: male 1179 (85,1%), female 205 (14,8%), unknown 2 (0,1%).
Omdat we op zoek zijn naar de populairste voornamen uit de 17e en de 18e eeuw bestaat de volgende stap uit het splitsen van deze gegevens over twee periodes. De eerste periode die ik heb gekozen, loopt van 1650-1699 en bestrijkt de tijd waarin de eerste drie Engelse zeeoorlogen plaatsvonden (1652-1654, 1665-1667 en 1672-1674), de tweede omvat de tweede helft van de 18e eeuw (1750-1799), waarin de vierde Engels-Nederlandse oorlog (1780-1784) plaats had.
Voor beide periodes heb ik de documenten geschreven door mannen en vrouwen (Filter Search by Letter, Year 1650-1699 (respectievelijk 1750-1799) en Filter search by Sender, male (respectievelijk female) gegroepeerd op de naam van de afzender (Group docs by, Group by Name Sender). Je krijgt dan een overzicht van alle unieke briefschrijvers; ze worden gerepresenteerd door het getal tussen haakjes in de onderstaande tabel. Dat dit getal lager uitvalt dan het totale aantal brieven uit die periode komt omdat van sommige afzenders meer dan één brief in het corpus is opgenomen.
Brieven als buit | |||
1650-1699 | 1750-1799 | ||
Mannelijk | 324 (255) | 339 (253) | |
Vrouwelijk | 268 (220) | 99 (71) |
Brieven als buit-2 | |||
1650-1699 | 1750-1799 | ||
Mannelijk | 306 (191) | 843 (494) | |
Vrouwelijk | 70 (56) | 122 (66) |
Sorteren en exporteren
De volgende stap was om elke groep uit elke periode én uit elk corpus afzonderlijk te sorteren op identiteit (Sort by Group Name). Dit leverde acht alfabetisch geordende lijsten op, vier per geslacht. Deze heb ik alle geëxporteerd naar Excel, met behulp van de knop Export for Excel. Daarna heb ik de gegevens uit beide corpora samengevoegd en gealfabetiseerd. Ik kreeg daarmee één lijst met mannennamen uit 1650-1699, één lijst met mannennamen uit 1750-1799, één lijst met vrouwennamen uit 1650-1699 en één lijst met vrouwennamen uit 1750-1799.
Deze lijsten waren nog niet gebruiksklaar voor ons voornamenonderzoek. Eerst heb ik alle personen met exact dezelfde voornaam en achternaam uit de lijst verwijderd – deze briefschrijvers komen dus zowel voor in Brieven als Buit als in Brieven als Buit-2. Deze doublures zouden een vertekend beeld kunnen geven van het aantal dragers van eenzelfde voornaam. Kleine verschillen in spelling waren voldoende om beide schrijvers in het bestand te laten staan. Zo beschouwde ik Daniël met een trema als een andere naam dan Daniel zonder trema, ook al kwam de achternaam overeen. Bovendien bleken bij nader inzien niet alle afzenders uit de Excelbestanden geschikt voor onze speurtocht naar populaire voornamen. Zo was van sommige briefschrijvers alleen de achternaam bekend en ondertekenden anderen niet met hun voornaam maar met hun voorlétters en achternaam. Ook de groep schrijvers van wie het geslacht wél maar de identiteit niet vastgesteld kon worden, moest buiten beschouwing blijven.
Mannelijke briefschrijvers
Als je de mannelijke briefschrijvers uit de periode 1650-1699 van Brieven als Buit en Brieven als Buit-2 optelt, kom je uit op 446. Na het verwijderen van dubbele personen, anonieme mannen en mannen zonder voornaam, bleven er uiteindelijk 397 individuen over. Het enige wat ik daarna moest doen was tellen hoe vaak een bepaalde voornaam in mijn Excelbestand voorkwam. Dat aantal vermeldde ik in een aparte kolom.
Om vervolgens vast te kunnen stellen welke voornamen het populairst waren voor mannen in de periode 1650-1699, hoefde ik het Excelbestand alleen nog maar te sorteren op die kolom met aantal voorkomens van de naam. Dit resulteerde in een lijst met 136 verschillende mannelijke voornamen: 87 voornamen waren uniek, 39 namen kwamen 2 tot 5 keer voor. De tweede kolom van de onderstaande tabel bevat de top-elf met namen die 7 of meer keer voorkwamen in 1650-1699.
Vervolgens heb ik de bovenstaande stappen herhaald voor alle mannelijke briefschrijvers uit de periode 1750-1799. De 747 verschillende groepen werden na ontdubbeling en verwijdering van anonieme mannen en mannen met alleen voorletters teruggebracht tot 570 personen. Samen droegen deze 570 mannen 174 verschillende namen. Daarvan kwamen er 121 voornamen maar één keer en 44 voornamen tussen de 2 en de 10 keer voor. De top-elf uit de tweede helft van de achttiende eeuw (kolom 5) bestond uit voornamen die 11 of meer malen aan mannen zijn gegeven.
Aantal | 1650-1699 | percentage | Aantal | 1750-1799 | Percentage |
66 | Jan | 17% | 82 | Jan | 14% |
30 | Cornelis | 8% | 40 | Pieter | 7% |
30 | Pieter | 8% | 32 | Cornelis | 6% |
13 | Jacob | 3% | 32 | Hendrik | 6% |
12 | Hendrik | 3% | 20 | Johannes | 4% |
11 | Johannes | 3% | 18 | Christiaan | 3% |
10 | Willem | 3% | 18 | Jacob | 3% |
8 | Adriaan | 2% | 14 | Willem | 2% |
7 | Abraham | 2% | 12 | Andries | 2% |
7 | Johan | 2% | 12 | Dirk | 2% |
7 | Klaas | 2% | 11 | Gerrit | 2% |
Vergelijken we de lijsten uit beide periodes met elkaar dan valt op dat de voornaam Jan in beide eeuwen veruit de populairste naam is die ouders aan een nieuwgeboren zoon gaven. De naam is absoluut en procentueel ruim twee keer zo vaak gekozen als de nummer 2. Opmerkenswaardig is ook dat de top-drie van namen voor beide tijdvakken identiek is én dat zij samen een kwart tot een derde van alle voornamen voor mannen bevatten. De naamgeving van mannelijke nakomelingen lijkt overigens überhaupt niet aan verandering onderhevig te zijn. De nummers 1 tot en met 7 uit 1650-1699 behoren alle tot de top-acht van 1750-1799.
Als er gedurende twee eeuwen in de populariteit van mannelijke voornamen zo weinig verandering te constateren valt, rijst de vraag of de hegemonie van die namen stand heeft gehouden tot aan 1880, het jaar waarop betrouwbare populariteitscijfers van voornamen bekend zijn. Om het antwoord hierop te kunnen geven, kunnen we gebruikmaken van de gegevens van de Nederlandse Voornamenbank. Omdat veel in Nederland wonende of opgegroeide briefschrijvers van de Brieven als Buit-corpora uit Noord- en Zuid-Holland komen, ben ik voor de jaren 1880 en 1950 nagegaan welke voornamen daar toen het vaakst voorkwamen. De toch wel verrassende conclusie die ik op basis van de gegevens uit de beide Brieven als Buit-corpora en de Nederlandse Voornamenbank durf te trekken is dat de namen Johannes, Cornelis, Jan, Pieter, Willem en Hendrik onverminderd populair zijn.
Noord-Holland (1880) | Noord-Holland (1950) | Zuid-Holland (1880) | Zuid-Holland (1950) |
Johannes (279) | Johannes (1447) | Johannes (397) | Johannes (1954) |
Jan (250) | Cornelis (853) | Cornelis (297) | Cornelis (1334) |
Cornelis (220) | Jan (729) | Jan (281) | Jan (1031) |
Pieter (181) | Hendrik (461) | Pieter (242) | Willem (848) |
Hendrik (148) | Willem (454) | Willem (234) | Pieter (765) |
Willem (136) | Petrus (421) | Hendrik (166) | Hendrik (624) |
Dirk (106) | Jacobus (410) | Arie (148) | Arie (521) |
Gerrit (92) | Robert (410) | Adrianus (131) | Adrianus (520) |
Jacobus (89) | Pieter (376) | Jacob (126) | Jacobus (493) |
Jacob (87) | Gerardus (343) | Dirk (125) | Robert (467) |
Vrouwelijke briefschrijvers
Van de 276 verschillende groepen briefschrijvers uit de periode 1650-1699 kwamen na samenvoeging van doublures en verwijdering van onbruikbare namen uiteindelijk 261 personen in aanmerking voor ons voornamenonderzoek. Van hen droegen er 89 een unieke voornaam, de andere 172 deelden met elkaar 34 verschillende voornamen.
Uit de periode 1750-1799 bleven er van de 137 briefschrijvers aanzienlijk minder over voor ons populariteitsonderzoek: hier bleef de teller steken op 94 verschillende personen. Dat leverde 52 verschillende namen op, waarvan 39 namen slechts één keer voorkwamen.
Bij het doornemen van de populairste vrouwennamen zien we dat er geen enkele naam is die met kop en schouders boven de rest uitsteekt: een vrouwelijke tegenhanger van Jan ontbreekt. Opvallend is verder dat – anders dan bij de mannen – de populairste vrouwennamen in de loop der jaren duidelijk veranderd zijn. In de 17e eeuw overheersen de verkleinvormen op –tje en –ke: maar liefst 11 van de 14 namen hebben een diminutiefsuffix. Een eeuw later staat er nog maar één dergelijke vorm tussen (Baukje); in de 18e eeuw zijn het de voornamen op –a die de lijst domineren. Alleen Elisabeth en Geertrui houden zich dapper staande en dat zijn niet voor niets namen die zowel op de 17e-eeuwse als op de 18e-eeuwse lijst voorkomen.
Aantal | 1650-1699 | percentage | Aantal | 1750-1799 | Percentage |
18 | Annetje | 6% | 11 | Catharina | 12% |
14 | Grietje | 6% | 8 | Johanna | 9% |
14 | Trijntje | 5% | 7 | Anna | 7% |
12 | Elisabeth | 4% | 7 | Maria | 7% |
12 | Maartje | 4% | 4 | Sara | 4% |
10 | Neeltje | 4% | 3 | Adriana | 3% |
9 | Jannetje | 4% | 3 | Elisabeth | 3% |
7 | Maria | 3% | 2 | Alida | 2% |
7 | Marietje | 2% | 2 | Baukje | 2% |
5 | Aaltje | 2% | 2 | Cornelia | 2% |
5 | Geertrui | 2% | 2 | Geertrui | 2% |
5 | Tanneke | 2% | 2 | Gerharda | 2% |
4 | Geertje | 2% | 2 | Helena | 2% |
4 | Maritje | 1% |
Tot slot
Hoewel dit voornamenonderzoek strikt genomen alleen een uitspraak kan doen over de voornamen in de Brieven als Buit-corpora – en eigenlijk dus alleen iets over de selectie die onderzoekers uit de circa 40.000 brieven hebben gemaakt, denk ik dat de uitkomsten toch een iets grotere reikwijdte hebben. De vergelijking bij de mannelijke voornamen met de gegevens uit de Nederlandse Voornamenbank heeft dat laten zien.
In dit onderzoekje is alleen gekeken naar de metadatacategorie Gender. Het lijkt me ook heel interessant om na te gaan welke namen er per sociale klasse gegeven werden. Verschillen die van elkaar of zijn er juist overeenkomsten? In de huidige Brieven als Buit-corpora zijn bepaalde sociale klassen helaas sterk ondervertegenwoordigd waardoor het niet mogelijk is daar onderbouwde uitspraken over te doen.
Wat zou het mooi zijn als alle gekaapte brieven uit de Nationale Archives in Kew getranscribeerd, taalkundig verrijkt en van metadata voorzien zouden zijn. Het onderzoek naar het alledaagse Nederlands uit lang vervlogen tijden zou daar zeer mee geholpen zijn, maar ook de naamkunde kan er zijn voordeel mee doen. Zou de voornamentoptien er dan anders uitzien?
Gerrit Bloothooft zegt
Wat een aardig onderzoek. Het bevestigt de gedachte dat de vernoemingstraditie al eeuwen de voornamenvoorraad gestabiliseerd heeft. Alhoewel de voornamenbank die start in 1790 helaas nog steeds niet voltooid is door het Meertens Instituut kan die wel al worden bekeken via http://www.meertens.knaw.nl/nvbnew. De verschillen in de lijstjes vrouwennamen in de periode 1650-1699 en 1750-1799 lijken erg op die tussen het protestantse noorden en westen, en het katholieke zuiden (buiten Sara en Baukje) van het land. In 1950 domineren nog steeds de traditionele vernoemingsnamen bij de mannen (Arie en Adrianus vind je vooral rond Rotterdam, zie mijn bijdragen over regionale voornamen), maar met modenaam Robert zie je de vernieuwing al komen.
Roland de Bonth zegt
Dank voor de link. Mooi dat het nu al mogelijk is om de populariteit van individuele voornamen vanaf 1790 te bekijken. Uit reacties op Facebook blijkt dat lokale doopboeken sommige mensen al geinspireerd heeft tot het bestuderen van voornamen. Dat zal in de (verrre) toekomst – als nog meer bestanden digitaal toegankelijk gemaakt en gekoppeld zijn – vast nog veel interessante gegevens over voornamen in de Lage Landen opleveren.
Frank Compernolle zegt
Waarom alleen de voornamen uit registers uit Nederland? Dat bestond nog niet met zijn huidige grenzen in de 17de en 18de eeuw. Kortzichtigheid? Of eens te meer vergeten dat ook bij de buren Nederlands gesproken wordt ?