• Door naar de hoofd inhoud
  • Skip to secondary menu
  • Spring naar de eerste sidebar
  • Spring naar de voettekst
Neerlandistiek. Online tijdschrift voor taal- en letterkunde

Neerlandistiek

Online tijdschrift voor taal- en letterkundig onderzoek

  • Over Neerlandistiek
  • Contact
  • Homepage
  • Categorie
    • Neerlandistiek voor de klas
    • Vertelcultuur
    • Naamkunde
  • E-books
  • Neerlandistische weblogs
  • Archief
    • 10 jaar taalcanon
    • 100 jaar Willem Frederik Hermans
  • Jong Neerlandistiek
  • Frisistyk
  • Mondiaal

Historical Corpus of Dutch staat online

13 april 2025 door Roland de Bonth Reageer

Vorige week donderdag is het Historical Corpus of Dutch (HCD) online gekomen. Het wil een belangrijke leemte opvullen in de onderzoeksinfrastructuur voor historisch Nederlands, dat lange tijd geen evenwichtig corpus heeft gehad met gegevens uit alle eeuwen en uit verschillende regio’s en genres. De HCD is gebouwd door onderzoekers van de Vrije Universiteit Brussel en de Universiteit Leiden en wordt beschikbaar gesteld door het Instituut voor de Nederlandse Taal.

Structuur van de HCD

Het HCD is een diachroon, regionaal gebalanceerd, multigenre corpus van geschreven Nederlands. Het is opgebouwd langs drie variationele dimensies: tijd, regio en genre.

Tijd

Het HCD beslaat de zestiende tot en met de negentiende eeuw. Tekstmateriaal werd gekozen rond het midden van elke eeuw: 1550, 1650, 1750 en 1850. Voor elk van deze data werd een marge van 20 jaar voor en 20 jaar na de datum ingebouwd om voldoende bronnen te vinden, wat resulteerde in vier tijdsperioden: 1530-1570, 1630-1670, 1730-1770 en 1830-1870.

Regio

Het HCD omvat tekstmateriaal uit vier regio’s in de noordelijke en zuidelijke Nederlanden: Holland en Zeeland in het noorden (in het huidige Nederland), en Brabant en Vlaanderen in het zuiden (in het huidige België). Holland en Brabant kunnen worden beschouwd als centrale regio’s, terwijl Zeeland en Vlaanderen een meer perifere positie innemen, zodat het corpus ook kan worden gebruikt om de dynamiek tussen centrum en periferie te onderzoeken. Teksten zijn afkomstig uit grotere steden zoals Amsterdam, Antwerpen, Middelburg en Gent, maar ook uit kleinere steden en dorpen (bijv. Arnemuiden, Strijpen).

Genre

Het HCD bestaat uit administratieve teksten, egodocumenten en pamfletten. De administratieve teksten zijn handgeschreven, formele teksten, zoals verslagen van gemeenteraadsvergaderingen en resoluties. De auteurs van deze teksten waren over het algemeen gewend om te schrijven vanwege hun beroep. De bronnen voor dit genre hadden enerzijds te maken met gilden of industrie en anderzijds met het algemeen bestuur. Ego-documenten zijn minder formele, handgeschreven teksten zoals reisverslagen, dagboeken en kronieken van lokale gebeurtenissen of familiegeschiedenis. De pamfletten zijn gepubliceerde teksten, meestal commentaren of polemieken over actuele zaken, politiek of religieuze onderwerpen, maar ook openbare verordeningen en voorschriften. Door de verscheidenheid aan documenten kunnen gedrukte pamfletten variëren op het continuüm tussen meer en minder formeel.

Procedure

Alle tekstuele materialen werden handmatig getranscribeerd van foto’s van de originele documenten en meerdere keren gecontroleerd. Wanneer we bestaande transcripties gebruikten, zoals in het geval van sommige administratieve teksten, werden deze gecontroleerd aan de hand van het originele archiefmateriaal. Verwijzingen naar publicaties, bibliotheken en archieven zijn te vinden in Van de Voorde (2022).

Omvang

Het HCD bestaat uit 209 teksten, samen goed voor 463.248 woorden. Het bestaat uit 58 administratieve teksten, 60 egodocumenten en 91 pamfletten. We streefden naar 10.000 woorden per regio en per periode voor elk genre. Omwille van de representativiteit werden deze 10.000 woorden bij voorkeur verspreid over meerdere documenten. In de meeste gevallen gaat het dus om fragmenten en niet om volledige teksten. Onderstaande figuur, overgenomen uit Van de Voorde et al. (2023), toont het aantal woorden per genre, periode en regio. De meeste afwijkingen van de beoogde 10.000 woorden zijn te vinden in de zestiende eeuw. Een kleinere lacune kan worden opgemerkt voor de negentiende-eeuwse egodocumenten uit Brabant.

De waarde van dit nieuwe corpus wordt geïllustreerd aan de hand van enkele kleine casestudies in Van de Voorde, Rutten, Vosters, Van der Wal & Vandenbussche 2023.

Het HCD is te raadplegen via deze link: https://hcd.ivdnt.org/corpus-frontend/HCD/search/

Literatuur

Van de Voorde, Iris. 2022. Pluricentriciteit in de taalgeschiedenis: Bouwstenen voor een geïntegreerde geschiedenis van het Nederlands (16de-19de eeuw). Amsterdam: LOT.

Open access: https://www.lotpublications.nl/pluricentriciteit-in-de-taalgeschiedenis

Van de Voorde, Iris, Gijsbert Rutten, Rik Vosters, Marijke van der Wal & Wim Vandenbussche. 2023. ‘Historical Corpus of Dutch: A new multi-genre corpus of Early and Late Modern Dutch’. Taal & Tongval 75: 114-132.

Open access: https://www.aup-online.com/content/journals/10.5117/TET2023.1.006.VAND

Delen:

  • Klik om af te drukken (Opent in een nieuw venster) Print
  • Klik om dit te e-mailen naar een vriend (Opent in een nieuw venster) E-mail
  • Klik om te delen op Facebook (Opent in een nieuw venster) Facebook
  • Klik om te delen op WhatsApp (Opent in een nieuw venster) WhatsApp
  • Klik om te delen op Telegram (Opent in een nieuw venster) Telegram
  • Klik om op LinkedIn te delen (Opent in een nieuw venster) LinkedIn

Vind ik leuk:

Vind-ik-leuk Aan het laden...

Gerelateerd

Categorie: Nieuws Tags: corpora, historische taalkunde

Lees Interacties

Laat een reactie achterReactie annuleren

Deze site gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie gegevens worden verwerkt.

Primaire Sidebar

Gedicht van de dag

Frans Budé • Parkscènes

Hij begroet de bomen, zwaait naar de eenden
in de vijver, de blinkende kiezels op de bodem.

➔ Lees meer

Bekijk alle gedichten

  • Facebook
  • YouTube

Chris van Geel

De koeien schemeren door de heg,
het paard is uit taaitaai gesneden,
in ieder duindal ligt dun sneeuw.

De branding vlecht een veren zee
waar zon over omhoog stijgt, licht waarin
geen plaats om uit te vliegen is.

Bron: Uit de hoge boom geschreven, 1967

➔ Bekijk hier alle citaten

Agenda

11 december 2025: Anne Frank, schrijfster

11 december 2025: Anne Frank, schrijfster

3 december 2025

➔ Lees meer
11 december 2025: Proefcollege Nederlands

11 december 2025: Proefcollege Nederlands

2 december 2025

➔ Lees meer
5 december 2025: Intreerede Jolyn Philips

5 december 2025: Intreerede Jolyn Philips

28 november 2025

➔ Lees meer
➔ Bekijk alle agendapunten

Neerlandici vandaag

geboortedag
1946 Dick Wortel
➔ Neerlandicikalender

Media

Dichter Esther Jansma (24 december 1958-23 januari 2025)

Dichter Esther Jansma (24 december 1958-23 januari 2025)

2 december 2025 Door Redactie Neerlandistiek Reageer

➔ Lees meer
De postkoloniale podcast met Remco Raben over Pramoedya Ananta Toer

De postkoloniale podcast met Remco Raben over Pramoedya Ananta Toer

30 november 2025 Door Redactie Neerlandistiek Reageer

➔ Lees meer
Peter van Zonneveld over Tjalie Robinson/Vincent Mahieu (1993)

Peter van Zonneveld over Tjalie Robinson/Vincent Mahieu (1993)

29 november 2025 Door Redactie Neerlandistiek Reageer

➔ Lees meer
➔ Bekijk alle video’s en podcasts

Footer

Elektronisch tijdschrift voor de Nederlandse taal en cultuur sinds 1992.

ISSN 0929-6514
Bijdragen zijn welkom op
redactie@neerlandistiek.nl
  • Homepage
  • E-books
  • Neerlandistische weblogs
  • Over Neerlandistiek
  • De archieven
  • Contact
  • Facebook
  • YouTube

Inschrijven voor de Dagpost

Controleer je inbox of spammap om je abonnement te bevestigen.

Copyright © 2025 · Magazine Pro on Genesis Framework · WordPress · Log in

  • Homepage
  • Categorie
    • Voor de klas
    • Vertelcultuur
    • Naamkunde
  • Archief
    • 10 jaar taalcanon
    • 100 jaar Willem Frederik Hermans
  • E-books
  • Neerlandistische weblogs
  • Jong Neerlandistiek
  • Frisistyk
  • Mondiaal Neerlandistiek
  • Over Neerlandistiek
  • Contact
 

Reacties laden....
 

    %d