• Door naar de hoofd inhoud
  • Skip to secondary menu
  • Spring naar de eerste sidebar
  • Spring naar de voettekst
Neerlandistiek. Online tijdschrift voor taal- en letterkunde

Neerlandistiek

Online tijdschrift voor taal- en letterkundig onderzoek

  • Over Neerlandistiek
  • Contact
  • Homepage
  • Categorie
    • Neerlandistiek voor de klas
    • Vertelcultuur
    • Naamkunde
  • E-books
  • Neerlandistische weblogs
  • Archief
    • 10 jaar taalcanon
    • 100 jaar Willem Frederik Hermans
  • Jong Neerlandistiek
  • Frisistyk
  • Mondiaal

Grote kranten uit Nederland en België nu ook in Corpus Hedendaags Nederlands

10 maart 2023 door Redactie Neerlandistiek Reageer

Afbeelding van Andrys Stienstra via Pixabay 

Om ontwikkelingen in het hedendaagse Nederlands in kaart te brengen legt het Instituut voor de Nederlandse Taal (INT) het Corpus Hedendaags Nederlands (CHN) aan: een steeds groeiende verzameling van Nederlandstalige teksten uit onder meer kranten. Onlangs heeft het INT een overeenkomst gesloten met DPG Media, het grootste mediabedrijf van Nederland en België. Hierdoor is het krantenmateriaal in het CHN uitgebreid met alle teksten uit het AD, de Volkskrant, Trouw, Het Parool, Het Laatste Nieuws en De Morgen.

Tot voor kort bevatte het Corpus Hedendaags Nederlands alleen teksten uit NRC, Het Nieuwsblad, De Standaard, Het Belang van Limburg en Gazet van Antwerpen. Door de samenwerking met DPG Media komen daar nu nog zes belangrijke kranten uit Nederland en België bij. Het krantenmateriaal wordt continu aangeleverd, en iedere maand is er een update van het CHN zodat de meest recente kranten direct doorzocht kunnen worden.

Belang van data

Het INT wil als kennisinstituut voor het Nederlands over de grootst mogelijke datacollectie beschikken om op deze wijze te kunnen bijdragen aan onderzoek en onderwijs. Directeur Frieda Steurs: ‘Zo is de recente hype rond ChatGPT en generatieve AI een goede reden om ook voor het Nederlands een zo krachtig mogelijk taalmodel te bouwen.’ DPG Media hoopt dat de beschikbaarheid van de teksten een bijdrage kan leveren aan wetenschappelijk taalonderzoek. Zakelijk directeur Bart Verkade: ‘De Nederlandse taal is voortdurend in ontwikkeling. Dit wordt weerspiegeld in de teksten in dagbladen en op hun sites. Nieuwe woorden en veranderend taalgebruik komen daar snel tevoorschijn. Wij zijn blij dat we taalwetenschappers kunnen helpen met de taal uit onze media.’

Wetenschappelijk onderzoek

Het Corpus Hedendaags Nederlands (CHN) is gratis toegankelijk voor wetenschappelijk onderzoek. Met het oog op auteursrechten is alleen wel een gebruikersnaam en wachtwoord vereist. Het CHN is automatisch taalkundig verrijkt met woordsoort en lemma. De aanwezigheid van metadata bij de teksten (titel, auteur, taal, publicatiejaar, medium) zorgt ervoor dat er gericht in het corpus gezocht kan worden. Wie bijvoorbeeld alleen in krantenteksten van de laatste tien jaar wil zoeken, kan dat eenvoudig doen. Inmiddels bevat het CHN bijna 3 miljoen teksten uit kranten, tijdschriften, journaaluitzendingen, blogs, websites en romans.

Delen:

  • Klik om af te drukken (Opent in een nieuw venster) Print
  • Klik om dit te e-mailen naar een vriend (Opent in een nieuw venster) E-mail
  • Klik om te delen op Facebook (Opent in een nieuw venster) Facebook
  • Klik om te delen op WhatsApp (Opent in een nieuw venster) WhatsApp
  • Klik om te delen op Telegram (Opent in een nieuw venster) Telegram
  • Klik om op LinkedIn te delen (Opent in een nieuw venster) LinkedIn

Vind ik leuk:

Vind-ik-leuk Aan het laden...

Gerelateerd

Categorie: Nieuws Tags: ChatGPT, CHN, INT

Lees Interacties

Laat een reactie achterReactie annuleren

Deze site gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie gegevens worden verwerkt.

Primaire Sidebar

Gedicht van de dag

Sint Nicolaas

Zie eens, Mietje! wat al lekkers
U, Sint Nicolaas al bragt;
Omdat ge’ als gehoorzaam Meisje,
Uw verpligting hebt volbragt.

➔ Lees meer

Bekijk alle gedichten

  • Facebook
  • YouTube

Chris van Geel

De koeien schemeren door de heg,
het paard is uit taaitaai gesneden,
in ieder duindal ligt dun sneeuw.

De branding vlecht een veren zee
waar zon over omhoog stijgt, licht waarin
geen plaats om uit te vliegen is.

Bron: Uit de hoge boom geschreven, 1967

➔ Bekijk hier alle citaten

Agenda

2 januari 2026: Vlekflits

2 januari 2026: Vlekflits

5 december 2025

➔ Lees meer
11 december 2025: Anne Frank, schrijfster

11 december 2025: Anne Frank, schrijfster

3 december 2025

➔ Lees meer
11 december 2025: Proefcollege Nederlands

11 december 2025: Proefcollege Nederlands

2 december 2025

➔ Lees meer
➔ Bekijk alle agendapunten

Neerlandici vandaag

geboortedag
1946 Dick Wortel
➔ Neerlandicikalender

Media

Dichter Esther Jansma (24 december 1958-23 januari 2025)

Dichter Esther Jansma (24 december 1958-23 januari 2025)

2 december 2025 Door Redactie Neerlandistiek Reageer

➔ Lees meer
De postkoloniale podcast met Remco Raben over Pramoedya Ananta Toer

De postkoloniale podcast met Remco Raben over Pramoedya Ananta Toer

30 november 2025 Door Redactie Neerlandistiek Reageer

➔ Lees meer
Peter van Zonneveld over Tjalie Robinson/Vincent Mahieu (1993)

Peter van Zonneveld over Tjalie Robinson/Vincent Mahieu (1993)

29 november 2025 Door Redactie Neerlandistiek Reageer

➔ Lees meer
➔ Bekijk alle video’s en podcasts

Footer

Elektronisch tijdschrift voor de Nederlandse taal en cultuur sinds 1992.

ISSN 0929-6514
Bijdragen zijn welkom op
redactie@neerlandistiek.nl
  • Homepage
  • E-books
  • Neerlandistische weblogs
  • Over Neerlandistiek
  • De archieven
  • Contact
  • Facebook
  • YouTube

Inschrijven voor de Dagpost

Controleer je inbox of spammap om je abonnement te bevestigen.

Copyright © 2025 · Magazine Pro on Genesis Framework · WordPress · Log in

  • Homepage
  • Categorie
    • Voor de klas
    • Vertelcultuur
    • Naamkunde
  • Archief
    • 10 jaar taalcanon
    • 100 jaar Willem Frederik Hermans
  • E-books
  • Neerlandistische weblogs
  • Jong Neerlandistiek
  • Frisistyk
  • Mondiaal Neerlandistiek
  • Over Neerlandistiek
  • Contact
 

Reacties laden....
 

    %d