• Door naar de hoofd inhoud
  • Skip to secondary menu
  • Spring naar de eerste sidebar
  • Spring naar de voettekst
Neerlandistiek. Online tijdschrift voor taal- en letterkunde

Neerlandistiek

Online tijdschrift voor taal- en letterkundig onderzoek

  • Over Neerlandistiek
  • Contact
  • Homepage
  • Categorie
    • Neerlandistiek voor de klas
    • Vertelcultuur
    • Naamkunde
  • E-books
  • Neerlandistische weblogs
  • Archief
    • 10 jaar taalcanon
    • 100 jaar Willem Frederik Hermans
  • Jong Neerlandistiek
  • Frisistyk
  • Mondiaal

Open dialectendata

13 mei 2013 door Redactie Neder-L Reageer

Door Nicoline van der Sijs
Rond 1900 groef de Engelse archeoloog Sir Arthur Evans bij Knossos op Kreta kleitabletten op met teksten in twee onbekende schriften, die hij Lineair A en B noemde. Toen het hem niet lukte Lineair B te ontcijferen, hield hij de kleitabletten moedwillig weg van andere onderzoekers. Pas tien jaar na zijn dood ontcijferde Michael Ventris het schrift, nadat hij had bewezen dat de teksten Grieks waren.
De Münchense onderzoekster Annelies Kammenhuber hamsterde decennialang kleitabletten met teksten in Hettitisch spijkerschrift, nadat zij rond 1965 was begonnen aan een uitgebreid woordenboek van het Hettitisch: een taal die van 1700 tot 1200 voor Chr. werd gesproken in Turkije en die een verre verwant is van de Germaanse talen.
Erg opschieten deed het woordenboek niet: bij haar dood in 1995 was zij gevorderd tot de G. Ondertussen was het materiaal al die tijd onbereikbaar voor haar Engelse collega’s. Die schermden op hun beurt hun Hettitische teksten in hiërogliefenschrift voor de Duitse onderzoekers af.
Dit zijn slechts een paar van de vele verhalen over geesteswetenschappers die hun gegevens weghielden van anderen.

Evans en Kammenhuber zijn nog positieve uitzonderingen omdat ze daadwerkelijk over hun onderwerp publiceerden. Er zijn ook verzamelaars die het stadium van verzamelen niet overstijgen. Een notoir voorbeeld is de Vlaming Jef Sprankenis, die zich beschouwde als dé kenner van Jacob Israël de Haan. Tot zijn dood begin deze eeuw verstopte hij jarenlang boeken en tijdschriften over De Haan in zijn kamertje in de  Amsterdamse universiteitsbibliotheek.

Over dergelijke hamsterwoedes werd vroeger wel geroddeld, maar veel meer konden onderzoekers er niet aan doen. Tegenwoordig ligt dat anders: de academische wereld stelt steeds meer regels op om te garanderen dat data toegankelijk zijn of komen voor andere onderzoekers. Zo pleit de Koninklijke Nederlandse Akademie van Wetenschappen in het vorig jaar verschenen advies Zorgvuldigenintegeromgaanmetwetenschappelijkeonderzoeksgegevensvoor vrije toegang tot wetenschappelijk materiaal, dus open data.
In de geesteswetenschappen blijven gegevens lange tijd waardevol. Dit in tegenstelling tot veel bètaonderzoek: daar zijn resultaten vaak bouwstenen waarop onmiddellijk wordt voortgebouwd, waardoor onderzoekers niet meer teruggrijpen naar oorspronkelijke gegevens. In de geesteswetenschappen gaat het vaker over nieuwe interpretaties van oude gegevens. Geesteswetenschappers hoef je niet te vertellen dat ze dwergen zijn op de schouders van reuzen.
Die wijsheid uit de twaalfde eeuw is actueler dan ooit. In deze digitale tijd wordt het voortbouwen op eerder onderzoek steeds gemakkelijker. Grote hoeveelheden oude en nieuwe gegevens kunnen semi-automatisch aan elkaar worden gekoppeld. Juist deze aanpak zal leiden tot allerlei nieuwe vondsten en inzichten binnen de geesteswetenschappen. Een concreet voorbeeld hiervan, waaraan we momenteel hard werken, is de inrichting van een elektronische Woordenbank van de Nederlandse Dialecten.
In de loop van de tijd zijn er veel woordenboeken van Nederlandse dialecten gepubliceerd. Die dialectwoordenboeken zijn vervaardigd door professionele dialectlexicografen en amateurs, en ze beschrijven de woordenschat van een enkele plaats, zoals Weerts, of van grotere gebieden, zoals het Limburgs, Brabants, Vlaams of Overijssels. De gegevens van deze woordenboeken zijn – laat ik het voorzichtig zeggen – niet optimaal toegankelijk. Als er digitale bestanden van bestaan, zwerven die meestal bij particulieren. De oudere gedrukte woordenboeken, daterend vanaf begin 19e eeuw, liggen in bibliotheken te verstoffen.
Onze kennis van de Nederlandse dialecten, en de veranderingen die deze sinds de 19e eeuw hebben doorgemaakt, zal sterk toenemen als we alle beschikbare gegevens uit de dialectwoordenboeken aan elkaar koppelen: op die manier ontstaat een compleet nieuw onderzoeksinstrumentarium voor dialectonderzoek. Om dit te verwezenlijken heb ik vorig jaar aan de Nederlandse dialectlexicografen en streektaalfunctionarissen gevraagd of ze hun digitale dialectwoordenboeken aan het Meertens Instituut willen overdragen. Vlaamse en Friese collega’s verzamelen de woordenboekbestanden uit hun taalgebied. Vrijwilligers zijn inmiddels begonnen met het corrigeren van gescande oudere dialectwoordenboeken en het overtikken van manuscripten. De Data Curation Service van de Radboud Universiteit Nijmegen (bekostigd door het nationale infrastructuurprogramma CLARIN) zal straks alle digitale bestanden omzetten naar een eenvormig computerformaat.
Om de verschillende dialectwoordenboeken aan elkaar te kunnen koppelen, worden ze verrijkt met extra gegevens: vrijwilligers en studenten voegen aan alle dialecttrefwoorden de Standaardnederlandse vormen toe. De Standaardnederlandse vorm kan dienen als input voor karteringssoftware. Die software tekent automatisch kaarten met de verbreiding van woorden, klanken, vervoegingen en verbuigingen over het Nederlandse taalgebied. Dat zal veel nieuwe inzichten opleveren. Veel dialectsprekers menen bijvoorbeeld dat in hun dialect unieke woorden of uitdrukkingen voorkomen – of dat waar is, zal nu aan het licht komen, en ik voorzie veel lange gezichten… Ook kan uit de kaarten blijken hoe de verbreiding van een dialectverschijnsel in de loop van de tijd is veranderd.
Het aan elkaar verbinden van zoveel mogelijk dialectwoorden biedt nog veel meer spannende mogelijkheden. Dat zal in de toekomst blijken, als de elektronische Woordenbank van de Nederlandse Dialecten is gelanceerd. Vooruitlopend daarop vraag ik lezers van deze krant die een digitaal dialectwoordenboek of ongepubliceerd manuscript op de plank hebben liggen, dit naar me op te sturen, zodat het opgenomen kan worden in het grote net van open dialectdata.

Deze column verscheen op zaterdag 11 mei jl. in NRC Handelsblad.

Delen:

  • Klik om af te drukken (Opent in een nieuw venster) Print
  • Klik om dit te e-mailen naar een vriend (Opent in een nieuw venster) E-mail
  • Klik om te delen op Facebook (Opent in een nieuw venster) Facebook
  • Klik om te delen op WhatsApp (Opent in een nieuw venster) WhatsApp
  • Klik om te delen op Telegram (Opent in een nieuw venster) Telegram
  • Klik om op LinkedIn te delen (Opent in een nieuw venster) LinkedIn

Vind ik leuk:

Vind-ik-leuk Aan het laden...

Gerelateerd

Categorie: Artikel Tags: dialecten, dialectologie, Gastcolumns, lexicografie, sociolinguïstiek, woordenboeken

Lees Interacties

Laat een reactie achterReactie annuleren

Deze site gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie gegevens worden verwerkt.

Primaire Sidebar

Gedicht van de dag

Sint Nicolaas

Zie eens, Mietje! wat al lekkers
U, Sint Nicolaas al bragt;
Omdat ge’ als gehoorzaam Meisje,
Uw verpligting hebt volbragt.

➔ Lees meer

Bekijk alle gedichten

  • Facebook
  • YouTube

Chris van Geel

De koeien schemeren door de heg,
het paard is uit taaitaai gesneden,
in ieder duindal ligt dun sneeuw.

De branding vlecht een veren zee
waar zon over omhoog stijgt, licht waarin
geen plaats om uit te vliegen is.

Bron: Uit de hoge boom geschreven, 1967

➔ Bekijk hier alle citaten

Agenda

11 december 2025: Anne Frank, schrijfster

11 december 2025: Anne Frank, schrijfster

3 december 2025

➔ Lees meer
11 december 2025: Proefcollege Nederlands

11 december 2025: Proefcollege Nederlands

2 december 2025

➔ Lees meer
5 december 2025: Intreerede Jolyn Philips

5 december 2025: Intreerede Jolyn Philips

28 november 2025

➔ Lees meer
➔ Bekijk alle agendapunten

Neerlandici vandaag

geboortedag
1946 Dick Wortel
➔ Neerlandicikalender

Media

Dichter Esther Jansma (24 december 1958-23 januari 2025)

Dichter Esther Jansma (24 december 1958-23 januari 2025)

2 december 2025 Door Redactie Neerlandistiek Reageer

➔ Lees meer
De postkoloniale podcast met Remco Raben over Pramoedya Ananta Toer

De postkoloniale podcast met Remco Raben over Pramoedya Ananta Toer

30 november 2025 Door Redactie Neerlandistiek Reageer

➔ Lees meer
Peter van Zonneveld over Tjalie Robinson/Vincent Mahieu (1993)

Peter van Zonneveld over Tjalie Robinson/Vincent Mahieu (1993)

29 november 2025 Door Redactie Neerlandistiek Reageer

➔ Lees meer
➔ Bekijk alle video’s en podcasts

Footer

Elektronisch tijdschrift voor de Nederlandse taal en cultuur sinds 1992.

ISSN 0929-6514
Bijdragen zijn welkom op
redactie@neerlandistiek.nl
  • Homepage
  • E-books
  • Neerlandistische weblogs
  • Over Neerlandistiek
  • De archieven
  • Contact
  • Facebook
  • YouTube

Inschrijven voor de Dagpost

Controleer je inbox of spammap om je abonnement te bevestigen.

Copyright © 2025 · Magazine Pro on Genesis Framework · WordPress · Log in

  • Homepage
  • Categorie
    • Voor de klas
    • Vertelcultuur
    • Naamkunde
  • Archief
    • 10 jaar taalcanon
    • 100 jaar Willem Frederik Hermans
  • E-books
  • Neerlandistische weblogs
  • Jong Neerlandistiek
  • Frisistyk
  • Mondiaal Neerlandistiek
  • Over Neerlandistiek
  • Contact
%d