• Door naar de hoofd inhoud
  • Skip to secondary menu
  • Spring naar de eerste sidebar
  • Spring naar de voettekst
Neerlandistiek. Online tijdschrift voor taal- en letterkunde

Neerlandistiek

Online tijdschrift voor taal- en letterkundig onderzoek

  • Over Neerlandistiek
  • Contact
  • Homepage
  • Categorie
    • Neerlandistiek voor de klas
    • Vertelcultuur
    • Naamkunde
  • E-books
  • Neerlandistische weblogs
  • Archief
    • 10 jaar taalcanon
    • 100 jaar Willem Frederik Hermans
  • Jong Neerlandistiek
  • Frisistyk
  • Mondiaal

Ontoegankelijke schatkamers

24 april 2014 door Marc van Oostendorp 1 Reactie

Hoe onderzoeksbronnen op internet verkommeren

Door Marc van Oostendorp


Wie zich nog eens terug wil wanen in de jaren negentig, moet de website van Celex eens bezoeken. Het is voor veel taalkundig onderzoek naar het Nederlands nog steeds een onmisbare bron: een database waar voor tal van woorden is aangegeven hoe ze worden uitgesproken, hoe je ze in lettergrepen kan verdelen en hoe frequent ze voorkomen in het Nederlands.

Honderdduizenden woorden zijn er verzameld, met rijke, rijke informatie over ieder woord. Om te zien hoe vaak een woord eigenlijk voorkomt in het Nederlands is dit nog steeds een van de meest gebruikte bronnen. Vrijwel iedere taalkundige die weleens een getal met cijfers achter de komma heeft opgeschreven, haalde dat getal uit CELEX. Studenten maken er nog steeds gebruik van.

Het is een prachtige bron, maar hij is ongeveer zo toegankelijk als de archieven van het Koninklijk Huis op zaterdagavond.
Het stamt allemaal nog uit de tijd dat degenen die de computer inzetten nog gezellig onder elkaar waren en elkaar dus geen overbodige uitleg verschaften. Heb jij die informatie nodig? Hier heb je haar, en nu verder geen gezeur aan me kop, zie maar wat je ermee doet.

Sindsdien is er niets meer gebeurd met die website, om de gebruikelijke redenen. Het is buitengewoon lastig om een goede en begrijpelijke interface te maken, of zelfs om een handleiding te maken bij die bronnen. En niemand krijgt betaald voor dat werk, niemand kan enige eer behalen uit dat werk. En dus doet niemand er wat aan. Wel stelt de Nederlandse Taalunie voor een torenhoog salaris een hoofd taalinfrastructuur aan, maar geld voor een interface-ontwerper is er niet; ongeveer zoals de NS vergeven is van de directieleden en ceo‘s, zodat er geen geld meer is om de wissels winterklaar te maken.

Toen ik dit stukje begon te schrijven, tien minuten geleden, was de server nog in de lucht, inmiddels ligt hij plat en kan ik hem niet bereiken. Ik kan dus ook niet voordoen hoe je de informatie eruit haalt, ik kan jullie alleen zelf het bos insturen als iemand op het Max Planck Instituut, waar men zo vriendelijk is een en ander in ieder geval nog op de server te houden, later vandaag, of later deze week de stekker er weer in duwt.

Tot die tijd moeten jullie me maar op mijn woord geloven: Celex zou een van de mooiste bronnen zijn voor het onderzoek naar het Nederlands, of überhaupt voor taalkundigen. Wanneer de weg ernaartoe maar niet zo kapot was en niemand hem wilde maken.

Delen:

  • Klik om af te drukken (Opent in een nieuw venster) Print
  • Klik om dit te e-mailen naar een vriend (Opent in een nieuw venster) E-mail
  • Klik om te delen op Facebook (Opent in een nieuw venster) Facebook
  • Klik om te delen op WhatsApp (Opent in een nieuw venster) WhatsApp
  • Klik om te delen op Telegram (Opent in een nieuw venster) Telegram
  • Klik om op LinkedIn te delen (Opent in een nieuw venster) LinkedIn

Vind ik leuk:

Vind-ik-leuk Aan het laden...

Gerelateerd

Categorie: Artikel Tags: frequentie, taalkunde, websites

Lees Interacties

Reacties

  1. Frans Daems zegt

    24 april 2014 om 11:32

    Jammer genoeg is Celex intussen al wat gedateerd, zowel qua inhoud en frequenties. Frequenties van sommige woorden of woordvormen zien er vandaag heel anders uit dan toen de database van Celex meer dan twintig jaar geleden ontstond. Daar krijg je al een indicatie van als je vergelijkt met de frequenties die je via Google vindt. Sommige frequenties zijn ook onbetrouwbaar. Dat geldt bijvoorbeeld voor de frequentie van homofone-homografe werkwoordvormen als ‘vermoord’: persoonsvorm en voltooid deelwoord. Beide hebben in Celex dezelfde frequentie. Vermoedelijk heeft men indertijd de totaalfrequentie van werkwoordvormen als ‘vermoord’ vastgesteld en ze nadien netjes arbitrair in twee gedeeld en elke helft toegekend aan de persoonsvorm en het voltooid deelwoord.
    Misschien moet Celex opnieuw samengesteld worden.

    Beantwoorden

Laat een reactie achterReactie annuleren

Deze site gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie gegevens worden verwerkt.

Primaire Sidebar

Gedicht van de dag

Sint Nicolaas

Zie eens, Mietje! wat al lekkers
U, Sint Nicolaas al bragt;
Omdat ge’ als gehoorzaam Meisje,
Uw verpligting hebt volbragt.

➔ Lees meer

Bekijk alle gedichten

  • Facebook
  • YouTube

Chris van Geel

De koeien schemeren door de heg,
het paard is uit taaitaai gesneden,
in ieder duindal ligt dun sneeuw.

De branding vlecht een veren zee
waar zon over omhoog stijgt, licht waarin
geen plaats om uit te vliegen is.

Bron: Uit de hoge boom geschreven, 1967

➔ Bekijk hier alle citaten

Agenda

11 december 2025: Anne Frank, schrijfster

11 december 2025: Anne Frank, schrijfster

3 december 2025

➔ Lees meer
11 december 2025: Proefcollege Nederlands

11 december 2025: Proefcollege Nederlands

2 december 2025

➔ Lees meer
5 december 2025: Intreerede Jolyn Philips

5 december 2025: Intreerede Jolyn Philips

28 november 2025

➔ Lees meer
➔ Bekijk alle agendapunten

Neerlandici vandaag

geboortedag
1946 Dick Wortel
➔ Neerlandicikalender

Media

Dichter Esther Jansma (24 december 1958-23 januari 2025)

Dichter Esther Jansma (24 december 1958-23 januari 2025)

2 december 2025 Door Redactie Neerlandistiek Reageer

➔ Lees meer
De postkoloniale podcast met Remco Raben over Pramoedya Ananta Toer

De postkoloniale podcast met Remco Raben over Pramoedya Ananta Toer

30 november 2025 Door Redactie Neerlandistiek Reageer

➔ Lees meer
Peter van Zonneveld over Tjalie Robinson/Vincent Mahieu (1993)

Peter van Zonneveld over Tjalie Robinson/Vincent Mahieu (1993)

29 november 2025 Door Redactie Neerlandistiek Reageer

➔ Lees meer
➔ Bekijk alle video’s en podcasts

Footer

Elektronisch tijdschrift voor de Nederlandse taal en cultuur sinds 1992.

ISSN 0929-6514
Bijdragen zijn welkom op
redactie@neerlandistiek.nl
  • Homepage
  • E-books
  • Neerlandistische weblogs
  • Over Neerlandistiek
  • De archieven
  • Contact
  • Facebook
  • YouTube

Inschrijven voor de Dagpost

Controleer je inbox of spammap om je abonnement te bevestigen.

Copyright © 2025 · Magazine Pro on Genesis Framework · WordPress · Log in

  • Homepage
  • Categorie
    • Voor de klas
    • Vertelcultuur
    • Naamkunde
  • Archief
    • 10 jaar taalcanon
    • 100 jaar Willem Frederik Hermans
  • E-books
  • Neerlandistische weblogs
  • Jong Neerlandistiek
  • Frisistyk
  • Mondiaal Neerlandistiek
  • Over Neerlandistiek
  • Contact
%d