• Door naar de hoofd inhoud
  • Skip to secondary menu
  • Spring naar de eerste sidebar
  • Spring naar de voettekst
Neerlandistiek. Online tijdschrift voor taal- en letterkunde

Neerlandistiek

Online tijdschrift voor taal- en letterkundig onderzoek

  • Over Neerlandistiek
  • Contact
  • Homepage
  • Categorie
    • Neerlandistiek voor de klas
    • Vertelcultuur
    • Naamkunde
  • E-books
  • Neerlandistische weblogs
  • Archief
    • 10 jaar taalcanon
    • 100 jaar Willem Frederik Hermans
  • Jong Neerlandistiek
  • Frisistyk
  • Mondiaal

Ontoegankelijke schatkamers

24 april 2014 door Marc van Oostendorp 1 Reactie

Hoe onderzoeksbronnen op internet verkommeren

Door Marc van Oostendorp


Wie zich nog eens terug wil wanen in de jaren negentig, moet de website van Celex eens bezoeken. Het is voor veel taalkundig onderzoek naar het Nederlands nog steeds een onmisbare bron: een database waar voor tal van woorden is aangegeven hoe ze worden uitgesproken, hoe je ze in lettergrepen kan verdelen en hoe frequent ze voorkomen in het Nederlands.

Honderdduizenden woorden zijn er verzameld, met rijke, rijke informatie over ieder woord. Om te zien hoe vaak een woord eigenlijk voorkomt in het Nederlands is dit nog steeds een van de meest gebruikte bronnen. Vrijwel iedere taalkundige die weleens een getal met cijfers achter de komma heeft opgeschreven, haalde dat getal uit CELEX. Studenten maken er nog steeds gebruik van.

Het is een prachtige bron, maar hij is ongeveer zo toegankelijk als de archieven van het Koninklijk Huis op zaterdagavond.
Het stamt allemaal nog uit de tijd dat degenen die de computer inzetten nog gezellig onder elkaar waren en elkaar dus geen overbodige uitleg verschaften. Heb jij die informatie nodig? Hier heb je haar, en nu verder geen gezeur aan me kop, zie maar wat je ermee doet.

Sindsdien is er niets meer gebeurd met die website, om de gebruikelijke redenen. Het is buitengewoon lastig om een goede en begrijpelijke interface te maken, of zelfs om een handleiding te maken bij die bronnen. En niemand krijgt betaald voor dat werk, niemand kan enige eer behalen uit dat werk. En dus doet niemand er wat aan. Wel stelt de Nederlandse Taalunie voor een torenhoog salaris een hoofd taalinfrastructuur aan, maar geld voor een interface-ontwerper is er niet; ongeveer zoals de NS vergeven is van de directieleden en ceo‘s, zodat er geen geld meer is om de wissels winterklaar te maken.

Toen ik dit stukje begon te schrijven, tien minuten geleden, was de server nog in de lucht, inmiddels ligt hij plat en kan ik hem niet bereiken. Ik kan dus ook niet voordoen hoe je de informatie eruit haalt, ik kan jullie alleen zelf het bos insturen als iemand op het Max Planck Instituut, waar men zo vriendelijk is een en ander in ieder geval nog op de server te houden, later vandaag, of later deze week de stekker er weer in duwt.

Tot die tijd moeten jullie me maar op mijn woord geloven: Celex zou een van de mooiste bronnen zijn voor het onderzoek naar het Nederlands, of überhaupt voor taalkundigen. Wanneer de weg ernaartoe maar niet zo kapot was en niemand hem wilde maken.

Delen:

  • Klik om af te drukken (Wordt in een nieuw venster geopend) Print
  • Klik om dit te e-mailen naar een vriend (Wordt in een nieuw venster geopend) E-mail
  • Klik om te delen op Facebook (Wordt in een nieuw venster geopend) Facebook
  • Klik om te delen op WhatsApp (Wordt in een nieuw venster geopend) WhatsApp
  • Klik om te delen op Telegram (Wordt in een nieuw venster geopend) Telegram
  • Klik om op LinkedIn te delen (Wordt in een nieuw venster geopend) LinkedIn

Vind ik leuk:

Vind-ik-leuk Aan het laden...

Gerelateerd

Categorie: Artikel Tags: frequentie, taalkunde, websites

Lees Interacties

Reacties

  1. Frans Daems zegt

    24 april 2014 om 11:32

    Jammer genoeg is Celex intussen al wat gedateerd, zowel qua inhoud en frequenties. Frequenties van sommige woorden of woordvormen zien er vandaag heel anders uit dan toen de database van Celex meer dan twintig jaar geleden ontstond. Daar krijg je al een indicatie van als je vergelijkt met de frequenties die je via Google vindt. Sommige frequenties zijn ook onbetrouwbaar. Dat geldt bijvoorbeeld voor de frequentie van homofone-homografe werkwoordvormen als ‘vermoord’: persoonsvorm en voltooid deelwoord. Beide hebben in Celex dezelfde frequentie. Vermoedelijk heeft men indertijd de totaalfrequentie van werkwoordvormen als ‘vermoord’ vastgesteld en ze nadien netjes arbitrair in twee gedeeld en elke helft toegekend aan de persoonsvorm en het voltooid deelwoord.
    Misschien moet Celex opnieuw samengesteld worden.

    Beantwoorden

Laat een reactie achterReactie annuleren

Deze site gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie gegevens worden verwerkt.

Primaire Sidebar

Gedicht van de dag

Margriet Westervaarder • gelegen in een nest

gelegen in een nest
van dons en klein venijn
de takjes dagelijks herschikt
zacht mos en doornig groen

➔ Lees meer

Bekijk alle gedichten

  • Facebook
  • YouTube

Chris van Geel

Van zomers die wij niet kennen
ritselen de blaren,
in winters die wij niet kennen
sneeuw onhoorbaar valt.

Bron: Uit de hoge boom geschreven, 1967

➔ Bekijk hier alle citaten

Agenda

19 september 2025: Afscheidscollege Fred Weerman

19 september 2025: Afscheidscollege Fred Weerman

15 juli 2025

➔ Lees meer
1 juli – 15 september 2025: Over de grenzen van het boek

1 juli – 15 september 2025: Over de grenzen van het boek

11 juli 2025

➔ Lees meer
26 september 2025: Afscheid Peter-Arno Coppen

26 september 2025: Afscheid Peter-Arno Coppen

10 juli 2025

➔ Lees meer
➔ Bekijk alle agendapunten

Neerlandici vandaag

geboortedag
1933 Aad Nuis
sterfdag
1994 Jacob Drewes
➔ Neerlandicikalender

Media

Inclusive Dutch: Between Norm and Variation

Inclusive Dutch: Between Norm and Variation

15 juli 2025 Door Redactie Neerlandistiek 1 Reactie

➔ Lees meer
Hoe je taal maakt en hoe taal je raakt

Hoe je taal maakt en hoe taal je raakt

14 juli 2025 Door Redactie Neerlandistiek Reageer

➔ Lees meer
Marc van Oostendorp over prijs voor Neerlandistiek

Marc van Oostendorp over prijs voor Neerlandistiek

13 juli 2025 Door Redactie Neerlandistiek 2 Reacties

➔ Lees meer
➔ Bekijk alle video’s en podcasts

Footer

Elektronisch tijdschrift voor de Nederlandse taal en cultuur sinds 1992.

ISSN 0929-6514
Bijdragen zijn welkom op
redactie@neerlandistiek.nl
  • Homepage
  • E-books
  • Neerlandistische weblogs
  • Over Neerlandistiek
  • De archieven
  • Contact
  • Facebook
  • YouTube

Inschrijven voor de Dagpost

Controleer je inbox of spammap om je abonnement te bevestigen.

Copyright © 2025 · Magazine Pro on Genesis Framework · WordPress · Log in

  • Homepage
  • Categorie
    • Voor de klas
    • Vertelcultuur
    • Naamkunde
  • Archief
    • 10 jaar taalcanon
    • 100 jaar Willem Frederik Hermans
  • E-books
  • Neerlandistische weblogs
  • Jong Neerlandistiek
  • Frisistyk
  • Mondiaal Neerlandistiek
  • Over Neerlandistiek
  • Contact
%d