• Door naar de hoofd inhoud
  • Skip to secondary menu
  • Spring naar de eerste sidebar
  • Spring naar de voettekst
Neerlandistiek. Online tijdschrift voor taal- en letterkunde

Neerlandistiek

Online tijdschrift voor taal- en letterkundig onderzoek

  • Over Neerlandistiek
  • Contact
  • Homepage
  • Categorie
    • Neerlandistiek voor de klas
    • Vertelcultuur
    • Naamkunde
  • E-books
  • Neerlandistische weblogs
  • Archief
    • 10 jaar taalcanon
    • 100 jaar Willem Frederik Hermans
  • Jong Neerlandistiek
  • Frisistyk
  • Mondiaal

‘Difficulteren’ zoeken met digitale methoden

8 juni 2018 door Redactie Neerlandistiek Reageer

Door Jan Odijk

Clariah is een groot project dat de empirische basis voor digitaal geesteswetenschappelijk onderzoek wil faciliteren. In de CLARIAH-PLUS-aanvraag (p. 8) wordt gesteld: “The CLARIAH infrastructure will increase our empirical base, options for analysing […] data, and the efficiency of research by orders of magnitude (data-intensive science).”
Maar is dat ook echt zo?

Een treffende illustratie van de correctheid van deze claims wordt geleverd door Marten van der Meulen in een recente bijdrage aan Neerlandistiek.nl. Binnen een dag testte hij een vermoeden van Marc van Oostendorp over het onlangs door Geert Wilders gebruikte woord ‘difficulteren’, door het op te zoeken in meerdere corpora die de CLARIAH onderzoeksinfrastructuur de afgelopen jaren beschikbaar heeft gesteld.

‘increase our empirical base’:
Marten zocht in 6 corpora (Staten Generaal Digitaal, Corpus Gesproken Nederlands, Corpus Hedendaags Nederlands, Brieven als Buit Corpus, Sonar en in de corpora van Nederlab (waar het vooral voorkomt in Early Dutch Books Online). Het mooie is dat CLARIAH het zoeken in deze bronnen mogelijk maakt voor iedere geesteswetenschapper: je hoeft geen corpuslinguïst te zijn, je hoeft niet te kunnen programmeren, je hoeft geen corpora of software te downloaden. CLARIAH biedt webapplicaties met gebruikersvriendelijke interfaces die het zoeken in die corpora eenvoudig maken. Zie beneden voor links.

‘increase options for analysing … data’:
Deze bronnen maken het mogelijk te zoeken op lemma in plaats van op woordvormen, wat het zoeken en de analyse van de zoekresultaten een stuk makkelijker maakt en een groter aantal relevante data oplevert. Bovendien bevatten veel van de bronnen metadata zoals genre, tijd en plaats zodat ook snel bepaald kan worden waar, wanneer en in welke genres dit woord vaak of minder vaak voorkomt.

‘increase the efficiency of research’:
Marten deed dit onderzoek binnen 1 dag, iets wat vóór CLARIAH niet mogelijk was of hoogstens voor een selecte groep van corpuslinguïsten.

Natuurlijk kan je ook zoeken op het internet, via Google of op Twitter. Dat complementeert het zoeken in specifieke corpora, met name omdat de empirische basis dan nog veel groter is. Maar dan moet je alle woordvormen van dit werkwoord apart opzoeken en de analyse van de resultaten vergt meer (handmatig) werk, vooral omdat er nauwelijks relevante metadata zijn. Marten heeft ook met Google gezocht, maar hij heeft de analyse van de resultaten nog niet in die ene dag kunnen doen. Hij heeft ook gezocht in het Corpus of the Web (COW) voor het Nederlands, kleiner dan het hele internet maar nog steeds behoorlijk groot (7 miljard woorden), en er waren minder hits daar zodat ze nog verder geanalyseerd konden worden.

De zoekopdracht waar het hier om ging betreft een lemma van 1 woord, en dat is een vrij eenvoudige opdracht. Maar de CLARIAH-infrastructuur maakt het ook mogelijk om veel ingewikkelder zoekopdrachten te geven, met combinaties van woorden, woordparen met een grammaticale afhankelijkheidsrelatie, en volledige grammaticale constructies.

Mijn conclusie is dan ook dat CLARIAH faciliteert en de bovengenoemde claim nu al waarmaakt.

Dit blogbericht verscheen eerder op de website van Clariah  

 

Delen:

  • Klik om af te drukken (Opent in een nieuw venster) Print
  • Klik om dit te e-mailen naar een vriend (Opent in een nieuw venster) E-mail
  • Klik om te delen op Facebook (Opent in een nieuw venster) Facebook
  • Klik om te delen op WhatsApp (Opent in een nieuw venster) WhatsApp
  • Klik om te delen op Telegram (Opent in een nieuw venster) Telegram
  • Klik om op LinkedIn te delen (Opent in een nieuw venster) LinkedIn

Vind ik leuk:

Vind-ik-leuk Aan het laden...

Gerelateerd

Categorie: Artikel Tags: Clariah, digital humanities, e-humanities, woordgebruik

Lees Interacties

Laat een reactie achterReactie annuleren

Deze site gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie gegevens worden verwerkt.

Primaire Sidebar

Gedicht van de dag

Sint Nicolaas

Zie eens, Mietje! wat al lekkers
U, Sint Nicolaas al bragt;
Omdat ge’ als gehoorzaam Meisje,
Uw verpligting hebt volbragt.

➔ Lees meer

Bekijk alle gedichten

  • Facebook
  • YouTube

Chris van Geel

De koeien schemeren door de heg,
het paard is uit taaitaai gesneden,
in ieder duindal ligt dun sneeuw.

De branding vlecht een veren zee
waar zon over omhoog stijgt, licht waarin
geen plaats om uit te vliegen is.

Bron: Uit de hoge boom geschreven, 1967

➔ Bekijk hier alle citaten

Agenda

11 december 2025: Anne Frank, schrijfster

11 december 2025: Anne Frank, schrijfster

3 december 2025

➔ Lees meer
11 december 2025: Proefcollege Nederlands

11 december 2025: Proefcollege Nederlands

2 december 2025

➔ Lees meer
5 december 2025: Intreerede Jolyn Philips

5 december 2025: Intreerede Jolyn Philips

28 november 2025

➔ Lees meer
➔ Bekijk alle agendapunten

Neerlandici vandaag

geboortedag
1946 Dick Wortel
➔ Neerlandicikalender

Media

Dichter Esther Jansma (24 december 1958-23 januari 2025)

Dichter Esther Jansma (24 december 1958-23 januari 2025)

2 december 2025 Door Redactie Neerlandistiek Reageer

➔ Lees meer
De postkoloniale podcast met Remco Raben over Pramoedya Ananta Toer

De postkoloniale podcast met Remco Raben over Pramoedya Ananta Toer

30 november 2025 Door Redactie Neerlandistiek Reageer

➔ Lees meer
Peter van Zonneveld over Tjalie Robinson/Vincent Mahieu (1993)

Peter van Zonneveld over Tjalie Robinson/Vincent Mahieu (1993)

29 november 2025 Door Redactie Neerlandistiek Reageer

➔ Lees meer
➔ Bekijk alle video’s en podcasts

Footer

Elektronisch tijdschrift voor de Nederlandse taal en cultuur sinds 1992.

ISSN 0929-6514
Bijdragen zijn welkom op
redactie@neerlandistiek.nl
  • Homepage
  • E-books
  • Neerlandistische weblogs
  • Over Neerlandistiek
  • De archieven
  • Contact
  • Facebook
  • YouTube

Inschrijven voor de Dagpost

Controleer je inbox of spammap om je abonnement te bevestigen.

Copyright © 2025 · Magazine Pro on Genesis Framework · WordPress · Log in

  • Homepage
  • Categorie
    • Voor de klas
    • Vertelcultuur
    • Naamkunde
  • Archief
    • 10 jaar taalcanon
    • 100 jaar Willem Frederik Hermans
  • E-books
  • Neerlandistische weblogs
  • Jong Neerlandistiek
  • Frisistyk
  • Mondiaal Neerlandistiek
  • Over Neerlandistiek
  • Contact
%d