Door Jan Odijk
Naar aanleiding van Sterre Leufkens’ overzicht van enkele hoogtepunten van digitale bronnen (in de Neerlandistiek van 6 september 2019) zou ik de Neerlandistiek-gemeenschap erop willen wijzen dat er nog veel meer aan digitale data en software is die van belang kan zijn voor Neerlandici. Heel veel van die data en software is beschikbaar gemaakt in het kader van de CLARIN-infrastructuur, en ontwikkeld in Nederlandse projecten hiervoor zoals CLARIN-NL en CLARIAH-CORE.
Ik noem eerst een aantal overzichten van data en software:
- CLARIN Virtual Language Observatory (VLO): bevat allerlei taaldata en tools voor taaldata, niet alleen voor taalkunde maar ook literatuurwetenschap, geschiedenis, etc.
- Algemeen: https://vlo.clarin.eu
- Query naar resources voor het Nederlands: https://vlo.clarin.eu/?fqType=languageCode:or&fq=languageCode:code:nld
- CLARIN in the Netherlands portal: Portal met overzicht van CLARIN in Nederland
- Algemeen: http://portal.clarin.nl/
- Tool overzicht voor CLARIN-NL en CLARIAH-CORE (nog onvolledig maar wordt in de komende tijd uitgebreid): http://portal.clarin.nl/clariah-tools-fs Hier kan je met behulp van facetten zoeken naar een tool dat je misschien kan gebruiken als onderzoeksinstrument.
Ik zou er ook op willen wijzen dat, voor het Corpus Gesproken Nederlands, zonder te downloaden, en zonder te hoeven programmeren of een querytaal te kennen:
- De 1-miljoen woorden treebank van CGN bereikbaar en doorzoekbaar is via PaQu (http://portal.clarin.nl/node/4939 ) en GrETEL ( http://portal.clarin.nl/node/4921 )
- Dat binnenkort een zoekapplicatie beschikbaar komt om in het volledige CGN en OpenSoNaR te zoeken. Een voorlopige versie (met nog wat bugs) kan je al hier vinden: https://webservices-lst.science.ru.nl/portal/ (daar is waarschijnlijk nu nog wel een paswoord voor nodig, dat je kan aanvragen). Later in het jaar verschijnt er ook een versie op de INT CLARIN portal
Tot slot: dat applicaties als PaQu, GrETEL 4.0 (in ontwikkeling maar al te gebruiken) en AutoSearch (waarvan binnenkort een upgrade zal verschijnen) het toelaten je eigen corpus of dataset in te laden en te doorzoeken op grammaticale eigenschappen.
Zonder login
Heel veel applicaties en data zijn toegankelijk zonder enige login. Als er wel een login nodig is dan kan dat in de meeste gevallen via het account van de onderzoeksinstelling waaraan je verbonden bent. Als je niet verbonden bent aan een onderzoeksinstelling dan kun je een account aanvragen bij CLARIN ERIC. Dat zal voor niet-commerciële activiteiten vrijwel altijd gehonoreerd worden. Voor commerciële activiteiten moeten er speciale afspraken gemaakt worden.
Voor meer informatie hierover, en ook om eventueel een cursus of hands-on-sessie te volgen om dergelijke tools optimaal te gebruiken (of als je zelf zo’n cursus zou willen geven met behulp van de educatieve pakketten die hiervoor ontwikkeld zijn) kun je contact opnemen met clariah@huygens-knaw.nl.
Laat een reactie achter