Wie na de recente publicaties over het Oudnederlands op Neerlandistiek (zie hier en hier) nog meer te weten wil komen over de oudste fase van onze taal, kan zijn hart ophalen. Deze week heeft het Instituut voor de Nederlandse Taal het Corpus Oudnederlands online heeft gezet. Daarmee hebben liefhebbers van het Oudnederlands naast het Oudnederlands Woordenboek (ONW) de Inleiding Oudnederlands (Leuven: Universitaire Pers, 2002) van A. Quak & J.M. van der Horst een derde hulpmiddel in handen gekregen om deze taalfase te bestuderen.
Hebban olla uogala
Een van de intrigerendste teksten uit de geschiedenis van het Nederlands is de zin Hebban olla uogala nestas hagunnan hinase hi(c) (e)nda thu uuat unbidan uue nu. Al was het maar omdat bijna iedereen de letterlijke vertaling van deze zin uit het hoofd kan opzeggen: ‘Hebben alle vogels nesten begonnen behalve ik en jij, wat wachten we nu?’ Vermoedelijk pende een monnik dit liefdesgedichtje in de elfde eeuw neer om te kijken of zijn pas gesneden ganzenveer geschikt was voor zijn kopiistenwerk.
Veel mensen denken dat dit de oudst overgeleverde Nederlandse zin is. Dat is niet zo gek, want deze dertien woorden oefenen een grote aantrekkingskracht op ons uit: Hebban olla vogala is een van de vensters van de Canon van Nederland en het populaire kinderprogramma Het Klokhuis wijdde er een speciale aflevering aan. De tekst inspireerde Henny Vrienten tot het schrijven van ’t Ouwe liedje (1991) en een bekende Nederlandse boekensite en lezerscommunity koos ervoor zichzelf Hebban te noemen.
Hebban olla uogala is weliswaar de bekendste maar zeker niet de oudste of langste Oudnederlandse tekst die bewaard is gebleven. Zo bevat de runeninscriptie van Bergakker uit de 5de eeuw het oudste Oudnederlandse woord – ann (van het werkwoord onnen ‘gunnen’) – en zijn de meeste wetenschappers het erover eens dat Maltho thi afrio litho (“Ik zeg je: ik bevrijd je, laat”) uit de 6e-eeuwse Lex Salica (‘Salische Wet’) de oudst bekende zin is. Voor onze kennis van het Oudnederlands zijn vooral de langere teksten van belang, zoals de Wachtendonckse Psalmen uit het midden van de 10de eeuw. Of het commentaar op het Bijbelboek Hooglied van Willeram van Ebersperg, de Leidse (of zo men wil Egmondse) Willeram.
Wat is Oudnederlands?
Het Oudnederlands is de verzamelnaam voor een aantal verwante dialecten die – net als het Oudengels, het Oudfries, het Oudsaksisch en het Oudhoogduits – rond het begin van de vijfde eeuw zijn ontstaan uit het West-Germaans. Het werd gesproken in een gebied dat samenviel met het huidige Nederland (mogelijk met uitzondering van de kuststreek van Groningen tot aan de Oude Rijn in de provincie Zuid-Holland), het Nederlandstalige deel van België, Frans-Vlaanderen en een stuk van Duitsland tussen de Nederlandse grens, de Rijn en de zogenaamde Benrather Linie, de grens tussen het Neder- en het Hoogduitse taalgebied.
De afgrenzing tussen Oudnederlands, Oudsaksisch en Oudfries is soms lastig te maken. De redactie van het Oudnederlands Woordenboek (ONW), die verantwoordelijk was voor de samenstelling van het corpus, heeft een ruim opnamebeleid gehanteerd. Toch zijn niet alle teksten die vroeger tot het Oudnederlands werden gerekend in het corpus opgenomen. Zoals het gedicht de Heliand, omdat die tekst eerder Oudsaksisch is te noemen.
Corpus Oudnederlands
Het Corpus Oudnederlands bevat de verzameling van alle Oudnederlandse teksten die als bronnenmateriaal gebruikt zijn voor het Oudnederlands Woordenboek (ONW). De oudste snipper dateert zoals gezegd uit de 5e eeuw, terwijl de jongste teksten uit 1200 stammen. Daarna breekt de periode van het Vroegmiddelnederlands aan, het Nederlands uit de 13e eeuw.
Het uitgangspunt voor de materiaalverzameling waren de Oudnederlandse teksten die de Gentse taalkundige Maurits Gysseling had verzameld, getranscribeerd en opgenomen in het eerste deel van de tweede reeks van zijn Corpus van Middelnederlandse teksten (p. 1-282). Dat materiaal is aangevuld met teksten als de Mittelfränkische Reimbibel, glossen zoals de Malbergse glossen bij de Lex Salica en namen van personen en plaatsen.
Het corpus bestaat uit drie grote teksten (Wachtendonkse Psalmen, Leidse (of Egmondse) Willeram, Mittelfränkische Reimbibel) en talrijke kleinere Oudnederlandse teksten en tekstfragmenten (waaronder runeninscripties), glossen en losse woorden, Frankisch materiaal en toponymisch materiaal. Meer gedetailleerde informatie over hoe het corpus is samengesteld, is hier te vinden.
Het corpus is taalkundig verrijkt met woordsoort en lemma. De annotatie is handmatig nagekeken voor het hele corpus.
Versiegeschiedenis
Het is niet de eerste maal dat het materiaal van het Corpus Nederlands beschikbaar komt. Exact tien jaar geleden – op 29 februari 20212 om precies te zijn – werd een eerste online toegankelijke versie van het Corpus Oudnederlands gelanceerd. Het had de vorm van een citatendatabank. Als gevolg daarvan was het zoeken op opeenvolgende woorden niet mogelijk. Elk woord in een citaat had namelijk een eigen rij (record) in die databank, met taalkundige informatie (woordsoort en lemma), het volledige citaat en de metagegevens van het citaat. Deze versie is niet langer beschikbaar.
In 2018 zijn voor het Nederlab-project de gegevens uit die databank omgezet naar een woord voor woord taalkundig verrijkte tekst, waarbij correcties zijn uitgevoerd en tekstmetadata zijn toegevoegd.
In deze nieuwe versie zijn correcties aangebracht in de toegevoegde metadata in het corpus en is de taalkundige verrijking in overeenstemming gebracht met de Tagset voor Diachroon corpusmateriaal van het Nederlands (TDN).
Gebruiksmogelijkheden
Het Corpus Oudnederlands is in dezelfde vorm gegoten als de andere historische corpora die het Instituut voor de Nederlandse Taal online heeft gezet (een overzicht daarvan is te vinden op de website van het instituut). Dat is prettig voor wetenschappers en andere belangstellenden die vanwege hun onderzoek naar latere taalfasen van het Nederlands al vertrouwd zijn geraakt met de gebruikte corpusapplicatie.
Het is mogelijk te zoeken op onder andere woord, lemma, woordsoort. Om nog specifiekere resultaten te verkrijgen kan er gefilterd worden op jaar, plaats, teksttype, titel en auteur. Vervolgens kunnen de treffers gegroepeerd en/of gesorteerd worden. Alle gevonden gegevens kunnen bovendien geëxporteerd worden, bijvoorbeeld naar een Excelbestand. Hoe je dit precies moet doen, kun je lezen in de uitgebreide gebruikershandleiding.
Met de Inleiding Oudnederlands, het Oudnederlands Woordenboek en het Corpus Oudnederlands is de oudste fase van het Nederlands aardig ontsloten. Laten we snel met dit materiaal aan de slag gaan: uuat unbidan uue nu?
Ren de Vree zegt
Dat of die corpus is voor een leek een nare zoekmachine. Is er niet ergens een handige site waarop de oudste fragmenten van het Oud Nederlands staan in volgorde van hun leefstijd?
Berthold van Maris zegt
Het werd tijd.