Door Roland de Bonth (Instituut voor de Nederlandse Taal)
Gisteren heeft het Instituut voor de Nederlandse Taal een nieuwe, derde versie van de internetapplicatie Brieven als Buit uitgebracht. Dit corpus bevat 1033 brieven uit de 17e en 18e eeuw die familieleden, vrienden, bekenden en zakenpartners vanuit het buitenland naar hun vaderland hebben gestuurd of – omgekeerd – die vanuit Nederland naar overzeese gebieden zijn gezonden. Hun bestemming hebben deze brieven nooit bereikt. Tijdens de vier Engels-Nederlandse oorlogen werden ze buitgemaakt door kapers, die hiervoor in een kapersbrief toestemming kregen van hun overheid. Om te kunnen controleren of de kaping op correcte wijze was verlopen nam het High Court of Admiralty de brieven in beslag. Uit de meer dan 40.000 brieven die als gevolg daarvan in de National Archives in Kew (Verenigd Koninkrijk) worden bewaard, werd een selectie gemaakt voor het onderzoeksprogramma Brieven als Buit/Letters as Loot, dat liep van 1 september 2008 tot 1 september 2013 en geleid werd door prof. dr. Marijke van der Wal.
Onderzoek
Het belang van de gekaapte brieven kan niet voldoende benadrukt worden. Deze bron biedt niet alleen een inkijkje in het leven van mensen uit de middenklassen en lagere klassen, maar laat ons ook kennis maken met het tot dan toe nagenoeg onbekende taalgebruik van gewone mensen uit de 17e en 18e eeuw. In het onderzoeksprogramma Brieven als Buit/Letters as loot is een eerste aanzet gegeven tot het bestuderen van deze informele taal, wat onder meer geresulteerd heeft in een monografie van Marijke van der Wal en Gijsbert Rutten en in proefschriften van Judith Nobels en Tanja Simons (zie hier).
Het corpus Brieven als Buit
In nauwe samenwerking met het Instituut voor Nederlandse Lexicologie (INL), waaruit het huidige Instituut voor de Nederlandse Taal (INT) is voortgekomen, werd een internetapplicatie ontwikkeld waarmee het mogelijk werd taalkundig onderzoek te doen naar het taalgebruik in deze brieven. Daartoe werden alle 1033 brieven getranscribeerd, gelemmatiseerd, taalkundig verrijkt (met onder andere lemma en PoS (Part of Speech)) en voorzien van metadata. Na de lancering van de eerste versie van het corpus (5 september 2013) en de tweede release van 18 juni 2015 is op 29 januari 2021 de derde versie beschikbaar gekomen.
Vernieuwingen
Gebruikers van de eerdere versies zal direct opvallen dat de applicatie een uiterlijke verandering heeft ondergaan. Het corpus is nu in hetzelfde jasje gestoken als het Corpus Gysseling en het Corpus Middelnederlands. Dit is handig en prettig voor onderzoekers die deze historische corpora willen gebruiken voor diachroon taalonderzoek.
De nieuwste versie van Brieven als Buit biedt inhoudelijk dezelfde mogelijkheden als de twee eerdere releases maar heeft ook enkele aantrekkelijke nieuwigheden. Zo is het aantal manieren om te zoeken uitgebreid van twee naar vier (Simple Search, Extended Search, Advanced Search en Expert Search). Met behulp van de zogeheten Query builder in Advanced Search kan ook de onderzoeker die geen of weinig ervaring heeft met Corpus Query Language (CQL) toch complexe zoekopdrachten maken. Een interessante verandering is ook dat het nu mogelijk is om de resultaten van een zoekopdracht te sorteren en vervolgens te exporteren naar een csv- of een excel-bestand. Zo kan een onderzoeker uit het Brieven als Buit-corpus met deze zoekopdracht alle gevallen verzamelen van bijvoeglijke naamwoorden die voorafgaan aan het zelfstandig naamwoord man of met deze zoekopdracht alle zinnen waarin drie voornaamwoorden achter elkaar voorkomen.
De internetapplicatie Brieven als Buit kan dus goede diensten bewijzen voor morfologisch en syntactisch onderzoek. De uitgebreide helpfunctie legt alles helder uit en geeft tal van voorbeelden.
Laat een reactie achter