Nog voor de zomermaanden beginnen de Nederlandse Taalunie en het
bedrijf GridLine BV uit Amsterdam aan het terminologieproject
TermTreffer. Dat project is gericht op het ontwikkelen van een
softwareprogramma voor de extractie van termkandidaten uit digitale
vakteksten in het Nederlands. De applicatie zal in staat zijn in
Nederlandstalige vakteksten termen van gewone woorden te onderscheiden
en die vervolgens te selecteren uit de tekst, samen met een reeks
taalkundige kenmerken zoals geslacht, vervoegingen en verbuigingen.
Het project is van groot belang voor de volwaardige deelname van onze
taal in het zakelijk, wetenschappelijk, technisch en juridisch
communicatieverkeer. Hierin duiken vele vaktermen op die voor
vakspecialisten een heldere betekenis hebben, maar die voor
niet-vakgenoten en voor gewone mensen onduidelijk of zelfs
onbegrijpelijk zijn. Daarom is het van belang deze termen te
verzamelen en in ruimer maatschappelijk verband te ontsluiten.
Het softwareprogramma zal vakmensen in staat stellen om hun
terminologie te evalueren, te beheren en waar nodig aan te passen en
biedt ook woordenboekmakers de kans om termen in hun woordenboeken op
te nemen en deze nauwkeurig voor een algemeen publiek te beschrijven.
Terminologieverzamelingen zijn ook nodig om vertalers in staat te
stellen om complexe vakteksten te vertalen van de ene in de andere
taal en daarbij ook de juiste vertaalequivalenten te kiezen. Ten
slotte zijn terminologiebanken van belang voor kennisbeheer en voor
het beheren en ontsluiten van grote informatiesystemen, zoals
bijvoorbeeld de wet- en regelgeving binnen een bepaald land.
Zonder software voor terminologie-extractie moet het verzamelen van
termen binnen vakgebieden handmatig gebeuren en dat kost veel tijd en
geld. Bovendien worden zoveel vakteksten geproduceerd en verandert de
terminologie binnen vakgebieden zo snel dat een handmatige selectie
eenvoudigweg geen optie meer is. De selectie moet noodgedwongen worden
geautomatiseerd. Het zijn computers die een basisselectie maken, zodat
de mens zich kan beperken tot het corrigeren en bewerken van die ruwe
selectie.
De Nederlandse Taalunie heeft het project aan GridLine gegund op basis
van een aanbesteding naar Europees recht. De ontwikkeling van het
computerprogramma zal ongeveer een jaar in beslag nemen en ca. EUR
150.000 gaan kosten. De projectuitvoering wordt wetenschappelijk
ondersteund en geëvalueerd door een groep experts op het vlak van
taaltechnologie en terminologie en gecoördineerd door Tom
Vanallemeersch (Lessius Hogeschool, Antwerpen).
De Taalunie zal het softwareprogramma via de TST-Centrale bij het INL
beschikbaar stellen aan alle potentiële gebruikers, o.a.
vertaaldiensten, e-overheid, software-ontwikkelaars en
wetenschappelijk onderzoekers.
Met de ontwikkeling van dit computerprogramma brengt de Nederlandse
Taalunie opnieuw een essentieel hulpmiddel tot stand dat noodzakelijk
is om het Nederlands volwaardig te integreren in de moderne
informatie- en communicatietechnologie (ICT). De Taalunie heeft het
afgelopen decennium in haar beleidsplannen veel aandacht besteed aan
de taaltechnologie, om ervoor te zorgen dat onze taal qua
bruikbaarheid in moderne toepassingen gelijke tred kan houden met de
grote, ons omringende talen.
Laat een reactie achter