Wordt de taalindustrie weggeblazen?

Hoe staat de taalindustrie ervoor? Er zijn in ons taalgebied weinigen – herstel: er is niemand – die hier zo’n goed overzicht over heeft als Frieda Steurs, de directeur van het Instituut voor de Nederlandse Taal. Onlangs publiceerde ze een goed overzichtswerk over de manieren waarop mensen met taalkundige kennis hun geld verdienen, en dan vooral in combinatie met digitale middelen: als vertaler, als taaltechnoloog, als docent, als technisch schrijver, enzovoort. Het zijn stuk voor stuk vakken waar je grote taalbeheersing moet combineren met uiterste precisie.

Veel mensen weten niet dat die taalindustrie bestaat, schrijft Steurs terecht. Op de een of andere manier zijn de talen in de perceptie van veel mensen vooral een hobby, of op zijn best een vorm van wetenschap die ver afstaat van de wereld waarin geld wordt verdiend. Maar niets is minder waar: er zijn heel veel mensen die met taal hun geld verdienen.

En die wereld is voortdurend in beweging. Door alle technische ontwikkelingen hebben mensen de afgelopen decennia hun werk al enorm aangepast: voorbij de tijd dat de vertaler in een kamertje zat met een stapel vertaalwoordenboeken of de docent voortdurend haar aandacht over alle leerlingen moest verdelen. Er zijn weinig beroepen voor hoger opgeleiden waarbij mensen niet heel veel achter een beeldscherm zitten – en voor beroepen in de taalindustrie geldt dat nog veel sterker.

De komst van de ‘grote taalmodellen’ en de ‘chatbots’ hebben dat allemaal nog eens in de versnelling gebracht, al is het maar doordat klanten menen dat de computer inmiddels toch wel alles kan vertalen, dat de computer je toch wel een taal kan leren (als hij het al niet overbodigt maakt dat je je uitslooft om vreemde talen te leren). Zo ver is het allemaal nog niet – deskundigen, menselijke deskundigen, zijn voorlopig nog nodig.

Het is dapper, vind ik, om nu een boek te schrijven waarin AI een belangrijke rol speelt, want er verandert voortdurend van alles in die technologie. We hebben zulke perioden al wel eerder meegemaakt: dertig jaar geleden bijvoorbeeld, bij de ook zeer stormachtige opkomst van het Internet. Er verschenen toen boeken – papieren boeken waren toen zelfs de enige manier waarop informatie werd verspreid – met allerlei grandioze voorspellingen, maar zonder dat iemand Elon Musk voorzag, of zelfs de sociale media of de smartphone.

Dat gevaar lopen we nu ook. We kunnen onze zorgen uiten over de last voor het milieu, het feit dat er op grote schaal gebruik wordt gemaakt van auteursrechtelijk beschermd materiaal om de modellen op te tuigen, of de uitbuiting van de mensen die voor hongerloontjes de modellen trainen; of we kunnen ons verbazen over wat de modellen nu allemaal kunnen en wat voor domme fouten ze daarbij maken. Maar echt iets voorspellen kunnen we niet.

Wordt de hele taalindustrie de komende twintig jaar weggeblazen? Wie weet. Zelfs de taalmodellen zelf zijn niet met taalkundige kennis gebouwd: ze bedrijven pure statistiek op willekeurig welke bergen gegevens, of die nu iets bevatten dat wij taal noemen of niet. De programmeur van zulke systemen hoeft dus nog geen onderwerp van een lijdend voorwerp te kunnen onderscheiden. Misschien is dat voldoende. Maar het is ook net zo goed denkbaar dat om de vólgende stap te zetten in deze ontwikkeling, er wel degelijk taalwetenschappelijke kennis nodig is.

Steurs kiest daarom de verstandige weg en beschrijft vooral het heden: wat we nu hebben, en wat we nu kunnen voorzien. De informatie in haar boek zal hoe dan ook verouderen, maar het zal altijd een goed beeld blijven geven van hoe je op een economisch verstandige manier met taal kon omgaan anno 2025.

Frieda Steurs. Taal in transformatie. Technologie, economie en de kracht van generatieve AI. Leiden: INT/Scriptum. Bestelinformatie bij de uitgever.