In de jaren zeventig en tachtig was Hugo Brandt Corstius waarschijnlijk de beroemdste taalkundige van Nederland. Hij was iemand die er eigenhandig voor zorgde dat grote groepen Nederlanders inzagen dat je niet alleen over taal kunt mopperen, maar je er ook over verbazen en er vooral op een wiskundige manier naar kunt kijken. Hij was iemand die de taalkundige ideeën van Chomsky voor iedereen die Nederlands kan lezen en niet helemaal suf is, begrijpelijk heeft opgeschreven, en trouwens ook bekritiseerd.
Heel groot is zijn wetenschappelijke oeuvre niet, zeker wanneer je het vergelijkt met de enorme berg stukjes en boeken die hij daarbuiten publiceerde. Naar zijn eigen zeggen was zijn enige échte bijdrage dat hij er al vroeg op wees dat het een utopie is om te denken dat de computer ooit – of in ieder geval op korte termijn – zou kunnen vertalen.
Maar dat deed zijn verdiensten te kort.
Hij was de eerste computertaalkundige in Nederland: iemand die de taal wilde bestuderen met de computer én de computer wilde leren omgaan met menselijke taal. In een (heel lezenswaardige) geschiedenis van de Nederlandse computertaalkunde (Van rekenmachine tot taalautomaat) wordt hij ‘een icoon van de computerlinguïstiek’ genoemd, wiens naam “met eerbied” wordt genoemd. Hoewel er niet veel mensen bij hem gepromoveerd zijn, zijn daar wel een paar van de belangrijkste computertaalkundigen van de volgende generatie bij, zoals Harry Bunt en Luc Steels.
Zei Maaike Helder gisteren
Het oeuvre, dat geheel verscheen onder de naam H. Brandt Corstius, bestaat vooral uit enkele artikelen, zijn proefschrift Exercises in Computational Linguistics, en twee inleidende boeken: Algebraïsche taalkunde (Oosthoek’s, 1974) en Computer-taalkunde (Coutinho, 1978).
Het eerste van die twee boeken beschrijft de taal als een wiskundig object: een verzameling zinnen die je met een precieze theorie kunt karakteriseren. De verzameling is oneindig omdat er geen langste zin bestaat. (Stel, u denkt dat er wel zo’n langste zin bestaat. Dan neemt H. Brandt Corstius die zin en zet er ‘, zei Piet Grijs gisteren‘ achter. En krijgt dus een zin die langer is. Dat bewijst dat er altijd een langere zin gemaakt kan worden, bijvoorbeeld door er ‘, zei Maaike Helder gisteren’, ‘zei Talisman gisteren’, ‘zei Battus gisteren’, achter te zetten.) Wat is nu de beste manier om zo compact én precies mogelijk de verzameling zinnen te karakteriseren?
Berkeley
De Amerikaanse taalkundige Noam Chomsky had zich in de jaren vijftig betrekkelijk korte tijd met deze materie beziggehouden, waarbij hij onder andere de studie van programmeertalen voor de computer enorm vooruitgeholpen had, en het was deze manier van kijken die Brandt Corstius vervolgens eind jaren zestig en begin jaren zeventig het meest inspireerde. Voor Chomsky was het altijd maar een zijlijntje geweest in zijn onderzoek: hij was niet zo geïnspireerd in de studie van talen als wiskundig object, al importeerde hij wel wiskundige methoden in zijn werk. Vermoedelijk raakte Brandt Corstius daarop uitgekeken, al ging hij ook zelf niet echt verder met mathematisch taalkundig werk, en incorporeerde hij voor zover ik kan zien sinds de vroege jaren zeventig geen nieuwe inzichten meer.
Het proefschrift was veel praktischer gericht geweest, en beschreef vooral enkele computerprogramma’s die een of andere taalgerichte taak hadden uitgevoerd. Zo was Brandt Corstius de eerste die een computerprogramma maakte dat woorden in lettergrepen kon onderverdelen – een programma die heel lang door NRC Handelsblad is gebruikt voor woordafbrekingen aan het eind van een regel. In Van rekenmachine tot taalautomaat wordt verteld dat Brandt Corstius het programma al in Amsterdam ontwierp, maar nog niet echt kon uitvoeren omdat hem geen computer ter beschikking stond. Dat kwam pas toen hij in Berkeley ging studeren; waar men vervolgens weer niet begreep wat hij moest met een computerprogramma waarvan de invoer en de uitvoer nagenoeg hetzelfde waren: een lijst woorden (zij het dat in de tweede lijst wat streepjes waren toegevoegd).
Bloempje
Computer-taalkunde, tenslotte, geeft een breed overzicht van allerlei soorten activiteiten die onderzoekers eind jaren zeventig inmiddels waren gaan uitvoeren met de computer: de relatieve frequentie van Nederlandse woorden tellen, programma’s schrijven die een intelligente conversatie met de gebruiker zouden moeten voeren, of die teksten uit het Russisch vertaalt of die, bescheidener, een verkleinwoord maken van een gegeven zelfstandig naamwoord (bloem wordt bloempje). Iets soortgelijks had hij, veel korter, gedaan in zijn oratie uit 1974.
Al die boeken zijn, natuurlijk, helder en animerend geschreven. Ze zijn niet speciaal grappig, maar ze zijn wel heel slim en bevatten af en toe een klassiek aforisme (‘Wat je ook doet, de semantiek gooit roet’: Je kunt als computertaalkundige doen wat je wilt, op zeker moment word je geconfronteerd met het feit dat de computer het gebodene niet begrijpt.)
Ik heb ze gisterenavond, geschrokken van het bericht van zijn dood, nog eens gelezen. Ze waren voor mij in de vroege jaren tachtig, toen ik nog op de middelbare school zat, mijn eerste kennismaking met de taalkunde en een belangrijke aanwijzing dat dit wel eens de studie kon zijn waar ik mijn belangstelling voor wiskunde én voor taal zou kunnen combineren. Ik ben sindsdien andere kanten opgegaan maar nu ik die boeken weer eens doorgesnuffeld heb, heb ik ineens weer zin om een wiskundige definitie op te stellen van de Nederlandse lettergreep.
Laat een reactie achter