Lustrum alfa-informatica: 25 jaar onderzoek naar taal en computers
Kan de computer ooit onze taal doorgronden?
Dinsdag 31 januari 2012 viert de opleiding alfa-informatica (informatiekunde) aan de Rijksuniversiteit Groningen haar 25-jarig bestaan. Dat gebeurt met een symposium en twee oraties van hoogleraren informatiekunde aan de RUG. Zij gaan in op het begrijpen van taal door de computer.
De studie informatiekunde begon 25 jaar geleden onder de naam alfa-informatica, en de afdeling die de studie verzorgt draagt die naam nog steeds. Op het lustrum kijken vier betrokkenen en twee vakgenoten uit het buitenland terug op het verleden en vooruit naar de toekomst: prof.dr. Gerry Wakker, prof.dr. Frans Zwarts, prof.dr. Eduard Hovy, dr. Melissa Terras, dr. George Welling en drs. Jori Mur. Daarna is er een dubbeloratie waarmee de nieuwe hoogleraren Johan Bos en Gertjan van Noord hun ambt aanvaarden.
Alfa-informatica
Alfa-informatica is een vakgebied dat taal, communicatie en informatietechnologie combineert. In Groningen ligt daarbij sterk de nadruk op taal en tekst en het analyseren en begrijpen van taal door computers. Bij de studie staan twee thema’s centraal. Enerzijds is er veel aandacht voor computertaalkunde, waarbij computers worden ingezet om taalkundige problemen op te lossen, zoals het automatisch ontleden van zinnen. Veel aandacht gaat hierbij naar het ontwikkelen van programma’s waarmee computers de nuances in menselijke taal kunnen begrijpen. Anderzijds worden er toepassingen voor het web ontwikkeld, zoals een systeem om twitterberichten te analyseren op trends.
Begrijpt de computer onze taal?
Het lustrum wordt luister bijgezet door twee oraties over het doorgronden van de betekenis van taal door de computer. De oratie van prof.dr. Johan Bos, getiteld Rekenen met betekenis, gaat over computationele semantiek. Dat is het vakgebied waarbij computers worden ingezet om verschillende aspecten van betekenis te bestuderen en te modelleren. Voor mensen is het redelijk eenvoudig om de juiste betekenis van woorden te kiezen, maar voor computers is dat uiterst lastig. Dat geldt bijvoorbeeld voor dubbelzinnige zinnen als ‘Kees is gelukkig getrouwd’ en ‘Hij pakte een broodje, ging bij de piano zitten, en nam er een hap van.’ Bos zal laten zien hoe betekenissen van woorden, zinnen en teksten concreet gemaakt kunnen worden, zodat we er mee kunnen rekenen. Op die manier kan menselijke taal begrijpelijker worden gemaakt voor computers. De techniek is van belang voor vele toepassingen waarin automatische verwerking van taal een rol speelt.
Prof.dr. Gertjan van Noord behandelt in zijn oratie, getiteld Het ontleedkundig laboratorium, het automatisch ontleden van het Nederlands. Om een computer taal te laten begrijpen, is een belangrijke eerste stap automatische ontleding: welke woorden horen bij elkaar, en wat is de rol van de verschillende woorden en woordgroepen? Van Noord legt uit uit welke problemen de computer moet oplossen en tot welke prestaties de computer nu in staat is. Hij ziet twee trends. Aan de ene kant is de kwaliteit van de ontleding nog voor enorme verbeteringen vatbaar. Daarbij gaat het vooral om problemen die een computer heeft met onvolkomenheden in de invoer, zoals spelfouten of de taal op social media. Daarentegen is de kwaliteit van de automatische ontleding voor verzorgd geschreven taal heel goed en vermoedelijk nauwelijks voor verbetering vatbaar.
Laat een reactie achter