Door Marc van Oostendorp Het is onzeker dat er behalve de mens ergens in het universum nog een wezen is dat teleurstelling kan ervaren. Het is vergeleken met bijvoorbeeld boosheid of vrolijkheid een ingewikkelde emotie. Je moet iets verwacht hebben en dan moet het gebeurd zijn en je gevoel over die gebeurtenis moet negatiever zijn dan van te voren. Wie wil er geen … [Lees meer...] overTeleurstellingswetenschap
computertaalkunde
Water en taal
Door Marc van Oostendorp Een taal is geen stroompje, maar een grote, brede rivier. Traag stroomt ze permanent in de richting van de zee. Als je iets dichter bij kijkt, zie je golfjes die in de richting van de oever gaan. En nóg dichterbij, onder de microscoop, bewegen de moleculen alle kanten op. Zo is het ook met de taal. In de loop van de eeuwen gaat ze een bepaalde … [Lees meer...] overWater en taal
Bewijs maar eens dat een robot geen god is
Door Marc van Oostendorp Ergens in Amerika staan twee speakertjes nu al dagen onafgebroken met elkaar te kibbelen. En dat is enigszins beangstigend. Op dit moment zeggen de twee, die geheel terecht Vladimir en Estragon genoemd worden, bijvoorbeeld tegen elkaar: V: A while ago, you said you were a human girl. E: Yes, I am a human girl. V: Why do you think you … [Lees meer...] overBewijs maar eens dat een robot geen god is
Computer vindt tussentaal
Door Marc van Oostendorp Een van de problemen voor vertaalcomputers was tot nu toe altijd dat er zoveel talen zijn. Je kunt jaren besteden aan een computer die goede vertalingen maakt van het Frans in het Engels, en dan vele jaren voor een computer die Russisch in het Engels vertaalt, maar dan heb je het Frans en het Russisch nog niet aan elkaar gekoppeld. Dat probleem lijkt … [Lees meer...] overComputer vindt tussentaal
Google Translate wordt onbegrijpelijker (en beter)
Door Marc van Oostendorp Het is al een tijdje geleden dat Google Translate in het nieuws was, maar deze week kwam Google weer met een fascinerend bericht. Een paar jaar geleden hoorde je regelmatig over deze online-vertaalmachine: steeds weer werden nieuwe talen toegevoegd aan het systeem, en je kreeg ook het gevoel dat vertalingen inderdaad steeds beter werden. Maar op … [Lees meer...] overGoogle Translate wordt onbegrijpelijker (en beter)
Kun je een computer een (relevant) artikel / boek laten schrijven?
Onverwachte taalvragen aan de Wetenschapsagenda (21) Door Marc van Oostendorp Sommige vragen aan de Nationale Wetenschapsagenda storten de rijpere onderzoeker in een de nostalgie. Kennelijk worden mensen nog steeds warm van kwesties als de volgende: Kun je een computer een (relevant) artikel / boek laten schrijven? Zijn er algoritmes denkbaar waarbij je computers … [Lees meer...] overKun je een computer een (relevant) artikel / boek laten schrijven?
Facebook wordt taalvaardiger, maar verre van taalvaardig
Door Lucas Seuren De wens om computers menselijke taal te leren is al vele decennia oud, maar tot op heden zijn ze daar slechts zeer beperkt toe in staat. Facebook kondigde onlangs een nieuwe engine aan die tekst van gebruikers beter moet gaan begrijpen: DeepText. Deze engine zou met bijna menselijke precisie tekst moeten kunnen begrijpen. Een erg stoutmoedige claim, en gelet … [Lees meer...] overFacebook wordt taalvaardiger, maar verre van taalvaardig
Is de structuur van het Nederlands te complex voor computers om te produceren?
Onverwachte taalvragen aan de wetenschapsagenda (16) Door Marc van Oostendorp Zestien taalvragen hebben een geheel eigen koepel gekregen in de Nationale Wetenschapsagenda: de vragen over de vraag of we computers beter met taal kunnen laten omgaan, de zogenoemde taaltechnologie. Zestien vragen van de elfduizend die oorspronkelijk door de Nederlandse bevolking zijn … [Lees meer...] overIs de structuur van het Nederlands te complex voor computers om te produceren?
Een informaticus in Toronto
Door Marc van OostendorpIk wil een nieuwe, onregelmatige serie maken van video's met neerlandici, over de vraag waarom ze Nederlands zijn gaan studeren. Vandaag de eerste aflevering, met Barend Beekhuizen, die deze week promoveerde in Leiden en volgende week begint bij de afdeling computer science van de Universiteit van Toronto. … [Lees meer...] overEen informaticus in Toronto
Buongiorno MRS!
Door Marc van OostendorpEen bespreking van Google Translate.Bekijk de video op YouTube … [Lees meer...] overBuongiorno MRS!
Google Translate: ook de maker gelooft er niet meer in
Door Marc van OostendorpTerwijl de managers in de academische wereld nog documenten schrijven waarin ze big data als dé grote revolutie van de komende twintig jaar in de digital humanities zien, houdt het bedrijfsleven het inmiddels voor gezien. Dat blijkt uit nu weer uit een berichtje dat in een onopvallend hoekje van het internet verscheen: Franz Och, sinds 2004 het hoofd van … [Lees meer...] overGoogle Translate: ook de maker gelooft er niet meer in
Mag Google Translate niet beter worden van Google?
"Op een dag de bijter gebeten," schrijft de Britse krant The Guardian vanochtend, "een Braziliaanse WK dat thrillingly bewogen was geweest op het veld ontplofte dramatisch in het leven eraf. " Althans, wanneer je Google Translate mag geloven, momenteel de beste automatische vertaler ter wereld. Google is dit jaar tien jaar bezig met het ontwikkelen van de vertaalmachine: in … [Lees meer...] overMag Google Translate niet beter worden van Google?
‘Ben ik soms jouw rekenmachine’?
Hoe Eugene Goostman ons allemaal gaat veranderen Door Marc van Oostendorp Eugene Goostman is 13 jaar, komt uit Odessa, bezit een cavia, en gaat onze kijk op de mensheid mogelijk op zijn kop zetten. Dat komt dan doordat hij geen mens is, maar een computerprogramma. Zaterdag wonnen de programmeurs van Eugene namelijk in Londen de zogeheten Turingtest, waarbij een aantal … [Lees meer...] over‘Ben ik soms jouw rekenmachine’?
Blogje uit Albuquerque
Amersfoort?Zo ongeveer het makkelijkste als je een vreemde taal leert, zijn geografische namen. Op een paar uitzonderingen na kun je die gewoon laten zoals ze zijn. Ik woon in Amersfoort, en ook als ik Engels, Duits of Spaans schrijf, woon ik nog steeds in Amersfoort. Uitspreken doe ik de naam in die andere talen ietsje anders, maar dat is het dan ook. Een kind kan de was … [Lees meer...] overBlogje uit Albuquerque
Alle talen lijken op elkaar
Een nieuwe vertaaltruc van Googledoor Marc van OostendorpWie wil weten hoe de taaltechnologie – onze kennis over hoe computers met taal kunnen omgaan – zich ontwikkelt, doet er goed aan om Google in de gaten te houden. Daar worden doorlopend slimme mensen aangesteld, bijvoorbeeld om te werken aan Google Translate.Vorige week verscheen er een nieuw artikel op internet waarin een … [Lees meer...] overAlle talen lijken op elkaar
Ten behoeve van de verwerking van dialectwoordenboeken: stagiairs met een technische achtergrond en stagiairs met een taalkundige achtergrond
Het Meertens Instituut is bezig met de samenstelling van een computationeel dialectlexicon en een zoekmachine die als hulpmiddel gebruikt kan worden om in dialectteksten te zoeken. Hiervoor worden de trefwoorden uit bestaande, digitaal beschikbare dialectwoordenboeken voorzien van een Standaardnederlandse vorm, zodat de dialectwoordenboeken toegankelijk worden via de … [Lees meer...] overTen behoeve van de verwerking van dialectwoordenboeken: stagiairs met een technische achtergrond en stagiairs met een taalkundige achtergrond
Geschiedenis van de woordfrequentie
Frequentie is in de taalwetenschap al een tijdje een toverwoord. Woorden die vaak voorkomen, die hoogfrequent zijn, zijn bijzonder. Ze zijn bijvoorbeeld gemiddeld korter dan laagfrequente woorden volgens een van de bekendste wetten van de taalwetenschap, de Wet van Zipf. Ook spreken sprekers dit soort woorden vaak wat achtelozer uit: omdat ze zo vaak voorkomen, voegen ze minder … [Lees meer...] overGeschiedenis van de woordfrequentie
Plaatjes kijken
Ik gebruik Google Images wel eens als vertaalcomputer. Als ik in een buitenlandse tekst een woord tegenkom dat ik niet goed begrijp, bekijk ik even de plaatjes. Ook voor Nederlandse termen die voor mij nieuw zijn doe ik het wel eens. Niet dat het altijd helpt: mij wordt bijvoorbeeld niet duidelijk wat voor kleur appelblauwzeegroen nu precies is — je zou denken dat het … [Lees meer...] overPlaatjes kijken
Google Translate herkent 1-aprilgrappen
Ik dacht even dat het zelf een grap was: het persbericht waarmee Google aankondigde dat de statistische software van het bedrijf nu ver genoeg geëvolueerd is om aan de hand van stijlkenmerken 1-aprilgrappen te herkennen. Even bellen met Antal van den Bosch, de Nijmeegse hoogleraar en Google-watcher, maakt duidelijk dat het bedrijf wel degelijk serieus is: … [Lees meer...] overGoogle Translate herkent 1-aprilgrappen