Onverwachte taalvragen aan de Wetenschapsagenda (21)
Door Marc van Oostendorp
Sommige vragen aan de Nationale Wetenschapsagenda storten de rijpere onderzoeker in een de nostalgie. Kennelijk worden mensen nog steeds warm van kwesties als de volgende:
Kun je een computer een (relevant) artikel / boek laten schrijven? Zijn er algoritmes denkbaar waarbij je computers geautomatiseerd een artikel of een boek laat schrijven? Hoogstwaarschijnlijk krijg je dan veel artikelen/boeken zonder enige betekenis. Maar als je geautomatiseerd heel veel artikelen/ boeken laat genereren, verschijnen er theoretisch ook teksten die wel relevantie hebben. En als je die relevante teksten vervolgens met slimme zoeksoftware op het spoor weet te komen, ontstaat er wellicht een interessante bron van informatie.
Weinig mensen hebben de tijd bewust meegemaakt waarin deze vraag niet gesteld werd: ergens in de vroege jaren veertig is hij waarschijnlijk voor het eerst op ongeveer deze manier gesteld. Als computers dit kunnen, en vooral als die artikelen niet alleen ‘relevant’ zijn, maar ook prettig leesbaar en inzichtelijk, dan hebben computers waarschijnlijk een van de laatste barrières naar kunstmatige vormen van intelligentie geslecht.
Breien
De vragensteller van de wetenschapsagenda wordt overigens gedreven door een eigenaardige combinatie van pessimisme en optimisme. Aan de ene kant denkt hij (of zij) dat computers niet slim genoeg zijn om meteen zo’n artikel te schrijven. Aan de andere kant denkt hij dat ze wel met ‘slimme zoeksoftware’ uit enorme stapels door andere computers geschreven teksten de ‘relevante’ weten te filteren.
Dat lijkt een wat omslachtige methode: eerst een heleboel onzin genereren en daar dan in gaan zoeken tot je op iets stuit dat wel zin heeft. Je kunt die techniek natuurlijk wat efficiënter toepassen als de generator en de zoeker dezelfde zijn: de computer maakt eerst een klein stukje tekst – zeg, een zin –, kijkt of dat ‘relevant’ is, en probeert er dan een nieuw stukje aan vast te breien, en kijkt dan weer of het grotere resultaat nog steeds relevant is. Zo nee, dan gooit hij het nieuwste stukje weg, en probeert iets anders aan het alreeds o zo relevante stukje te breien.
Both
Het is de manier waarop sommige menselijke schrijvers kennelijk werken. (Ik niet, ik werk heel onrustig, en schrijf een beetje aan het begin van mijn tekst erbij, ga dan door naar het einde, en dan weer terug naar het begin, om ergens in het midden te eindigen. Ja, je merkt het aan de weinig relevante onzin die ik de hele tijd opschrijf, wat u zegt. Zo zou je het de computer ook kunnen laten doen, maar ik weet niet of je daar iets mee opschiet.)
Computers zijn duidelijk nog lang niet zo ver: ze zijn nog niet in staat een ‘relevante’ tekst van de lengte van een alinea te schrijven, behalve als het een weerbericht betreft of een heel saai sportverslag. Of het soort commentaar op stukken in De Telegraaf zoals Hubert B. Both ze al jarenlang met zwier schrijft (en tweet):
als ze het buurthuis nou in de achtertuin van de burgemeester zetten, misschien dat er dan nog een paar kiezers intrappen.
— Hubert_Both (@Hubert_B_Both) 13 september 2016
Raadsel
Er zitten in de menselijke geest nog altijd twee vonkjes die we niet begrijpen – het vonkje dat ons soms op nieuwe ideeën brengt en het vonkje dat ons in staat stelt enig idee op een aansprekende manier onder woorden te brengen.
We zijn nog lang niet zo ver. De vraag is daarbij overigens niet waarom we dit alles zouden willen. Natuurlijk, het probleem is voor de meeste mensen niet dat er te weinig ‘relevante’ teksten zijn en dat computers dus gauw voor hele extra stapels ‘relevant’ leesmateriaal moeten zorgen, want over het algemeen valt nu al niet te lezen wat de mensen zonder computers allemaal schrijven. Maar dat is ook het punt niet. Het punt is dat we graag willen weten hoe die vonkjes precies werken – dat we het raadsel van onze jeugd willen oplossen.
John Wervenbos zegt
Belangrijk thema. Het doet me denken aan (1) de enorme vorderingen van de schaakcomputer in nog geen honderd jaar tijd, waartegen zelfs de sterkste grootmeesters tegenwoordig niet meer zijn opgewassen en (2) een trits als (a) het Semantisch Web, (b) the Human Brain Project en (c) the Blue Brain Project.
‘Interacteren’ en samensmeden. Behoeft de Nederlandse taal een nieuw werkwoord? To interact? Wat brengt in logaritmische processen geïnaugureerd door mensen ‘leven’ en ‘(zelf)reflectie’? En aldus met wat voor lichamen, bodies?
De probleemstelling is helder en de slotparagraaf van dit blogartikel, ‘Raadsel’, is sterk. Achter de genoemde vonkjes gaat het raadsel van de menselijke intelligentie schuil, in feite ook van de oorsprong en bestemming van mensen; de evolutie en het scheppend vermogen van de mensheid.
Freek Van de Velde zegt
Leuke observatie van dat pessimisme/optimisme, een paradox die voorkomt in menig toekomstvisioen van futurologen en fantasten allerhande.
Maar waar ik eigenlijk op wou reageren. Je schrijft: “Dat lijkt een wat omslachtige methode: eerst een heleboel onzin genereren en daar dan in gaan zoeken tot je op iets stuit dat wel zin heeft.” Maar dat is nou net hoe die fylogenetische technieken werken die taalverwantschap in kaart brengen. Die genereren een ontzaglijke hoeveelheid bomen, om dan met Bayesiaanse technieken na te gaan welke boom de meest waarschijnlijke is. Dus zo stom is het idee misschien nog niet. En er is al software die op eigen kracht wetten uit de fysica kan afleiden. Zie: https://www.wired.com/2009/04/newtonai/