• Door naar de hoofd inhoud
  • Skip to secondary menu
  • Spring naar de eerste sidebar
  • Spring naar de voettekst
Neerlandistiek. Online tijdschrift voor taal- en letterkunde

Neerlandistiek

Online tijdschrift voor taal- en letterkundig onderzoek

  • Over Neerlandistiek
  • Contact
  • Homepage
  • Categorie
    • Neerlandistiek voor de klas
    • Vertelcultuur
    • Naamkunde
  • E-books
  • Neerlandistische weblogs
  • Archief
    • 10 jaar taalcanon
    • 100 jaar Willem Frederik Hermans
  • Jong Neerlandistiek
  • Frisistyk
  • Mondiaal

Proeven met kunstmatig-intelligente machinelezers

26 mei 2025 door Marita Mathijsen 6 Reacties

Mijn oproep voor vrijwilligers om de 480 handgeschreven preken van François HaverSchmidt te transcriberen heeft geweldig gewerkt. Op dit moment zijn er 36 mensen aan het werk (nu ja, misschien niet precies op dít moment, maar op enig moment van de week) om de preken leesbaar te maken. 44 preken zijn nu al in Word gezet. Hulde aan hen!

Nu heeft u zich misschien wel afgevraagd: moet dit in deze tijd nog wel? Kan zo’n afschrift niet via een leesmachine tot stand komen? Daarmee werkt Google Books toch ook, en de DBNL en Gallica gebruiken toch ook niet meer mensenogen en typende mensenvingers? (mij is verteld dat vroeger de teksten voor de DBNL in India overgetypt werden en dat er zo weinig fouten in zaten omdat de overtypers het Nederlands niet begrepen en dus bij wijze van spreken blind typten).

Natuurlijk hebben Nicoline van der Sijs en ik ons afgevraagd of er niet met leesmachines gewerkt kon worden. Dus vroegen we een paar specialisten om advies. Toevallig was er een lezer die Google Lens had losgelaten op het manuscriptfragment in een commentaar op mijn blog van 11 mei. Het resultaat was erbarmelijk. Nicoline probeerde vervolgens ChatGPT uit. Ook dat voldeed niet echt, al was het een stuk beter. Nu heb ik een paar jaar geleden mij het transcriptieprogramma Transkribus laten uitleggen door de specialist daarin, Joost Oosterhuis. Dat was voor manuscripten van Betje Wolff, maar omdat ik eerst scans moest maken en daarna Transkribus moest trainen op haar handschrift, heb ik dat verder laten zitten. Maar Oosterhuis liet me nu weten dat Transkribus inmiddels getraind is op Nederlandse teksten. Bovendien kregen we contact met Annemieke Romein, die veel ervaring heeft met dat programma (dat voor een beperkt aantal scans gratis is, maar bijvoorbeeld in de Allard Pierson-zaal van de Universiteit van Amsterdam vrij gebruikt kan worden).

Ik kom tot ‘des Pudels Kern’. Ik bied hieronder vier weergaven aan van het begin van Preek 321, een preek die HaverSchmidt op 8 september 1872 in Schiedam gehouden heeft. We hebben een makkelijk leesbaar fragment gekozen, met minder doorhalingen en toevoegingen dan in de meeste van zijn preken gebruikelijk is. U ziet eerst het handschrift, dan een met hand en oog door mij gemaakte transcriptie, daarna de versie die Google Lens ervan maakt, vervolgens die van ChatGPT en dan twee versies van Transkribus (Dutch Demeter en Dutch Dean). Conclusie aan het eind.

Preek 321 (eerste blad, eerste alinea) (Universiteit van Leiden, LTK 1818:1, 321)

Transcriptie met de hand, Marita Mathijsen [voor het gemak bij vergelijking zijn de regeleindes aangehouden]:

Hand. 21: 10-14.

Berusting in Gods wil. Ziedaar een der hoofdeischen, die
men ons dagelijks, in naam van het Christendom, doet. Be-
rusting en gehoorzaamheid, uit die twee, zegt men, bestaat
het Christelijke leven. Doe wat God u gebiedt, en onder-
werp u aan wat God over u beschikt, dan toont ge u
eenswillend met den Vader; en eenswillendheid met
God, dat is immers alles, waarin Jezus ons is voorgegaan.
Tegen zulke taal schijnt niet veel in te brengen. Neen,
waarlijk, het is zoo: als een mensch eigen zin en lust
buigt naar hetgeen hij als Goddelijk, als goed, als heilig
en volmaakt, heeft leeren kennen, en hij getroost zich
gaarne het verlies of het lijden, dat hij zich ten gevolge
dier zelfverloochening op den hals haalt, dan is hij een
echt discipel van den gekruisigde. Niets meer is er noo-
dig, niets anders dan die eenswillendheid, dan die ge-
hoorzaamheid en die berusting. Máár, – bedriegt mij
niet alles, dan wordt er vaak van ons een eenswillend-
heid met den Vader verlangd, die volstrekt geen recht heeft
op haar naam, dan predikt men ons inzonderheid niet zelden, als
christelijk, een berusting in Gods wil, wier verheven-
heid terecht in twijfel mag worden getrokken.

Dit doet Google Lens met het begin van preek 321 (met dank aan Ben Eppenhof) [regeleindes aanhouden is hier ondoenlijk]:

Hand. 21:10-14.

MIJ. DER NED LETTERKUNDE TE LEIDEN

Berusting in Gods wil. Liekner cen my men ons rusting en der dagelijks, in hoofel eischen, die noom van het Christendom, boek. De en gehorcinamheid, mit die twee, sest men, bertank het Christelijke leven. Dae wat God u gebiedt, en onder. nan mak God over cenowillend met den Vader; beschikk dan toonk ge w en & censwillendheid met God, dat is immers alles, wearin Tegen aulhe taul schijnt ono is voorgeguan. brengen. Neen, niet veel in te brengen. wonrlich, het is 200: als een mensch eig eigen din en buigt en lust naar hetgeen by uls Godailigh, als goed, als heilig volmaakt, gaarne huft het verlies leeren kennen, en hiy of in selfverlovchining op dier hek Cyclen, dak den hy getroost ach dich ten ten gevolge hals hault, dan is echt discipel van den gebruisigede. Niets Dig nieks meer is es noo anders dan die unsrillendheid, dan die ge berusting. Maur, bedingt mi hoorsaamheid en die berusting niet alles, dan wordt. heid met den Vader. er rank van ons my een cenowillend. go die svestrekt geen echt heeft verlango, insonderheid op haar naam, dan prisikt men ons, nick selden, als christelijk, een bemsting cen besting in Gunugtil, heid terecht me mag worden wierd de verheven wil, woawando

Dit doet ChatGPT met het begin van preek 321 (met dank aan Nicoline van der Sijs) [voor het gemak bij vergelijking zijn de regeleindes aangehouden]:

“Maand 21-10-14

Berusting in Gods wil. Lieden een der hoofddeugden, die
men ons dagelijks, in naam van het Christendom, voorh. De
rusting en gehoorzaamheid uit die twee zegt men, bestaat
het Christelijk leven. Dat wat God u gebiedt, en waar
roept u aan wat God over u beschikt, dan toont ge u
eenswillend met den Vader; en de eenswillendheid met
God, dat is immers alles, waarin Jezus ons is voorgegaan.
Tegen zulke taal schijnt niet veel in te brengen? Neen,
waarlijk, het is zoo: als een mensch eigen zin en lust
buigt naar hetgeen hij als Goddelijk, als goed, als heilig
en volmaakt heeft leeren kennen, en hij getroost zich
gaarne het verlies of het lijden, dat hij zich ten gevolge
dier zelfverloochening op den hals haalt, dan is hij een
echt discipel van den gekruisigde. Niets meer is er voor
dij, niets worder dan die eenswillendheid, dan die ge
hoorzaamheid en die berusting. Maar, bedriegt mij
niet allen, daar wordt er vaak van ons een eenswillend
heid met den Vader verlangd, die volstrekt geen recht heeft
op haar naam; dan spreekt men van niet lijden, als
Christelijk, een berusting in Gods wil, waar niets dan
onverschilligheid misschien schuilgaat.”

Dit doet Transkribus Dutch Demeter met Preek 321 (met dank aan Annemieke Romein)

Hand. 21: 10 – 14.

Berusting in Gods wil. Liedaar een der hoofdeischen, die
men ons dagelijks, in naam van het Christendom, doet. Be„
rusting en gehoorzaamheid, uit die twee, zegt men, bestaak
het Christelijke leven. Doe wat God is gebiedt, en onder¬
werp u aan wat God over u beschikt, dan toont ge in
eenswillend met den Vader; en en eens willendheid met
God, dat is immers alles, waarin Jezus ons is voorgegaan.
Tegen zulke taal schijnt niet veel in te brengen. Neen,
waarlijk, het is zoo: als een mensch eigen zin en lust
buigt naar het geen hij als Goddelijk als goed, als heilig
en volmaakt, heeft leeren kennen, en hij getroost zich
gaarne het verlies of het lijden, dat hij zich ten gevolge
dier zelfverloochening op den hals haalt, dan is hij een
echt discipel van den gekruisigde Niets meer is er noo„
dig, niets anders dan die eenswillendheid, dan die ge„
hoorzaamheid en die berusting. Maar, – bedriegt mij
niet alles, dan wordt er vaak van ons een eenswillend.
heid met den vader verlangd, die volstrekt geen recht heeft
inzonderheid
op haar naam, dan predikt men ons niet zelden, als
weer
christelijk, een berusting in Gods wil, verheven„
getrokken
in twijfel
heid terecht mag worden

Dit doet Transkribus Dutch Dean met het begin van preek 321 (met dank aan Joost Oosterhuis):

Conclusie:

De resultaten met Google Lens zijn onbruikbaar. ChatGPT is beter, maar geeft toch nog te veel fouten om in te zetten. De twee versies van Transkribus ontlopen elkaar niet veel en komen aardig in de goede richting, maar beide resultaten moeten echt nog met het manuscript erbij handmatig gecorrigeerd worden.

Geen van de versies kan omgaan met de onderstrepingen in het manuscript, die HaverSchmidt aanbracht voor de voordracht van de preek. Alle vier de versies weten zich geen raad met de toevoegingen en de doorstrepingen in de laatste drie regels. En die zijn in vergelijking met andere preken vrij eenvoudig…

Nu dan toch een positieve noot. Transkribus is in ontwikkeling en zou na training zeker in staat zijn de preken van HaverSchmidt aan te leveren als digitaal Wordbestand. Maar handmatige correctie met het handschriftbeeld erbij blijft noodzakelijk. En dan is het maar de vraag wat sneller gaat… En welk werk leuker is: zelf puzzelen of machinegepuzzel corrigeren…

Delen:

  • Klik om af te drukken (Wordt in een nieuw venster geopend) Print
  • Klik om dit te e-mailen naar een vriend (Wordt in een nieuw venster geopend) E-mail
  • Klik om te delen op Facebook (Wordt in een nieuw venster geopend) Facebook
  • Klik om te delen op WhatsApp (Wordt in een nieuw venster geopend) WhatsApp
  • Klik om te delen op Telegram (Wordt in een nieuw venster geopend) Telegram
  • Klik om op LinkedIn te delen (Wordt in een nieuw venster geopend) LinkedIn

Vind ik leuk:

Vind-ik-leuk Aan het laden...

Gerelateerd

Categorie: Artikel Tags: editie, kunstmatige intelligentie

Lees Interacties

Reacties

  1. Harrie Baken zegt

    26 mei 2025 om 12:22

    En… aan te leveren als digitaal *Writer-bestand* zou nog positiever zijn!
    (want: Public Money, Public Code)

    Beantwoorden
  2. Marc van Oostendorp zegt

    26 mei 2025 om 12:49

    Dit is het resultaat als je de transcriptieopdracht geeft aan Gemini 2.5 PRO van Google. (Ook de opmerkingen eronder komen van Gemini.)

    Nand. 21: 10-14.
    Berusting in Gods wil. Inderdaad een der hoofdeischen, die
    men ons dagelijks, in naam van het Christendom, doet. Be-
    rusting en gehoorzaamheid, uit die twee, zegt men, bestaat
    het Christelijke leven. Doe wat God u gebiedt, en onder-
    werp u aan wat God over u beschikt, dan toont gij u
    eenswillend met den Vader; en de eenswillendheid met
    God, dat is immers alles, waarin Jezus ons is voorgegaan.
    Tegen zulke taal schijnt niet veel in te brengen. Neen,
    waarlijk, het is zoo: als een mensch eigen zin en lust
    buigt naar hetgeen hij als Goddelijk, als goed, als heilig
    en volmaakt, heeft leeren kennen, en hij getroost zich
    gaarne het verlies of het lijden, dat hij zich ten gevolge
    dier zelfverloochening op den hals haalt, dan is hij een
    echt discipel van den gekruisigde. Niets meer is er noo-
    dig, niets anders dan die eenswillendheid, dan die ge-
    hoorzaamheid en die berusting. Máár – bedriegt mij
    niet alles, dan wordt er vaak van ons een eenswillend-
    heid met den Vader verlangd, die volstrekt geen echt besef ^{inwendigheid}
    op haar naam, dan predikt men ons niet zelden, als
    christelijk, een berusting in Gods wil, waarvan ^{wier} de verheven-
    heid terecht ^{in twijfel} mag worden ^{getrokken} betwijfeld.

    Opmerkingen:
    De tekst is 19e-eeuws Nederlands, met spelling en woordkeuze die daar bij passen (bv. “eischen”, “gij”, “predikt”).
    Woorden die aan het einde van een regel afgebroken zijn, heb ik met een koppelteken aangegeven en op de volgende regel voortgezet (bv. “Be-rusting”).
    Bovengeschreven woorden (interlineaire toevoegingen/correcties door de schrijver) heb ik aangegeven met ^{…}.
    Op regel 19: besef met daarboven ^{inwendigheid}.
    Op regel 21: waarvan met daarboven ^{wier}.
    Op regel 22: terecht met daarboven ^{in twijfel} en mag worden met daarboven ^{getrokken}.
    De referentie “Nand. 21: 10-14.” bovenaan is wat ongebruikelijk. “Hand.” zou staan voor Handelingen, maar “Nand.” is niet standaard. Het kan een persoonlijke afkorting zijn.
    De stempel rechtsboven luidt: “MIJ. DER NED. LETTERKUNDE TE LEIDEN” (Maatschappij der Nederlandse Letterkunde te Leiden).

    Beantwoorden
    • Harrie Baken zegt

      27 mei 2025 om 00:47

      Wat betreft Nand. voor Hand. lijkt me dat computer Gemini gewoon een fout maakt.
      1. De N van ‘Neen’ is een heel andere N.
      2. ‘Nand’ kan een computerterm zijn: Merriam-Webster. (n.d.). NAND. In Merriam-Webster.com dictionary. Retrieved May 26, 2025, from https://www.merriam-webster.com/dictionary/NAND

      Beantwoorden
      • Harrie Baken zegt

        27 mei 2025 om 14:34

        Juist. 🙂

        Bovendien gaat de tekst hier over gehoorzaamheid aan de Heer, oftewel het onderwerp van Handelingen 21: 10-14.

        Beantwoorden
  3. Henri Brandenburg zegt

    27 mei 2025 om 11:24

    Als je Transkribus traint met die 44 met de hand gecorrigeerde teksten en daar een Haverschmidt-model mee maakt, zal de rest vrijwel foutloos getranscribeerd worden.

    Beantwoorden
    • Nicoline van der Sijs zegt

      27 mei 2025 om 12:49

      helaas klopt dat niet, zelfs niet voor gedrukte kranten, en zeker niet voor handgeschreven tekst met vele correcties en doorhalingen etc., zie ook https://neerlandistiek.nl/2025/05/de-rol-van-de-mens-bij-kunstmatig-intelligent-machinelezen/

      Beantwoorden

Laat een reactie achterReactie annuleren

Deze site gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie gegevens worden verwerkt.

Primaire Sidebar

Gedicht van de dag

Gerrit Achterberg • Noordeinde

Ik loop in doodvacantie door den Haag.
Het uitgestalde wordt mijn eigendom.
De dorst naar u slaat op de wereld om
zonder dat ik de dingen overvraag.

➔ Lees meer

Bekijk alle gedichten

  • Facebook
  • YouTube

Chris van Geel

BIJEN

Als ik mij buk naar takken die ik raap,
naar honing die de grond van bloemen is,
ik die de tuin inloop, schrikken zij niet.

Verknocht als zij aan wat ze doen, verdiep
ik mij in wat ik breek, verzet hun zoemen
van bloem naar bloemen op begane grond.

Bron: Vluchtige Verhuizing, postuum verschenen, 1975

➔ Bekijk hier alle citaten

Agenda

26-29 juni: Dichters in de Prinsentuin 2025

26-29 juni: Dichters in de Prinsentuin 2025

18 juni 2025

➔ Lees meer
Een rijk leven: afscheidsrede Johan Koppenol, VU Amsterdam

Een rijk leven: afscheidsrede Johan Koppenol, VU Amsterdam

17 juni 2025

➔ Lees meer
3 juli 2025: afscheidssymposium Johan Koppenol

3 juli 2025: afscheidssymposium Johan Koppenol

17 juni 2025

➔ Lees meer
➔ Bekijk alle agendapunten

Neerlandici vandaag

Geen neerlandici geboren of gestorven

➔ Neerlandicikalender

Media

Het culturele landschap van Frits van Oostrom

Het culturele landschap van Frits van Oostrom

19 juni 2025 Door Redactie Neerlandistiek Reageer

➔ Lees meer
De internationale positie van het Engels

De internationale positie van het Engels

14 juni 2025 Door Marc van Oostendorp Reageer

➔ Lees meer
Inspiratiesessies in het Universitair Museum Utrecht

Inspiratiesessies in het Universitair Museum Utrecht

11 juni 2025 Door Redactie Neerlandistiek Reageer

➔ Lees meer
➔ Bekijk alle video’s en podcasts

Footer

Elektronisch tijdschrift voor de Nederlandse taal en cultuur sinds 1992.

ISSN 0929-6514
Bijdragen zijn welkom op
redactie@neerlandistiek.nl
  • Homepage
  • E-books
  • Neerlandistische weblogs
  • Over Neerlandistiek
  • De archieven
  • Contact
  • Facebook
  • YouTube

Inschrijven voor de Dagpost

Controleer je inbox of spammap om je abonnement te bevestigen.

Copyright © 2025 · Magazine Pro on Genesis Framework · WordPress · Log in

  • Homepage
  • Categorie
    • Voor de klas
    • Vertelcultuur
    • Naamkunde
  • Archief
    • 10 jaar taalcanon
    • 100 jaar Willem Frederik Hermans
  • E-books
  • Neerlandistische weblogs
  • Jong Neerlandistiek
  • Frisistyk
  • Mondiaal Neerlandistiek
  • Over Neerlandistiek
  • Contact
 

Reacties laden....
 

    %d