Door Helge Bonset
Het ideale examen Nederlands bestaat niet. Dat heeft éen hoofdreden: het conflict tussen validiteit en betrouwbaarheid, twee eisen die aan selectieve toetsen en examens gesteld moeten worden.
De eis van validiteit houdt in dat een toets de kennis of vaardigheid meet die gemeten moet worden, en niet een reductie daarvan, of iets heel anders.
De eis van betrouwbaarheid (in de betekenis van beoordelaarsovereenstemming) houdt in dat een toets zodanig meet dat verschillen in scores toe te schrijven zijn aan objectieve verschillen in kennis of vaardigheid, en niet aan subjectieve verschillen tussen beoordelaars. Bij de toetsing van taalvaardigheid, naast literaire competentie de hoofdmoot van het examen Nederlands, is het helaas zo dat vormen van beoordeling die een hoge betrouwbaarheid garanderen, tegelijk de validiteit verlagen, en vormen die een hoge validiteit garanderen hetzelfde doen met de betrouwbaarheid (Rijlaarsdam & Wesdorp, 1984, p. 20).
Een voorbeeld. De validiteit van de toetsvorm tekst-met-vragen zou verhoogd worden door alleen open vragen te stellen en alle goed onderbouwde antwoorden op die vragen goed te rekenen. Van een betrouwbare meting is dan echter geen sprake meer, want subjectieve verschillen tussen beoordelaars zullen in het beoordelingsproces de hoofdrol gaan spelen. De betrouwbaarheid van de toetsvorm tekst-met-vragen zou verhoogd worden door alle vragen in meerkeuzevorm te stellen en op het niveau van de betekenis van woorden, zinnen en alinea’s. Er is dan echter van validiteit geen sprake meer: niet de vaardigheid in het begrijpend lezen van een tekst wordt gemeten, maar een reductie daarvan.
Het hier beschreven dilemma leidt onvermijdelijk tot schipperen, polderen en inleveren rondom het examen Nederlands. Het ideale examen komt er nooit, maar we kunnen wel streven naar het optimale. Daarover nu verder.
Centraal examen en schoolexamen
Het examen Nederlands bestaat, evenals andere examens, uit een centraal examen (c.e.) en een schoolexamen (s.e.). Het c. e. toetst wat voor alle leerlingen van belang wordt geacht, op een landelijk voorgeschreven wijze Het s.e. biedt de ruimte voor het toetsen van schooleigen doelstellingen op een wijze die de school verkiest, maar vastgelegd is welke domeinen in het s.e. minstens aan de orde moeten komen.
Het examen in zijn geheel vertoont daarmee een gelukkig evenwicht tussen centrale sturing en ruimte voor scholen. Ook verzacht het bestaan van het s.e. de spanning tussen validiteit en betrouwbaarheid, omdat aan de in het s.e. getoetste domeinen minder zware (want geen landelijke centrale) betrouwbaarheidseisen gesteld hoeven te worden.
Op dit moment bestaat bij Nederlands het c.e. alleen uit leesvaardigheid inclusief argumentatieve vaardigheden. Alle andere domeinen van het schoolvak (literatuur, mondelinge taalvaardigheid, schrijfvaardigheid) maken deel uit van het s.e. Niettemin telt het c.e.-cijfer voor 50% mee in het totale eindexamencijfer. Dat geeft leesvaardigheid te veel gewicht en de overige domeinen te weinig. Het doet ook geen recht aan het belang van de tweede component van geletterdheid: schrijfvaardigheid.
In mijn optimale examen Nederlands maakt schrijfvaardigheid weer deel uit van het c.e., waardoor het c.e. ook beter de domeinen en doelstellingen van het vak Nederlands dekt.
Leesvaardigheid in het centraal examen
Op het centraal examen leesvaardigheid is veel kritiek. Ten onrechte. Natuurlijk beantwoorden mensen in het dagelijks leven geen vragen over een tekst als ze die gelezen hebben. Maar in een toetssituatie zijn die vragen nodig als ‘blijkgevende grootheid’: ze maken het de beoordelaar mogelijk om na te gaan of de leerling de tekst heeft begrepen op het niveau van de doelstellingen van het leesonderwijs. Natuurlijk zou het mooi zijn als leerlingen beloond konden worden voor originele antwoorden die onjuist zijn volgens het correctiemodel, mits die goed zijn onderbouwd. Maar dat het dan niet meer mogelijk is aan betrouwbaarheidseisen te voldoen, heb ik hierboven uitgelegd.
Het centraal examen wordt vaak weggezet als toepassen van ‘trucjes’. Weer ten onrechte. De eindtermen bevatten belangrijke leesvaardigheden: analyseren en interpreteren, beoordelen en samenvatten. Dat de toetsvragen daar ook daadwerkelijk op mikken, is voor iedere niet bevooroordeelde beschouwer zichtbaar. Dat leerlingen geneigd zijn tot een reductionistische strategie (vragen lezen en meteen antwoorden zoeken in de tekst, in plaats van eerst de hele tekst lezen en dan de vragen beantwoorden) of die strategie misschien zelfs van hun docent aangereikt hebben gekregen, doet hieraan niets af: de beoogde en (al dan niet) gedemonstreerde leesvaardigheid blijft dezelfde.
De vragen bij de teksten zijn een mix van open vragen met correctievoorschrift, en gesloten meerkeuzevragen. Ook dit is een voorbeeld van schipperen tussen validiteit en betrouwbaarheid, en naar mijn mening het best haalbare.
Dan de teksten. Het examen toetst of de leerling in staat is teksten te lezen op het niveau van een kwaliteitskrant of –tijdschrift, over onderwerpen van algemeen maatschappelijke aard. Dat is een keuze die aansluit bij het algemeen vormend karakter van ons voortgezet onderwijs en garandeert dat er geen grote verschillen zijn in voorkennis tussen de leerlingen over het onderwerp van de tekst. Wanneer gekozen zou worden voor bijvoorbeeld teksten over taal-of letterkundige onderwerpen, zou dit betekenen dat kennis daaromtrent voorafgaand landelijk verstrekt en verplicht behandeld zou moeten worden. Dat zou een ongewenste inperking van de vrijheid van onderwijs en van docenten Nederlands betekenen.
De samenvattingsopdracht is een aantal jaren geleden uit het c.e. Nederlands verwijderd, om de betrouwbaarheid van het c.e. te verhogen (betrouwbaarheid hier in de betekenis van interne consistentie). Die betrouwbaarheidswinst blijkt inderdaad geboekt. Maar hoewel ik zelf aan de operatie heb meegewerkt, maakt van mijn optimale c.e. de samenvatting toch weer deel uit: ze toetste op valide wijze een belangrijke vaardigheid en droeg bij aan een gevarieerder c.e. dan het huidige.
Schrijfvaardigheid in het centraal examen
In het vorige decennium is een pilot uitgevoerd door o.a. CvTE, Cito en SLO naar de mogelijkheid schrijfvaardigheid weer op te nemen in het c.e. Deze is gestaakt omdat de problemen onoplosbaar leken.
Die waren niet gelegen in de schrijfopdracht. Er werd geëxperimenteerd met opdrachten waarbij leerlingen op grond van aangereikte bronnen een uiteenzetting, beschouwing of betoog moesten schrijven. Wij noemden dit ‘gedocumenteerd schrijven’; het zou nu aangeduid kunnen worden als het schrijven van een ‘synthesetekst’. Deze opdrachten werden door de deelnemende docenten positief gewaardeerd, ook degenen die minder geporteerd waren voor verplaatsing van schrijfvaardigheid van s.e. naar c.e.
De problemen lagen in de beoordeling. Als ergens het conflict tussen validiteit en betrouwbaarheid opspeelt, is het wel bij de beoordeling van schrijfvaardigheid. Een schrijfvaardigheidstoets waarbij leerlingen alleen woorden hoeven in te vullen, of zinnen moeten beoordelen en verbeteren, of gebreken in de opbouw van een tekst aanwijzen, heeft een hoge betrouwbaarheid. Maar inhoudsvalide is ze niet, alleen al omdat de leerling niet zelf schrijft.
Een gedocumenteerde tekst als schrijfvaardigheidstoets heeft een hoge inhoudsvaliditeit. Maar hoe kan zo’n tekst betrouwbaar beoordeeld worden in de context van een landelijk eindexamen? Het bleek in diverse experimenten binnen de pilot niet mogelijk een voldoende betrouwbare beoordeling te verkrijgen, noch via globaal beoordelen, noch via analytisch beoordelen, noch via schaalbeoordeling.
Intussen is een nieuwe manier van beoordelen op het toneel verschenen: paarsgewijze vergelijking. Deze methode combineert een holistische en een vergelijkende aanpak: beoordelaars vergelijken telkens globaal twee teksten en geven aan welke de beste is. Nadat de beoordelaar een keuze heeft gemaakt, biedt de computer een nieuw paar aan om te vergelijken. Verschillende beoordelaars nemen deel aan het beoordelingsproces en elke beoordelaar maakt verschillende vergelijkingen na elkaar. Op basis van alle vergelijkingen wordt een schaal opgesteld van de teksten, gerangschikt van lagere tot hogere tekstkwaliteit.
Onderzoek heeft laten zien dat de scores zowel betrouwbaar als valide zijn (Lesterhuis, 2018). Dankzij het instrument D-PAC is deze beoordelingsprocedure zeer eenvoudig. Wel kost ze natuurlijk tijd en zijn er meerdere beoordelaars nodig.
In mijn optimale centraal examen Nederlands schrijven de leerlingen (in een tweede zitting) syntheseteksten, die beoordeeld worden via D-PAC. Een utopie misschien. Maar ik zou blij zijn als in een nieuwe pilot de mogelijkheden hiertoe werden onderzocht.
Het schoolexamen
Binnen het schoolexamen zijn er vele keuzemogelijkheden voor toetsing van domeinen. Sommige zijn beter dan andere als het gaat om validiteit en betrouwbaarheid. Keuze-adviezen worden gegeven in de Handreiking Schoolexamen Nederlands van SLO (Meestringa, Ravesloot & Bonset, 2012). Hier beperk ik me tot een paar belangrijke algemene zaken die zouden moeten veranderen.
- In mijn optimale examen Nederlands is het niet meer toegestaan dat domeinen uit het c.e. ook getoetst worden in het s.e. Dit geeft deze domeinen te veel gewicht in het eindcijfer.
- Het s.e. krijgt een vrije ruimte van niet meer dan 10%. Hiermee zal taalkunde, of elk ander keuzedomein, het moeten doen, zodat voldoende aandacht gegarandeerd is voor de verplichte domeinen.
- Er komt een landelijk voorgeschreven weging van de domeinen in het eindcijfer van het s.e.; de verschillen in weging van de domeinen tussen scholen zijn nu veel te groot. Mijn voorkeur (zolang schrijfvaardigheid in het s.e. blijft): literatuur 30%, mondelinge taalvaardigheid 25%, schrijfvaardigheid 35%, keuzedomein 10%.
Literatuur
Gert Rijlaarsdam & Hildo Wesdorp (1984). Het beoordelen van taalvaardigheid in het onderwijs. Amsterdam: SCO.
Marije Lesterhuis (2018). The validity of comparative judgement for assessing text quality. An assessor’s perspective. Antwerpen: Universiteit Antwerpen (dissertatie).
Theun Meestringa, Clary Ravesloot & Helge Bonset (2012). Handreiking schoolexamen Nederlands havo/vwo. Herziening naar aanleiding van het referentiekader taal. Enschede: SLO. (Downloadbaar via www.slo.nl).
Met dank aan Alex van de Kerkhof voor zijn verhelderend commentaar.
Melchior Vesters zegt
Dit is een interessant stuk. Hierbij wat gedachten.
1. Het ‘dilemma’ tussen validiteit en betrouwbaarheid bestaat bij ’taalvaardigheid’. Wordt hier beweerd dat het bij ‘literaire competentie’ niet bestaat? Wat wordt eigenlijk onder beide termen verstaan? Ik heb het idee dat hier snel voorbij wordt gegaan aan een onderliggende discussie over wat wel/geen ’taalvaardigheid’ is. Persoonlijk denk ik dat er geen harde scheiding te maken is – in alle vakdomeinen – tussen kennis en vaardigheid. Als dus alle domeinen taalvaardigheid zijn, dan bestaat altijd het genoemde dilemma. Dit brengt mij op het volgende punt.
2. In hoeverre hebben we eigenlijk te maken met een dilemma? Zie ook mijn reactie bij het stukje van Kuijpers, die pleit voor een ‘subjectief’ examen. De keuze tussen objectiviteit en subjectiviteit is misschien een vals dilemma, omdat intersubjectiviteit als derde optie wordt vergeten. Ik denk dat vakdomeinen met ‘subjectieve’ toetsvragen in toenemende mate intersubjectief kunnen worden gemaakt en dus niet subjectief hoeven te blijven. Wat voor sommige domeinen gold in 1984 (Rijlaarsdam/Wesdorp), hoeft nu niet meer het geval te zijn. Simpel gezegd: hoe meer we ergens over nadenken, des te gestructureerder – minder puur subjectief – wordt het domein. Ik denk dat dat voor álle domeinen geldt.
Leesvaardigheid is een prima voorbeeld: toen Braet z’n lesmateriaal over tekststructuren maakte, was dat een vernieuwing. Nu, decennia verder, is technische leesvaardigheid als domein zodanig gestructureerd gemaakt dat het de heilige graal van het centraal examen is geworden. Maar in theorie zou je, na genoeg pilots, hetzelfde kunnen bereiken voor schrijfvaardigheid, literatuur, enzovoort. Daar moeten we dan ook naar streven. Ik vind dat je niet kunt volstaan met zeggen dat sommige (taalvaardigheids)domeinen nu eenmaal naar hun aard subjectieve verschillen bij beoordelaars bevatten. Preciezer: ja, dat is inderdaad het geval. Maar dat geldt voor álle domeinen (niet voor niets is er altijd discussie over vragen op het CE leesvaardigheid). Mijn punt is dat eveneens voor alle domeinen meer intersubjectiviteit de oplossing is. Ik vraag me dan ook af of het type pilot van D-PAC zinvol is; dit zal ik toelichten.
3. Welk probleem lost D-PAC nu eigenlijk op? Als ik het goed begrijp (maar corrigeer me vooral, ik heb dat type beoordeling maar één keer gedaan), dan levert de methode alleen een statistisch valide *onderlinge* rangschikking van teksten op. Over het inhoudelijke niveau weet je dan eigenlijk nog niets. Je zult moeten aannemen dat het gemiddelde niveau – bijvoorbeeld – een 6 is, om aan de hand van een statistische verdeling teksten rondom die 6 te groeperen. Hieraan zitten twee problemen. Ten eerste vind ik het richting leerlingen niet uit te leggen dat zij geen concrete feedback krijgen; een leerling koopt niets voor de statistische validiteit van D-PAC, die wil gewoon weten waar z’n schrijffouten zaten. En die fouten hoor je vast te stellen als beoordelaar. Zit je dan weer met het probleem van subjectiviteit? Niet noodzakelijk… mits het te beoordelen domein voldoende intersubjectief is gemaakt.
Hier zit het tweede probleem: D-PAC leidt niet tot intersubjectiviteit, het tracht alleen de subjectiviteit van de beoordelaar te omzeilen door het subjectieve oordeel onzichtbaar te maken. Maar dit is is geen oplossing. Paarsgewijze vergelijking voelt voor mij als bedrog. Feedback geven bij schrijfonderwijs kost nu eenmaal veel tijd (en dus geld, en is ‘dus’ niet uitvoerbaar in het CE). Zo’n ten diepste pragmatische argument – we verlaten hier het ons door Bonset voorgespiegelde ‘dilemma’ – ligt ook achter andere van zijn opmerkingen.
4. Een krasse opmerking betreft de onwenselijkheid om teksten over taal- of letterkundige onderwerpen in het CE op te nemen, omdat dit vereist dat leerlingen eerst kennis over het onderwerp aangeleerd moeten krijgen. Bonset noemt dit een ‘ongewenste inperking van de vrijheid van onderwijs en van docenten Nederlands’, maar ik geloof niet dat de vrijheid van docenten voor hem zo’n principieel punt is. Veeleer lijkt mij zijn bezwaar pragmatisch. Ten eerste is de discussie over wat die verplichte stof dan wel is een gebed zonder eind (letterlijk; dat heeft helaas wel iets met het levensbeschouwelijk onderwijs te maken). Ten tweede is het lastig uitvoerbaar om te garanderen dat alle docenten landsbreed dezelfde stof onderwijzen op een groot aantal vakonderdelen. (Overigens zijn hier best oplossingen denkbaar: je kunt bijv. vakonderdelen gewoon per jaar laten roteren. Voor mijn eindexamen Latijn deed ik Vergilius + Ovidius, de klas na mij deed Caesar. Zoiets kun je ook voor Nederlands doen: een lichting weet welke onderdelen zij krijgen, een docent weet waarover de inhoudelijk neerlandistische teksten op het CE kunnen gaan en dus welke kennis moet worden onderwezen.)
Kortom: volgens mij gaat het Bonset om praktische bezwaren.
5. Als we het over de praktijk hebben: Bonset wil niet dat CE-onderdelen op het SE worden getoetst. Maar hoe roei je dit bekende praktijkprobleem uit: de schoolleiding wil schermen met slagingspercentages en zet de vaksectie onder druk; om op safe te spelen, komt er toch CE-stof in het SE. Bonset biedt geen oplossing. Een echte oplossing zou zijn om een veelzijdig CE te hebben (met schrijven en literatuur), zodat scholen niet meer kunnen ‘duiken’ op die onderdelen. Dit brengt mij op mijn laatste punt.
6. Bonset stelt voor om het SE-deel dicht te timmeren: “literatuur 30% (dus 15% van het totaalcijfer, ervan uitgaande dat CE-SE 50/50 blijft en literatuur, als een te ‘subjectief’ toetsdomein, niet in het CE komt – MV), mondelinge taalvaardigheid 25%, schrijfvaardigheid 35%, keuzedomein 10%.” Over een “ongewenste inperking van de vrijheid van docenten Nederlands” gesproken! Zijn oplossing is typisch voor een (oud-)beleidsmaker: men wil sturen, controleren, waarborgen, garanderen. Ongetwijfeld komt dit voort uit goede bedoelingen: alle einddoelen moeten gehaald worden, in het belang van de leerling. Maar percentages zijn betekenisloos: het gaat om de inhoud – en inhoud aan brengen kost tijd. Naar mijn mening kan geen enkele discussie over het ideale eindexamen – die over de verschillende vakdomeinen gaat – zónder een discussie over het aantal SLU dat nodig is om al die domeinen te behandelen. De 400/480 SLU in de bovenbouw zijn eenvoudigweg veel te weinig om alle domeinen te behandelen met een diepgang die tot het ideale inhoudelijke NIVEAU leidt. (Maar dat is een subjectieve discussie, hoor ik u zeggen? Laten we haar intersubjectief maken!)
Het ideale examen – qua eindniveau; het gaat mij dus niet om dat flauwe toetsdilemma – is niet één momentopname, maar het sluitstuk van jarenlange opbouw van vakkennis en vaardigheid. Ik vind het tekenend dat iemand die een prominente beleidsmaker is geweest, in zijn tekst over het ideale examen Nederlands eindigt met percentages, maar over concrete neerlandistische inhoud eigenlijk alleen zegt dat het “onwenselijk” is als die in CE-teksten staat.
Het ideale examen bestaat niet voor Bonset, omdat hij geen idealen meer heeft van waaruit het ideale examen gedroomd kan worden.
Helge Bonset zegt
Hierbij een korte puntsgewijze reactie.
1. Het dilemma is onderzocht en in kaart gebracht voor taalvaardigheid, niet voor literaire competentie. Bovendien maakt literatuur geen deel uit van het c.e en speelt het dilemma daarbij dus geen, of in ieder geval niet dezelfde rol. Ik deel trouwens je mening dat literaire competentie niet alleen een kwestie is van kennis, maar ook van vaardigheid; zie de eindtermen.
2. In de praktijk wordt leesvaardigheid nu intersubjectief beoordeeld (twee beoordelaars) wat de open vragen betreft. Bij schijfvaardigheid is intersubjectiviteit inderdaad de oplossing, in de vorm van een aantal onafhankelijke beoordelaars. Maar deze oplossing geeft nieuwe problemen, zoals de hoeveelheid beoordelaars die nodig is voor een betrouwbare beoordeling, een goed beoordelingsvoorschrift, organisatie van een en ander enz.
3. D-PAC is voor mij helemaal geen uitgemaakte zaak als het gaat om het c.e., begrijp me goed. Dat leerlingen geen feedback krijgen vind ik een argument dat alleen geldig is in de lespraktijk, want na een c.e. krijgen ze die nooit. Je tweede probleem begrijp ik niet echt: SD-PAC is toch duidelijk intersubjectief? Wat je zegt over pragmatisme begrijp ik weer wel: ik zou inderdaad de mogelijkheden van D-PAC willen onderzoeken juist omdat het wellicht uitvoerbaar is in het kader van een c.e. en daardoor schrijfvaardigheid in het c.e. kan terugbrengen.
4. Mijn bezwaar is drieërlei. Ten eerste de door jou genoemde pragmatische argumenten, die ik geheel onderschrijf. Ten tweede constateer ik dat verplichte onderwerpen een ingreep betekenen in de vrijheid van het ‘wat’ van het onderwijs. Maar terecht merk je op dat die bij andere vakken ook voorkomt. Mijn derde punt heb ik niet genoemd in mijn bijdrage, jammer achteraf. Een leesvaardigheidsexamen over tevoren behandelde onderwerpen is geen examen leesvaardigheid, maar een kennistoets over die onderwerpen. Er zit ook een vreemde opvatting achter over leesvaardigheid, die ik ook in de FB-groep tegenkom, dat leesvaardigheid uitsluitend een kwestie is van voorkennis en woordenschat, en dat leerlingen daarom voorkennis moeten krijgen als ze een examentekst lezen. Nee, het leesonderwijs is er nu juist op gericht dat leerlingen ook teksten leren lezen over onderwerpen waar ze nog geen kennis van hebben (waardoor ze hun woordenschat vergroten, en passant), doordat ze leren hoe ze zulke teksten moeten aanpakken: woorden opzoeken of uit de context opmaken, structuur van alinea’s en van de hele tekst doorgronden, genre tekst bepalen, leesdoel helder hebben, leesproces bij zichzelf monitoren. In iedere serieuze review kom je al deze elementen tegen.
5. Deze druk van de schoolleiding speelde in de tijd dat de inspectie als indicator had dat er slechts 0,5 punt verschil mocht zijn tussen c.e en s.e. Die indicator wordt al jaren niet meer toegepast. Waarom de ‘echte’ oplossing een oplossing zou zijn, leg je niet uit.
6. Ik ben voor een vaste weging, maar die hoeft er niet per se zo uit te zien als degene die mijn voorkeur heeft.
Het ‘flauwe’ dilemma tussen betrouwbaarheid en validiteit: wie dit dilemma en de problemen die het meebrengt niet doorziet en serieus neemt, ontbreekt het aan wezenlijk inzicht in examinering, en dus ook in het c.e. Nederlands. Ik heb duidelijk gemaakt in mijn stuk dat ik inderdaad geen behoefte heb te dromen over het examen Nederlands, ondanks dat de vraagstelling daartoe natuurlijk verleidde.
Melchior Vesters zegt
Bedankt voor het antwoord.
Bij punt 5: mijn schoolleiding hanteerde vorig jaar die verschillen tussen SE en CE nog wel degelijk, bovendien heb ik van een schoolleider gehoord dat de inspectie nog wel een béétje naar deze cijfers kijkt (hoewel dat bij NL natuurlijk onzinnig is, omdat SE- en CE-stof van elkaar verschillen). Kortom: je implicatie is onjuist dat er geen druk meer van schoolleidingen uitgaat op secties. Zolang scholen zich willen profileren met hoge slagingspercentages, zal die druk er zijn. Het is naïef om te menen dat het niet zo is. Om deze reden worden in de praktijk domeinen als schrijven en literatuur (die allebei veel tijd kosten om het goed te doen) beknot ten faveure van extra training van leesvaardigheid.
Ik gaf wel wat uitleg in mijn eerste post, maar ik zal het toelichten. Met ‘duiken’ op onderdelen bedoelde ik dat momenteel onzichtbaar is dat bepaalde domeinen die alleen in het SE worden getoetst op een te laag niveau worden afgesloten – mede omdat er in het SE-deel tijd wordt besteed aan het CE-leesvaardigheid. Gegeven deze situatie is een veelzijdig CE een oplossing: het maakt het voor scholen onmogelijk om zwakke vakdomeinen te verbergen, dus moeten ze er meer tijd aan besteden dan momenteel gebeurt.
Bij het slot, het ‘dilemma’: ik neem dat wel degelijk serieus, maar heb kritiek op de weergave ervan, namelijk alsof het een statische situatie betreft. De toetsing van bepaalde domeinen dreigt subjectief te blijven zolang er niet meer studie naar wordt gemaakt, die het domein beter structureert en daardoor intersubjectieve beoordeling mogelijk maakt.
Bij mijn kwalificatie ‘flauw’: dit normatieve oordeel sprak ik uit omdat ik de discussie over het ideale eindexamen te smal vindt, als die zich beperkt tot de wijze van toetsing. We horen het – gezien het *ideale* – te hebben over het gewenste eindniveau in de verschillende vakdomeinen; dan moet je daar niet van tevoren een rem op zetten door te zeggen dat bepaalde domeinen te subjectief zijn in de toetsing.
Bij jouw nieuw ingebrachte punt: je stelt dat een leesvaardigheidsexamen over tevoren behandelde onderwerpen geen examen leesvaardigheid is, maar een kennistoets (implicatie: een strikte scheiding!). Tegelijk zei je eerder dat je mijn mening deelt dat een absolute scheiding tussen kennis en vaardigheid niet te maken is. Dit lijkt tot op zekere hoogte tegenstrijdig. Om een tekst te begrijpen, is immers méér vereist dan technische leesvaardigheid: je hebt altijd enige kennis van het onderwerp nodig. Precies hierom houden docenten en examenmakers, bij de selectie van teksten, enige rekening met de ‘belevingswereld’ van kinderen – we weten immers dat leerlingen beperkte kennis van de wereld hebben.
Een discussie over het examen leesvaardigheid is dus deels een discussie over de inhoud van die teksten. Ik vind het prima om bijv. een opiniestuk van Hertzberger op te nemen over een bètaonderwerp (oppervlakkig behandeld uiteraard, we zijn immers geen examen Biologie), maar een gebalanceerd examen bevat dan eveneens een tekst over een alfaonderwerp. Waarom zou dat geen tekst over een specifiek neerlandistisch onderwerp kunnen zijn? Zeker als je een jaar van tevoren publiceert wat het onderwerp zal zijn (zoals bij het examen Latijn), zal het praktisch goed haalbaar zijn om te garanderen dat leerlingen de vereiste voorkennis hebben; zodoende kunnen zij vragen krijgen die niet gericht zijn op reproductie van die kennis, maar die leesvaardigheid toetsen.
Ik denk dat jouw scheiding tussen kennis en vaardigheid overtrokken is; ik vind zulk denken typisch voor de verkaveling van het schoolvak (geabstraheerde en geïsoleerde vaardigheden, ontkoppeld van concrete kennis) zoals die de afgelopen decennia is ontstaan. Het zou m.i. goed zijn als we bij ons schoolvak een neerlandistische kennisbasis zouden formuleren (vanuit de domeinen literatuur, taalkunde en taalbeheersing) en onze vaardigheidstraining uitvoeren in samenhang daarmee – en dit dus óók op die manier examineren.