Boordeeld! En hoe! Casuïstiek


Ben Wilbrink


Een pagina in opbouw met persoonlijke ervaringen met beoordeeld worden, zeg maar de motivatie achter mijn professionele belangstelling voor beoordelen in het onderwijs. Wie gearticuleerde eigen ervaringen wil toevoegen: dat zou ik interessant vinden, en een plaats willen geven. Ik ken geen verzamelingen van dergelijke casus, dat zou dus een nieuwigheid worden. Iets wat erop lijkt ken ik wel, een indrukwekkend boek met 'critical incidents' door de auteur verzameld op haar reizen bij medepassagiers en andere willekeurige passanten, op de vraag welke docent van invloed is geweest op het eigen leven, en hoe dan (Bluestein, 1995). In het volgende dan een serie casus, met eventueel daarbij in een box wat een wetenschappelijke duiding zou kunnen zijn, met daarbij relevante literatuur.

Ook door anderen aangereikte casus krijgen hier een plaats, de eerste is in november 2006 geplaatst. Hebt u een kenmerkende of bijzondere ervaring met beoordeeld zijn in het onderwijs, stuur die in.




basisonderwijs


meerkeuze-kleuter


Deze inventarisatie is gerangschikt naar opklimmende onderwijsjaren, het logische begin is de kleuterklas. Het eerste casus leidt meteen al tot uitvoerige annotaties, die ik telkens in boxen zal geven.


Mijn kleuterjaren zijn zonder beoordelings-incidenten verlopen: spelen, wandelen, verhalen van juf. Een generatie later is dat anders, en zie ik een kleuter thuiskomen met meerkeuze-werkjes.


Ik schrok me daarvan te pletter, het leidde tot scherpe formuleringen in de concept-tekst van mijn Toetsvragen schrijven. Dank zij een vruchtbare discussie met Ad Horsten (IOWO) is die onevenwichtigheid uit de tekst van hoofdstuk 2 weggeslepen. Wat blijft is de constatering dat kleuters al een hersenspoeling krijgen op een specifiek toets-format, dat zij worden geconditioneerd op het idee dat het in onze samenleving normaal is gewoon maar wat te roepen/zeggen/aankruisen wanneer je het antwoord op een vraag niet weet.
Dit ongelooflijke fenomeen is met stip een van de belangrijkste ontwikkelingen in de 20e eeuw bij het toetsen in het onderwijs: een onderwijsvreemde beroepsgroep van psychometrici heeft het voor het zeggen gekregen. Deze aliens hebben het nodig geoordeeld dat toetsen vooral keuzetoetsen moeten zijn en - op louter pragmatische, zeker geen wetenschappelijke gronden - dat je leerlingen moet dwingen te raden op vragen die ze niet weten [In de VS is dit gedwongen raden ondertussen sterk op zijn retour, Nederland moet nog volgen]. Zie ook de aantekeningen bij mijn Assessment in historical perspective pdf op dit punt.
Pas in 2006 heb ik mij gerealiseerd dat dit gedwongen raden op keuzevragen niet alleen onnodig is, maar ronduit schadelijk, bezien vanuit de gangbare criteria voor betrouwbaarheid en geldigheid van toetsen en van beslissingen op grond van die toetsen (APA-Standards / NIP-Richtlijnen). Dit raden is natuurlijk onnodig omdat niet-geweten vragen gewoon onbeantwoord kunnen blijven, daar bestaat geen verschil van inzicht over. Tot mijn verbazing bleek het eenvoudig mogelijk te bewijzen dat gedwongen raden nadelig is voor goed voorbereide studenten die presteren boven de grens tussen onvoldoende-voldoende scores. Dat is zelfs eenvoudig in te zien: stel je voor dat zo'n student op het tentamen tot het laatste moment de niet-geweten vragen open laat, wat een sterk aan te raden tactiek bij het maken van toetsen is. Door de raad-dwang moet dan in de laatste minuut een loterij worden gedaan, even vlug alle open vragen nog aankruisen - willekeurig, of alle laatste alternatieven, of juist alle eerste, or what not. Door die loterij kan een voldoende resultaat verkeren in een onvoldoende score op de toets. Zie voor een grondige behandeling hoofdstuk 2 van Toetsvragen ontwerpen, of het engelstalige spa-project (spa_generator.htm paragraaf guessing under pass-fail scoring).

Denk er maar eens over na. Wie naar een College van Beroep voor de Examens stapt, met deze klacht, kan op mijn deskundige ondersteuning rekenen. NB: mogelijk is het op juridische gronden gewenst dat je al bij het beantwoorden een merkteken plaatst op het in te leveren scoreformulier bij de vragen die je raadt! Het moet natuurlijk geen achteraf-spelletje worden. In voorkomende gevallen kun je zo bewijzen dat een voldoende score alleen door gedwongen raden in een onvoldoende is veranderd.
Voorzover dat nu nog toelichting behoeft: uit het voorgaande volgt dat raden ronduit schadelijk is, en uit het onderwijs geweerd zou moeten worden. Het probleem met deze stelling is dat het fenomeen in de literatuur eenvoudigweg niet bekend is, omdat de bijbehorende simpele analyse en bewijsvoering bij mijn weten nooit is uitgevoerd/gepubliceerd (nee, ook niet door Frederic Lord) en het daarom evenmin in de tekst van de APA-Standards of de NIP-Richtlijnen is terug te vinden.


rangordenen


Zoals de juf het doet, is het goed. Als kind weet je natuurlijk niet wat er gaande is, en waarom, maar je hebt er wel emoties bij. Je werd al snel 'op je plaats gezet.' De kindertjes van juf Dronkers kregen een nummer, hoe lager dat nummer des te 'beter' de prestaties. Voor Bennie was dat voor drie rapporten; 12/30, 6/29 en 7/29, daar hield ik geen trauma aan over, maar er waren dus ook leerlingen die met 30/30 of 29/29 naar huis moesten, om hun schande door pa of ma te laten tekenen. Hoe die rangorde tot stand kwam wist je als 6-jarige natuurlijk niet, er zal wel op gehamerd zijn dat het iets met 'je best doen' te maken had. Het maakte wel indruk, je werd namelijk ook in het bankje gezet dat met je rangnummer overeenkwam, ik kan mij nog iets van dat moment van 'reshuffling' herinneren. Dat het een zero-sum spel is, zal juf Dronkers niet onder woorden hebben kunnen brengen, al zal ze het affectief waarschijnlijk heel goed hebben begrepen. In 1951 is het rangordenen op de Koning Willem III school in Apeldoorn afgeschaft.


Met dit rangordenen maakten de knulletjes in klas 1, het ging om een jongensschool, kennis met een oude traditie (Wilbrink, 1997) die ieder individueel in een heel ongemakkelijke positie plaatst binnen de groep en tegenover de leerkracht. Een ethisch bijzonder lastige positie ook, die zich in individueel onderwijs niet voordoet. Je privacy wordt erdoor vernietigd, tegenover de klas kun je je niet afschermen. Het wordt er niet beter op dat die klas een tamelijk willekeurige groep is, en dat die leerkracht evenmin een lid van je eigen familie is. Daar komt bij dat je niet weg kunt (Goffman, 1961), de staat zal je dwingen te blijven, leerplicht is een anachronisme van heb ik jou daar (Ringer, 1979). Het kan behoorlijk gewelddadig zijn, een maatschappelijke samenzwering waar je als kind weerloos tegen bent (McLaren, 1993). Is het vergroten van weerbaarheid een onderwijsdoel (zie bijv. Cigman, 2001)?

Erving Goffman (1961) Asylums: Essays on the social situation of mental patients and other inmates
Ruth Cigman (2001). Self-Esteem And The Confidence To Fail. Journal of Philosophy of Education, 35,p. 561 ff. abstract: This paper takes a sideways look at the controversial topic of educational assessment, raising the question: what place should the success/failure distinction have in an effective and humane educational system? Though the experience of failure may undermine the self-esteem that is conducive to learning, its possibility is clearly important educationally. Instead of asking whether teachers should be truthful about children's achievements or dishonestly promote their self-esteem, we need to recognise a certain logical indeterminacy about what young children can do. Given this, it is reasonable to presume in favour of many of their capacities rather than against them, for this is how children develop the confidence to act. This includes the confidence to fail as well as the confidence to succeed. It is argued that both are crucial for learning.
Peter McLaren (1993) Schooling as a ritual performance. Towards a political economy of educational symbols and gestures. London: Routledge
Fritz Ringer (1979) Education and society in modern Europe. Bloomington: Indiana University Press.
Ben Wilbrink (1997). Assessment in historical perspective. Studies in Educational Evaluation, 23, 31-48. html


nep-psychologie


Twee generaties verder zie ik dan een ventje thuiskomen met een type rapport waarbij mijn broek werkelijk helemaal afzakt: een heus psychologisch profiel, opgesteld, jawel, door juf zelf. Nee, niet met behulp van een behoorlijk psychologisch instrument, maar een of ander in elkaar geknutseld geval.

De meeste ouders zullen dit waarschijnlijk niet vreemd vinden, en misschien zelfs wel heel goed. Ik ben niet zo'n ouder, ik ben psycholoog, en ik zie hier iets bijzonder onprofessioneels gebeuren, het is schoolkwakzalverij, waardoor kinderen beschadigd kunnen raken.

Laat mij dat duidelijk maken met een analogie. Stel dat juf een lichamelijke check-up van de kinderen doet, en een pseudo-medisch gezondheidsprofiel gaat opstellen met eventueel ook het een en ander aan diagnostische oordelen. Welnu, tot medische diagnostiek is schooljuf niet bevoegd. Met psychologische diagnostiek is dat niet anders. De kwakzalverij veroordeelt kinderen tot de stereotypieën van hun juffen.




middelbaar onderwijs


Draadje miskleunen die tweeps zich heel veel later nog herinneren draadje


Draadjes over een open toetsvraag: 'Beschrijf uw relatie met God'. Moeder van leerling schrijft in tweet dat het antwoord van de leerling 'ik heb geen relatie met God en voel me niet prettig bij deze vraag' als fout wrd beoordeeld, waardoor haar zoon een onvoldoende kreeg. Het vak is'levensbeschouwing.' Zij kreeg als reactie een antwoord van Pieter Hendrikse, die in zijn twitteraccout niet aangeeft dat hij voorzitter is van het CvTE, maar dat dus wel is: tweet. Ik vind dat een schokkend antwoord, en heb daar ook geen doekjes om gewonden, zie mijn retweet. In beide draadjes ontspint zich dan een verdere discussie met Hendrikse en anderen.

Het is een casus waarin een aantal problemen binnen onze toetscultuur tegelijk zichtbaar worden. Het casus zou goed toegevoegd kunnen worden aan de casus vermeld bij de model-toetscode van Van Wees c.s. zie hier.


toelating: proefklas


Mijn kennismaking met selectie was in de harde winter van 1956 toen ondanks de sluiting van school door de kolencrisis, een groepje leerlingen doorging met voorbereiding op toelating tot HBS of gymnasium. Het hoofd van de school, Kerkmeijer, had moeten praten als brugman om mijn ouders over te halen mij voor het gymnasium aan te melden. Mogelijk hebben ouders van enkele andere leerlingen het omgekeerde geprobeerd. In 1956 was er voor de toelating een proefklas van twee schoolweken georganiseerd, waaraan in mijn herinnering twee keer zoveel leerlingen aan deelnamen als er zouden worden toegelaten. Ik denk niet dat ik het laatste tevoren ook wist. Die proefklas was behoorlijk heftig, in hoog tempo werd er veel leerstof gepresenteerd en getoetst (algebra was een kraker) en werden lastige dictees afgenomen. Aan het eind van de proefklas, na nog wat testjes bij rector Korver, werd er geschift, waarbij er nogal wat kinderen uit Apeldoorn's maatschappelijke bovenlaag aan de verkeerde kant terechtkwamen. Dat heeft wel indruk op mij gemaakt, het was een toefje meritocratie in een nog behoorlijk door standverschillen beheerste samenleving.


De proefklas was een experiment, beschreven in Stellwag (1955). Het was een redelijk meritocratische selectie (mijn 1997): ouders hadden weinig of geen invloed op de uitslag, maar de ene kandidaat was van huis uit natuurlijk beter toegerust voor zo'n 'assessment center' selectie dan de ander. Hoewel: onderzoek zal dat laatste moeten uitwijzen. Het zou best kunnen zijn dat kinderen van eenvoudige komaf ontspannen door de proefklas heen zijn gegaan, en kinderen beladen met prestigieuze wensen van hun ouders juist uiterst gespannen.

M. Groen (1967). De voorspelbaarheid van schoolcarrières in het voortgezet onderwijs. Groningen: Wolters. [Enkele longitudinale studies van vijftiger-jaren groepen; proefschrift, promotor A. D. de Groot; gebruikt o.a. Cronbach & Gleser (1965) als methodologische basis]
Stellwag, H.W.F. (1955). Selectie en selectiemethoden. Een inleidende studie in het aansluitingsvraagstuk L.O. en V.H.M.O. Groningen: Wolters.
Ben Wilbrink (1997). Terugblik op toegankelijkheid: meritocratie in perspectief. In Marian Van Dyck, Toegankelijkheid van het Nederlandse onderwijs. Studies (p. 341-384). Den Haag: Onderwijsraad. [104k htm]



een puntje verschil ....


Als 12-jarige op een gymnasium verzeild geraakt heb je de eigen schoolloopbaan niet zomaar in eigen hand, het overkomt je allemaal. Ieder puntje telt dan voor de grote kladderatsj die bepalend is voor de overgang naar de tweede klas. Vervelend is dat leraren wel eens foutjes maken, je wordt dan wel op jezelf teruggeworpen om dat te zien en er werk van te maken. Het overkwam mij met een proefwerk wiskunde, dat ten onrechte onvoldoende was beoordeeld, en veranderd kon worden in een voldoende. Het is mij altijd bijgebleven dat de leraar, Seligman, mij vertelde dat dit bepalend was voor mijn eindcijfer wiskunde, en daarmee voor mijn overgang, omdat ik met de hakken over de sloot naar de tweede kon. Het is in zekere zin een mooi incident omdat ik in dat proefwerk een slimme oplossing had gevonden die als zodanig niet door de leraar was herkend: ik moest het hem uitleggen. Wiskunde is een vak waarin dat gelukkig goed kan, ik kreeg er onmiddellijk en van harte een accoord op, een voldoende, en een overgang-met-de-hakken-over-de-sloot.


Leraren en schoolleiding zijn vaak dubbelhartig over cijfers en overgangsbeslissingen. Aan de ene kant zijn er bijna altijd precieze regels over welke cijfers voldoende zijn voor een overgang, en welke niet, zodat de leerling precies weet waar zij aan toe is. Aan de andere kant is er de discretionaire bevoegdheid van de lerarenvergadering om ondanks tekortschietende cijfers toch een (voorwaardelijke) overgang toe te staan. Dat wordt een spagaat voor de dames en heren leraren (De Groot, 1966). Enerzijds rekenen zij leerlingen snoeihard af op behaalde cijfers, anderzijds verwijten zij leerlingen alleen op de cijfers uit te zijn. Dit enerzijdsen-anderzijdsen is gek makend. En wel des te meer zo omdat het hakmes niet valt in een dal tussen een groep hopeloze leerlingen en goed presterende leerlingen, maar in een klokvormige verdeling waar het een belangrijk deel van de leerlingen kan en zal treffen. En daar bovenop komt nog dat ook dit weer een nulsom-situatie is: de percentages onvoldoende zijn veeleer constanten ongeacht de prestaties van de leerlingen, dan dat zij meegaan met het absolute niveau van prestaties (de wetmatigheid van Posthumus, grading on the curve). Het laatste betekent dat individuele leerlingen niet echt invloed hebben op de cijfers die ze krijgen, omdat harder werken ertoe leidt dat ook anderen harder gaan werken (en voor het trekken van de lijn geldt overigens hetzelfde, wat een moordenaar van onderwijskwaliteit is). De Groot ziet de wanhoop wel, en erkent dat rond het punt waar het hakmes gaat vallen het niet inhoudelijk is te rechtvaardigen dat de ene leerling net wel, de andere net niet door mag gaan. Hij heeft er evenwel geen oplossing voor, behalve de mantra van doorzichtigheid (wat niet geweldig helpt in nulsom-situaties) en meerkeuzetoetsen in plaats van mondelinge examens (wat de ene problematische methode door de andere vervangt). Voor sociologen als Becker, Geer & Hughes (1968) is het na het voorgaande duidelijk dat er sprake is van een systemisch probleem (Coleman, 1990), en dat kun je ook in die termen aan de betrokkenen duidelijk maken. Met andere woorden: de spelregels zijn bekend, beoordelingen zijn feilbaar, het risico is voor jou (de leerling), zorg maar dat je 'voldoende' presteert, daarvoor is behoorlijke inspanning niet noodzakelijk voldoende, en accepteer anders de consequenties. Het is dus behelpen geblazen met dit klassikale onderwijs, georganiseerd zoals Maurits zijn legertjes organiseerde, een revolutionaire ontwikkeling in meerdere opzichten (Comenius zag dit als het model dat ook het onderwijs nodig had: practice and drill in groepen). Alternatieven zijn er voldoende, het probleem is ze breed ingevoerd te krijgen om het klassikale dwangbuis kwijt te spelen. Het studiehuis is zo'n breekijzer, maar het kan nog wel een of twee generaties duren voordat dit een weldadige invloed begint te krijgen op het beoordelen in het onderwijs.

A. D. de Groot (1966). Vijven en zessen. Groningen: Wolters-Noordhoff.
H. Becker., B. Geer, and E. C. Hughes (1968). Making the grade: the academic side of college life. New York: Wiley.
James S. Coleman, (1990). Foundations of social theory. Cambridge, Massachusetts: The Belknap Press of Harvard University Press.

Den Haag, 10 okt. [1991]. De fracties van CDA en PvdA in de Tweede Kamer hebben vanmorgen overeenstemming bereikt over een alternatief voor de verhogingen van het lesgeld met bijna driehonderd gulden en de boete voor zittenblijvers van 250 gulden [mijn nadruk]. (...) De twee regeringsfracties willen niet de leerling maar de scholen straffen voor zittenblijven. De scholen krijgen in het plan minder geld voor zittenblijvers en gezakte eindexamenkandidaten. De verwachte opbrengst van 25 miljoen door deze zogeheten rendementsbekostiging moet bovenop de 100 miljoen komen die Ritzen al heeft ingeboekt als verwachte opbrengst van onderwijskundige maatregelen, zoals de doorstroomprofielen. (...)

De Volkskrant, door onze redactie onderwijs.
Over zittenblijven zie bijvoorbeeld:
Jan Bos (1984). Blijven zitten met zittenblijven? Den Haag: SVO. (portret van zes scholen die daadwerkelijk in opstand zijn gekomen tegen het zittenblijven; beknopt overzicht van de omvang van het zittenblijven in binnen- en buitenland)


geestelijke terreur


Een generatie verder, is een kind de wanhoop nabij vanwege een serie onvoldoendes op het paasrapport: een onvoldoende omdat de school een werkstuk was kwijtgeraakt dat kindlief vervolgens niet over wilde maken, nog een onvoldoende omdat de klas in de ogen van een leraar iets had gedaan dat hem niet beviel, en nog een onvoldoende omdat een proefwerk niet was gemaakt dat was afgenomen op de dag dat kindlief met permissie afwezig was vanwege de bruiloft van grootouders. Het is werkelijk ongelooflijk. De afzonderlijke incidenten zijn overigens opgenomen in de casuïstiek in de studie van Cremers-Van Wees en anderen (1998). De cumulatie van deze incidenten bij één leerling voor een bepaald paasrapport - dus met vooruitzicht op doubleren - is reden om 112 te bellen, maar dan krijg je als ouder te maken met schoolfunctionarissen die het werkelijk op de meest ergerlijke manier laten afweten, ook al heb je op zich goede toegang omdat je ook in de ouderraad en in de medezeggenschapsraad van de school zit. Dit geloof je dus niet, maar vraag eens rond in je eigen omgeving naar vergelijkbare incidenten: dat gaat bijzondere zaken opleveren!


eindexamenjaar: werkweek


[Werkweek in Doorn, voortijdig afgebroken omdat er sprake was van drankgebruik op de slaapzaal. Een leerling van school verwijderd, een leerling van school vertrokken voordat verwijdering zou worden geëeffectueerd. Wat ik mij herinner is dat leerlingen individueel werden verhoord door rector en conrector, dus zonder enige ondersteuning van wie dan ook. De klas stelde een schriftelijke verdediging op in een groot aantal punten, en deed die toekomen aan de rector, de burgemeester, en nog zo wat betrokkenen. Uit een informele mededeling van een docent, enkele jaren later, bleek dat dit stuk niet aan docenten bekend was gemaakt. Ook overigens bleef het rond deze pleitnota oorverdovend stil, er is never ever ooit een antwoord op gegeven. Ik heb er destijds bloedig op zitten typen, er moesten heel wat doorslagen gemaakt. Wie een kopie heeft, of die in het archief van het Stedelijk weet te vinden, laat even wat horen. Maar alle gekheid op een stukje, dit staaltje van onrecht heeft diepe indruk bij mij (en anderen) nagelaten. Ik kom op deze gebeurtenis vanwege een vergelijkbaar geval in Amerikaanse jurisprudentie waar ik toevallig op stuitte:


U.S. Supreme Court. GOSS v. LOPEZ, 419 U.S. 565 (1975) html




middelbaar onderwijs: uit de literatuur


rigide modelantwoord


"The father of one of the authors once took a test that asked for the main reasons underlying World War I. The father gave a detailed and creative answer about three central reasons. When the test was returned, the teacher had given the father a 75 percent, because four reasons were discussed in class, and only three were mentioned in the answer. It is perfectly appropriate for the rules and 'correct' answers to be valued on a test, of course. But when the rules and 'correct' answers as expected by the teacher become the only thing valued on a test, a teacher is not encouraging or rewarding sensible risk-taking."

Robert J. Sternberg, James C. Kaufman & Elena L. Grigorenko (2008). Applied intelligence. Cambridge University Press. (p. 299, par. Take sensible risks)




eindexamen


[Ik was een goede wiskundeleerling, ondanks die 6- aan het eind van de eerste klas. Ik haatte goniometrie omdat er formules uit het hoofd gekend moesten worden. En ik had moeite met analytische meetkunde, ik kon dat op de een of andere manier niet in mijn systeem krijgen. Analytische meetkunde en gonio werden mondeling geëxamineerd, op de tweede examendag, de vrijdag na hemelvaart. De vrije dag benutte ik om de stof nog eens grondig door te nemen, en verdraaid, het kwartje viel! Ik begreep de stof, kon er alles mee doen wat maar te bedenken viel. Entwistle noemt dit fenomeen een 'knowledge object.' Ik heb het later ook gehad bij een cursus variantieanalyse, ik kon ieder denkbaar model zo uit mijn mouwen schudden. Terug naar dat eindexamen: het gesprek met docent en gecommitteerde leverde mij een 10 op. Dat is een mooi resultaat, maar omdat ik geen wiskunde ben gaan studeren, is mijn inzicht in analytische meetkunde volkomen vervlogen.

Wie in dit casus over mijn analytische meetkunde een eigen vergelijkbare ervaring herkent: wees zo goed dat eens uit te schrijven, en mij toe te sturen. Geef toestemming om het op de website te zetten, dan kan ik dat inderdaad doen.

Maar ook op een eenvoudiger niveau, bij het ontwerpen van toetsvragen, is er telkens weer de neiging om uit te gaan van de definities en andere abstracties in de stof, in plaats van wat het is om de stof te beheersen, er een 'knowledge object' van te hebben. Want zo'n 'kennisding' is niets iets dat noodzakelijk op een hoog abstractieniveau zit, ook het verwerven van het getalbegrip is een 'kennisding' voor de kleuter (werk van Harvard's Susan Carey, zie haar website). Het onderwijs hoort voor de student dus vergeven te zijn van de kennisding-ervaringen


Noel Entwistle (1995). Frameworks for understanding as experienced in essay writing and in preparing for examinations. Educational Psychologist, 30, 47-54. abstract & researchgate download. ]


[Datzelfde eindexamen leverde mij ook een heel andere verrassing op: de docent scheikunde had een heel nieuw soort vragen speciaal voor dit mondeling examen. Op zich niet moeilijk, zoals de koelkast in een afgesloten kamer: je zet de deur van de koelkast open, wordt het warmer of kouder in de kamer? Als u de vraag kunt beantwoorden, be my guest. Ik was werkelijk verbluft, wat bedoelt die vent met deze vraag? Dergelijke vragen waren in de klas never ever aan de orde geweest, ik kon dus niet weten wat er met dit zoekplaatje van mij werd verwacht. Ik moet dus een antwoord hebben gegeven waarbij ik niet alle condities opsomde die mijn antwoord waar maakten. Ik kwam er meen ik nog net met een zesje uit, want na dit fiasco kwam ik met een tweede vraag van dit type ook niet meer goed weg; er ligt een bal in de vijver. Je hebt een steen, en wilt daarmee de bal terugkrijgen: laat je die steen voor of achter de bal neerkomen?
Deze manier van examineren lijkt dus werkelijk nergens op. Het is meet-extremisme: de docent meet zichzelf onbeperkte vrijheid toe om inzicht te 'peilen' op welke manier hem maar goeddunkt. Maar dat heeft niets met de inhoud van het chemie-onderwijs te maken!]


Toen Koch in 1972 eindexamen deed aan het Amsterdamse Spinoza Lyceum, was hij de lust tot leren en voor school allang kwijtgeraakt. Gelukkig was de docent Nederlands hem goed gezind. &lquo;Ik verknalde mijn opstel, maar gelukkig liet hij de gecommitteerde vijf andere teksten van me lezen als bewijs dat ik het echt wel kon.&rquo;.

Robin Gerrits (19 mei 2009). Eindexamens 2009. Herman Koch. Over het examen Nederlands. De Volkskrant, p. 2.

Deze quote heb ik ook op de pagina over de eindexamens van Van Bijsterveldt geplaatst examen.vanbijsterveldt.2008.htm


de macht van de gecommitteerde bij het mondeling [ingezonden casus]


Het voorval heeft zich voorgedaan rond 1968.

De klassieke talen werden in die tijd geëxamineerd middels een schriftelijk en een mondeling examen.

Bij het afsluitende mondelinge examen was het de leraar die het gesprek voerde met de leerling. Hij stelde de vragen en begeleidde de kandidaat bij het antwoorden en het analyseren van de fouten. De gecommitteerde luisterde nauwlettend mee. Was het examen afgelopen, dan stelde de leraar een cijfer voor. De gecommitteerde nam dat in overweging. Hij bepaalde uiteindelijk, na overleg, het definitieve cijfer. (Deze procedure verschilde van de HBS-procedure. Daarin werden bij onenigheid de cijfers gemiddeld.)

Tjitske komt binnen. Ze neemt plaats en begint enthousiast aan het vertalen van de perikoop die haar is voorgelegd. Het betreft een stukje Homerus.

Ze werkt energiek en vlot. Wel is opvallend, dat haar vertaling een groot aantal fouten bevat. Nadat ze haar vertaalwerk heeft afgerond loopt de leraar de fouten nog even langs. "Daar vertaalde je zo, is dat de beste vertaling? En als je deze naamval bekijkt? en als je dit nu eens met dit verbindt?" Tjitske blijft enthousiast maar komt geen stap verder. Wanneer de fout helemaal is blootgelegd zegt Tjitske: "U heeft gelijk! nu zie ik het! Wat stom dat ik dat zelf niet gezien heb! Nee natuurlijk, zo moet het."
Op dezelfde wijze gaat het ook met de andere fouten.

In het nagesprek zegt de docent: "Een voldoende durf ik niet voor te stellen, maar misschien kunnen we elkaar vinden in een 5 ?"

"Dat is te weinig, zegt de gecommitteerde. Ze leverde een vlotte vertaling. Ze krijgt een 6"

Wilma komt binnen. Ze krijgt hetzelfde stukje Homerus. Ze vertaalt bedachtzaam en aarzelend. Het resultaat is helemaal niet onaardig. De leraar loopt met haar de fouten langs. "Hier heb je dit vertaald met dit, kan het ook anders?" "Ja, daar heb ik ook aan gedacht. Wanneer dit bijwoord bij dat werkwoord hoort krijg je een heel andere vertaling. Dan wordt het zo:" en daar komt het goede antwoord op tafel. Op dezelfde manier corrigeert ze haar andere misvattingen.

In het nagesprek zegt de docent: "De vorige leerling kreeg een 6, dan is dit minimaal een 7 denkt u niet?"

"Nee, een zeven? Het liep zo moeizaam en stroef. Het was hangen en wurgen. We houden het op een zes." antwoordt de gecommitteerde.

"Wilma heeft in vergelijking met Tjitske nu toch minstens een punt te weinig gekregen", oppert de docent.

De gecommitteerde repliceert: "Dat zal haar in het leven wel vaker overkomen."

Dit 1968-casus is mij in november 2006 toegestuurd door Jaap Neerken (nee, het betreft niet zijn eigen ervaring). De namen zijn fictief. b.w.


Het is dit soort willekeur dat de drijvende kracht is geweest voor psychologen zoals A. D. de Groot om mondelinge toetsen te vervangen door toetsen met meerkeuzevragen. Eigenlijk is dat een brug te ver, omdat gewoon schriftelijk werk ook een einde maakt aan dit specifieke type willekeur, mits werk en beoordeling zijn in te zien door de leerling of haar raadsman. De Groot is niet over een nacht ijs gegaan: wie zijn Methodologie uit 1961 erop naslaat, ziet daarin uitvoerige aandacht voor de vele manieren waarop er oneigenlijke momenten in het toetsen in kunnen sluipen, overigens ook bij het nakijken van schriftelijk werk, en hij had er aan toe kunnen voegen: ook bij het ontwerpen van meerkeuzevragen.
De gecommitteerde in het casus zag heel goed dat oneerlijkheid altijd wel zijn lelijke hoofd op zal steken, maar zo botweg zelf meegaan in die oneerlijkheid is een doodzonde in het onderwijs. Maar ja, in die tijd kreeg je geen verslagjes van het onderling beraad tussen leraar en gecommitteerde, en konden deze autoritaire lieden er altijd mee wegkomen.


Corine Eckhard (1 juli 2017). ‘Wat een onderwijs, wat een verspilling’ Het Parool lezersbrief


Maar de klap op de vuurpijl kwam maandag via de mail. De mentor schreef dat mijn pleegzoon is gezakt voor zijn proefexamen en volgende week geen examens mag doen. Kom maar volgend jaar terug om het af te maken. Dat kan dan nog voor 1 oktober gelukt zijn. Dan kan hij van 1 oktober tot 1 september het jaar erop thuis wachten tot hij naar het hbo kan (waar hij al is aangenomen). 


Wat een onderwijs. 


Wat een toekomst. 


Wat een verspilling.


Martin Ringenaldus, Ben Wilbrink, Pieter Hendrikse (maart 2021) Over eindexamens en hun gebreken. Uitvoerige uiteenzetting van Martin hoe hij zijn leerlingen voorbereidt op het eindexamen Duits, en hoe dat veel oneigenlijke besteding van kostbare onderwijstijd vergt. Een grove misstand dus. Niet zomaar een vage klacht over kwaliteit, maar heel precies aangeduid waar de pijn zit. draadje




hoger onderwijs


In mijn eerste studiejaar raakte ik verstrikt in een ernstig beoordelingsprobleem. In het experimenteel praktikum moest zes weken lang iedere week een onderzoekje (met een medestudent, o.a. samen met Kees Mettes) afgerond en gerapporteerd worden. Na afloop van het praktikum kreeg je je cijfer te horen. Tot mijn starre verbazing had ik een dikke onvoldoende. De verantwoordelijke docent, Zwanikken, kon niets met mijn argument dat ik niet had kunnen vermoeden dat ik iets helemaal verkeerd deed: ik had er tussentijds geen enkele aanwijzing voor gekregen. Ik meen me te herinneren dat je het gemaakte werk niet terugkreeg, ook niet na afloop van het praktikum. Mijn eigen verklaring is altijd geweest dat ik onconventioneel werk inleverde, iets in de sfeer van het Crombag-effect: als je ook leest buiten de opgegeven literatuur, heb je vervolgens waarschijnlijk lagere tentamencijfers. Ik mocht mooi de volgende keer opnieuw mee gaan doen, en wie schetst mijn verbazing: iedere week werd het werk beoordeeld en al teruggegeven! Kijk, zo leer je dus je eigenwijze mond open te doen, want het doet af en toe een misstand als sneeuw voor de zon wegsmelten.

[Over eigenwijsheid gesproken. Ik heb zowel in mijn kandidaats als in mijn doctoraal een groot tentamen gedaan bij Van Parrereren, beide met de nodige eigenwijsheid. Bij het eerste tentamen trok Van Parreren een punt af vanwege eigenwijsheid, dat werd een zeven, bij het tweede kreeg ik dat punt er weer bij, het werd een negen, en het aanbod van ondersteuning bij sollicitaties. De willekeur van subjectiviteit ten voeten uit.]

[Bij mondelinge tentamens is het cruciaal dat ondervrager en ondervraagde met elkaar communiceren, op dezelfde golflengte opereren zeg ik maar. Met Bert Tellegen was dat niet het geval. Zowel over mijn scriptie, als bij mijn methodologie-tentamen was er een breakdown in de communicatie. Na afloop van dat tentamen op weg naar mijn kamer werd het mij letterlijk zwart voor ogen. Iets vergelijkbaars heb ik nooit meer meegemaakt. In vriendschappelijke relatie met Bert, enkele jaren later, heb ik dat wel besproken, maar hij kon er niets in herkennen. Pech gehad, Ben. Dat kun je wel zeggen, het grapje kostte mij mijn cum laude (en de niet te verwaarlozen twee extra periodieken, over tig jaren, een beloning destijds nog verbonden aan deze prestatie).]




concepten en subsidieaanvragen


De klas is een autoritair systeem, waaruit dan ook heel wat beoordelings-ellende voortvloeit. Zie het werk van Erving Goffman (html) over wat instituties met mensen doen. De klas is ook een model voor andere beoordelingssituaties, zoals het refereren van concept-teksten, of het beoordelen van subsidieaanvragen, door peers in het eigen vakgebied.




de arbeidsmarkt: sollicitaties


Markten hebben regulering nodig, anders wordt het moord en doodslag omdat de sterksten het gewoon overnemen (fascisme). Sommige markten laten zich beter reguleren dan andere. Een markt waar de positie van de zwakste partij nauwelijks is gereguleerd of valt te reguleren, is de arbeidsmarkt. Hier is het catch-as-catch-can, zijn er vaak geen getuigen, hebben onderliggende partijen geen goede positie om misstanden aan te vechten, en ga zo maar door. Individualism run wild. Ik heb in 1994 (html) laten zien dat de arbeidsmarkt bovendien verschillen sterk uitvergroot door voor de kansrijken de rode lopers uit te leggen, en juist de kansarmen in de onmogelijke positie te dwingen zich een eigen plek op de markt te veroveren. Het ondernemerschap dat voor dat laatste nodig is, is immers juist bij de kansrijken sterk aanwezig, maar die laatsten worden daar nauwelijks op aangesproken. Een typisch Rawlsiaanse problematiek: gaan die kansrijken vervolgens met hun talenten zo goed om dat uiteindelijk ook de kansarmen daarvan meer profiteren dan zij bij een meer egalitaire verdeling zouden doen?
Rode draad in de casuïstiek is hier dat de werkelijkheid van de arbeidsmarkt een iets andere is dan het breed onderschreven idee dat wij sinds de Verlichting een systeem hebben dat verdienste beloont in plaats van wie je ouders zijn. Trouwens, ook in het onderwijs blijkt deze meritocratie heel brede foutenmarges te hebben, zie mijn 1997 html.


Hans Werdmölder (19 december 2009). Ik (man, blank, 58, werkloos) word keihard gediscrimineerd. <>NRC Handelsblad Opinie blz. 4


Tweet van Marieke de Wijk (17 mei 2019).

Ach ja, ik gooi het er nog maar eens in. Havo economie examen 2017 werd bij dochter uiteindelijk nagekeken door 5(!) correctoren. De cijfers varieerden van 3,5 tot 6,8. Zelfde gemaakte werk en zelfde correctiemodel he. Sindsdien ben ik alle vertrouwen in het systeem verloren.


Literatuur


A. D. de Groot (1961). Methodologie. Grondslagen van onderzoek en denken in de gedragswetenschappen. Den Haag: Mouton.

Jane Bluestein (1995). Mentors, masters and Mrs. MacGregor. Stories of teachers making a difference. Deerfield Beach, Florida: Health Communicatons. isbn 1558743375

L. M. C. M. Cremers-van Wees, J. W. M. Knuver, H. J. Vos, & Van der Linden, W. J. M. (1998). Model gedragscode toetsen, beoordelen en beslissen in het voortgezet onderwijs. Enschede: OCTO. isbn 9036510899. En: Toetsen, beoordelen en beslissen in het voortgezet onderwijs. Ontwikkeling van een gedragscode voor leraren. Enschede: OCTO. isbn 9036510902. http://www.benwilbrink.nl/Model_gedragscode_toetsen_beoordelen_en_beslissen_in_het_voortgezet_onderwijs.pdf

Jane Gallop (1997?). Feminist accused of sexual harrassment. Duke University Press. Review by Janet Malcolm: 'It happened in Milwaukee.' The New York Review of Books, October 23, 1997, 8-9. [NYRB $3] Sex and assessment related in a most intrigueing manner. Jane Gallop, zelf de hoofdpersoon, in 1992 Distinguished professor of English and Comparative Literature. interview

Ben Wilbrink (1997). Terugblik op toegankelijkheid: meritocratie in perspectief. In Marian Van Dyck, Toegankelijkheid van het Nederlandse onderwijs. Studies (p. 341-384). Den Haag: Onderwijsraad. html



The ethcs of assessment. Part 9 in: Douglas N. Jackson and Samuel Messick (Eds.) (1967). Problems in human assessment New York: McGraw-Hill. lccc 66-15835




Carolyn Dickens , Bruce L. Lambert , Terese Cromwell & Mariann R. Piano (2017). Nurse Overestimation of Patients' Health Literacy. Journal of Health Communication. International Perspectives, 18 open access




J. Hemelrijk (2002 2e). Uit de dagboeken van een rector. Stichting Memoriaal Oud Zuilen. 9080684929




Martin Ringenaldus (tweet 4 mei 2019). Is het eerlijk om een leerling het cijfer 1,0 te geven als 45% van de items correct is gemaakt? Bij de talen komt dit voor als een x aantal fouten per punt de norm is. Ik schreef een blog (incl. spreadsheet) over hoe het eerlijker kan: blog




Ger Harmsen (1993). Herfsttijloos. Een levensverhaal. SUN 9061683971













maart 2021 \contact ben apenstaartje benwilbrink.nl

Valid HTML 4.01!       http://www.benwilbrink.nl/projecten/beoordeeld.htm