voordracht Nationaal Congres T.U. Eindhoven
in A. I. Vroeijenstijn (Red.) (1980), Kwaliteitsverbetering hoger onderwijs. Vierde nationaal congres onderzoek van het wetenschappelijk onderwijs. Voorburg: Stichting Nationaal Congres, 380-409.


Beleid bij tentamens en examens


Ben Wilbrink

Over beleid bij tentamens en examens leg ik U 8 stellingen voor. Tezamen geven deze in telegramstijl een uitgesproken visie op het beoordelen in het onderwijs, waarin hopelijk voldoende samenhang steekt om er een aanzet tot theorievorming in te mogen zien. (Zijn er op dit gebied dan nog geen handzame theorieën? Nee, er zijn slechts methoden en technieken beschikbaar, en die zijn nog geleend ook, voornamelijk uit de psychologie. Is theorievorming dan wel zo nodig, nu we het al zo lang zonder hebben kunnen doen? Ja, dat is nodig. Ik zal dat toelichten.)

Bij het onderwijsbeleid wordt steun gezocht bij concrete gegevens over hoe het onderwijs functioneert. om op grond van die gegevens het beleid gestalte te kunnen geven, moeten deze gegevens eerst geïnterpreteerd worden: de gegevens spreken nimmer voor zichzelf. Voor interpretatie is tenminste een theorie nodigt hoe gebrekkig ook, wil je niet helemaal terugvallen op traditionele wijsheden die veelal traditionele vooringenomenheden zullen zijn. Een voorbeeld:

Stel dat U als docent wilt weten waarom studenten zakken voor Uw tentamen, en dat U in een kleine enquête na afloop van het tentamen het volgende vraagt (ook met sheet geprojecteerd):

Wanneer blijkt dat u gezakt bent voor dit tentamen, hoe komt dat dan?
  1. te laat met de voorbereiding begonnen,
  2. het tentamen was moeilijker dan verwacht,
  3. door persoonlijke omstandigheden heb ik mij onvoldoende kunnen voorbereiden.


De vragensteller is hier naïef te werk gegaan: vrij associërend op het begrip 'zakken' zijn mogelijke oorzaken bedacht die louter in de sfeer van de pathologie liggen. Achter het symptoom 'zakken' wordt inadequaat studeergedrag verondersteld.

De student wordt gedwongen tot het aangeven van een pathologische oorzaak, ook als die er niet zou zijn. De twee mogelijke uitslagen, zakken of slagen, worden teruggeprojecteerd naar waar de student zich in de voorbereiding op gericht heeft. Maar zolang de student nog met de voorbereiding bezig is, gaat het om de kans om te slagen, of de kans om te zakken. Een beter passende, en meer informatieve vraagstelling zou de volgende kunnen zijn (ook met sheet geprojecteerd):

Naar welke slaagkans hebt U in Uw voorbereiding toegewerkt?

  1. 100 %
  2. 80 %
  3. 60 %
  4. lager.
Denkt U dat Uw slaagkans lager / gelijk / hoger is dan waar U in Uw voorbereiding naar gestreefd hebt?


(Deze vragen worden voorafgaand aan het tentamen gesteld). Wie een lagere slaagkans denkt te hebben dan nagestreefd is, zal op één of andere wijze bij de voorbereiding op het tentamen gehinderd zijn, mogelijk door een te late start, onderschatting van de moeilijkheid van de stof, persoonlijke omstandigheden, en dergelijke.

U ziet, een klein beetje reflectie leidt tot een sterk verbeterde vraagstelling. Een meer systematische reflectie, op grond van theorie of uitgesproken filosofie, kan de interpreteerbare empirische gegevens opleveren die het beleid zo hard nodig heeft.



Stelling 1. Studenten laten zich niet passief beoordelen, maar zullen in hun studeergedrag er op vooruitlopen.

Zakken of slagen zijn voor de student te belangrijk om van het toeval af te laten hangen. De student weet voor zichzelf welke slaagkans hij of zij ongeveer wil hebben, en zal daar in de voorbereiding op het tentamen dan ook naartoe werken.

De stelling impliceert dat studenten dan ook in staat zijn om hun slaagkans te voorspellen. Immers': je gaat net zo lang door met studeren tot je denkt de gewenste slaagkans ongeveer bereikt te hebben (tenzij je tijd tekort blijkt te komen).

In een recent gepubliceerd onderzoek blijken studenten in 50 tot 80 % van hun voorspellingen in categorieën als 'zakken' en 'slagen' gelijk te hebben. De onderzoekers trekken daaruit de conclusie dat studenten niet kunnen voorspellen. En dat betekent dan weer dat studenten op chaotische wijze zouden studeren. Zo'n zwartgallig beeld over het onderwijs wil ik niet voetstoots overnemen: de resultaten van dit onderzoek moeten ánders geïnterpreteerd worden. Die andere verklaring heb ik al een beetje weggegeven: er is onderzocht of studenten hun zakken of slagen konden voorspellen, en niet of ze hun slaagkans juist konden inschatten.

Wie de voorspelling van zakken of slagen onderzoekt, moet er rekening mee houden dat het plafond in die voorspelling niet gelijk is aan 100 % correct. Een simpel voorbeeld kan dat illustreren:

Neem een groep studenten waarvan bekend is dat ze een stofbeheersing hebben van ongeveer 60 %. op de toets is de zakslaag grens eveneens op 60 % goed gesteld. Welnu, voor deze groep studenten geldt dat de uitslag "zakken of slagen' een toevalsresultaat is. Gevraagd hun uitslag te voorspellen, is de maximale score, als je dat zo mag uitdrukken, 50 % correcte voorspellingen, en dat is gelijk aan het toevalsresultaat. Dat toevalsresultaat en plafond in dit geval gelijk zijn, is bijna een kwestie van definitie, zou je kunnen zeggen. Maar wanneer een fors percentage studenten voor het tentamen zakt, dan zijn er nogal wat studenten in de groep voor wie de beste voorspelling zo'n 50% of 60% succeskans heeft. Zo'n laag percentage betekent niet vanzelfsprekend dat studenten hun slaagkansen niet goed kunnen inschatten.


Stelling 2. Studenten proberen hun doelen op de meest effectieve wijze te realiseren.

Naast allerhande andere levensdoelen waar tegelijkertijd aan gewerkt wordt, is een belangrijk streven van de student om voor zijn tentamens te slagen. Daarbij zal de student proberen om in zo kort mogelijke tijd te slagen, met een zo gering mogelijk tijdbeslag. Tenslotte zijn er nog wel meer dingen te doen als alleen maar voor tentamens werken. In dit verband laat zich de vraag stellen of beter studieresultaten inderdaad bereikt kunnen worden door harder te werken, door een hoger motivatie, door goede studiegewoonten, of door sterker intellectuele capaciteiten.

Op deze vraag gaven enkele collega's van mij vijf jaar geleden een ontkennend antwoord, op grond van een uitgebreid onderzoek in een viertal verschillende studierichtingen. Wat was namelijk het geval: de resultaten lieten zien dat studenten met betere studiegewoonten geen betere studieresultaten boekten dan studenten met slechtere studiegewoonten. En hetzelfde voor beter gemotiveerde studenten, en voor meer intelligente studenten. Aan deze resultaten werd de conclusie verbonden dat studiesucces een kwestie van geluk is, dat al deze relevante factoren kennelijk geen invloed op het studieresultaat hebben, dat het onderwijs 'dus' chaotisch functioneert, en tenminste irrationeel in elkaar steekt.

80gif/80Belei1.gif


Voordat we meegaan met deze zwartgallige conclusies, en voordat we de stelling verwerpen dat studenten op effectieve wijze studeren, moet er toch even gekeken worden of ook hier de onderzoekresultaten wel zo vanzelfsprekend zijn. Om te beginnen hoef je geen groot onderwijskundige te zijn om de stelling overeind te houden dat het investeren van extra studietijd leidt tot betere (verwachte) studieresultaten. Wanneer harder werkende studenten niet evident beter resultaten bereiken dan studenten die het wat kalmer aan doen, moet gecontroleerd worden of de laatste categorie studenten de kortere tijdbesteding misschien compenseert door een betere voorkennis, of door groter slimheid. Dat is punt 1. Punt 2 is dat de keuze van streefniveau of slaagkans in hoge mate bepalend is voor de tijdbestedingen dat die keuze meer van persoonlijke factoren af zal hangen dan van bekwaamheden of studiegewoonten.

Kortom: de student kiest zich een streefniveau, en past zijn tijdbesteding daar zo bij aan dat het gewenste resultaat bereikt wordt.



Stelling 3. Studenten en docenten hebben verschillende doelen.

Wanneer studenten streven naar een bepaalde slaagkans op het tentamen, of naar een bepaald cijfer voor dat tentamen, zal dat de docent enigszins verdrieten. De beloning van de studieprestatie dicteert de studie-inspanning, en niet de gemotiveerdheid om van het vak inhoudelijk kennis te nemen. Belangrijker is het in dit verband om op te merken dat er bij het evalueren van het onderwijs ernstige problemen kunnen ontstaan wanneer men zich niet bewust is van die discrepantie tussen de doelen van de docent en die van de studenten.

De studieresultaten, of zak-slaag percentages, zullen al gauw gebruikt worden als maat voor het effect van onderwijsverbeteringen. Het laat zich makkelijk raden wat er gebeurt in die situaties waar de studenten hun streefniveau bepalen onafhankelijk van de aard van de leerstof, of de wijze waarop het onderwijs gegeven wordt. Een kwalitatieve verbetering van het onderwijs kan er dan in resulteren dat studenten minder tijd nodig hebben om hun streefniveau te realiseren, en dan ook inderdaad niet méér tijd zullen investeren. Daardoor eigenen studenten zich het positieve effect van de onderwijsverbetering toe. De docent ziet de studieresultaten niet verbeteren, en concludeert misschien ten onrechte dat alle moeite en inspanning voor die onderwijsverbetering vergeefs zijn geweest. Het mechanisme dat ik hier beschrijf is er waarschijnlijk voor een groot deel verantwoordelijk voor geweest dat onderzoek naar het effect van kwaliteitsverbetering van het onderwijs zelden of nooit duidelijke resultaten opleverde, zoals door Dubin en Taveggia in hun publicatie uit 1968 beschreven.

De les is natuurlijk deze: dat de doelen van de student geweldig belangrijk zijn, en dat je met het beleid dáár invloed op uit kunt oefenen, er tenminste rekening mee moet houden.

Het ziet er naar uit dat een Individueel Studie Systeem de verbetering van het onderwijs combineert met een greep op de streefniveaus van studenten, en mede dáárom ook duidelijke effecten kan sorteren.



Stelling 4. Een examenregeling die voor ieder vak een voldoende eist, brengt veel herkansingen met zich mee.

Omdat studenten maar zelden in staat zullen zijn een zeer hoge slaagkans na te streven (ook al zouden ze dat willen), is het evident dat er nogal eens herkanst zal moeten worden. Zakken en herkansen is een kwaad waar de student zelden helemaal onder uit kan. De rationele student zal van de nood een deugd maken door slaagkansen na te streven die binnen de kortste verwachte tijd leiden tot slagen. Dat is wat anders dan slagen met zo weinig mogelijk herkansingen. Het moeten herkansen kost tijd en energie, maar dat geldt ook voor het nastreven van een extra hoge slaagkans om dat herkansen te vermijden. Ergens zal er een evenwichtspunt zijn, waar een extra studie-inspanning geen verhoging van de slaag-kans meer oplevert die de moeite nog waard is. Deze redenering kan in exacte, wiskundige, taal gegoten worden, en laat in die vorm heel interessante berekeningen toe. Zo is het mogelijk om voor verschillende streefniveaus in mate van stofbeheersing na te gaan wat de naar verwachting benodigde tijd is om te slagen.

80gif/80Belei2.gif


Dat levert U-vormige curven op, die het laagste, en dus optimale niveau van verwacht tijdbeslag bereiken voor een nagestreefde stofbeheersing die tamelijk dicht boven de gestelde zak-slaag grens ligt. Er is echter niet duidelijk één optimaal streefniveau, maar er is een tamelijk breed gebied dat optimaal is. Bij rechts-optimale strategieën wordt minder vaak herkanst en bereiken de studenten een redelijke stofbeheersing. De verstandige student, die over voldoende studietijd beschikt, zal bij voorkeur zo'n strategie volgen, maar heeft daar wel enige wilskracht bij nodig (omdat vrijwel alle voorbereidingstijd-voor de 1e opkomst besteed wordt).

De ellende van de situatie zit hem in de links-optimale strategie, die evenveel tijd kost, maar een zeer veel lagere stofbeheersing oplevert. De voorbereidingstijd voor eerste opkomst is hier geringer, zodat de verleiding voor de student groot is om deze onproduktieve strategie te volgen, terwijl er ook studenten zullen zijn die door tijdgebrek gedwongen worden tot deze strategie.

Blijkens de grote aantallen herkansers in het w.o. wordt er nogal links-optimaal gestudeerd. Het gigantische probleem voor het beleid is om maatregelen te bedenken die studenten brengen tot rechts-optimale studiestrategieën. Het Individuele StudieSysteem is zo'n maatregel, waarin alle studenten op de produktieve studiestrategie gezet worden, zou je kunnen zeggen.



Stelling 5.Die scherpe grens tussen voldoende en onvoldoende prestaties is fictief.

Let maar eens op hoe vaak in geschreven tekst of in gesproken woord de opvatting gehuldigd wordt dat er een scherp af te bakenen grens tussen voldoende en onvoldoende stofbeheersing bestaat, met een bijbehorende grote sprong in waardering van prestatieniveaus. In de vraag: 'Waarom denkt U gezakt te zijn?' zit dat ook al verborgen. Zakken en slagen wordt volstrekt ten onrechte gezien als iets dat de student geheel in eigen hand heeft, terwijl de student die U vroeger zelf ook bent geweest, toch alleen maar de zekerheid kent geen zekerheid van slagen te kunnen bereiken, tenzij tegen zeer grote inspanning. Het is een misvatting dat studenten op deze wijze hun lot in eigen hand zouden hebben. Zoals het ook een misvatting is te denken dat uw tentamen feilloos de bokken van de schapen kan scheiden. Dat laatste is maar bij wijze van spreken, maar het beeld kan in een gedachten-experiment uitgewerkt worden: het is gewoon uit te rekenen hoe goed uw tentamen van 50 vragen kan onderscheiden tussen 100 studenten met een stofbeheersing van 50%, en 200 studenten met een stofbeheersing van 70%. Voor drie mogelijke zak-slaag grenzen, gericht op het optimaal scheiden van deze twee groepen, levert dat de volgende aantallen ten onrechte afgewezenen, of t.o. doorgelatenen op (ook met sheet geprojecteerd):

80gif/80Belei3.gif


Plotten van scoreverdelingen zoals in deze figuur is mogelijk in de eigen browser met de applets in het SPA-model moduul 1


______________________________________________________
           ten onrechte     ten onrechte    foutief
cesuur     doorgelaten      afgewezen       beslist
______________________________________________________

  29             16              5             7,0 %
  30             10             10             6,7 %
  31              6             17             7,7 %
______________________________________________________


Zelfs bij de in dit geval optimale zak-slaag grens van 30 (wanneer ten onterechte afwijzen evenzeer betreurd wordt als ten onrechte doorlaten), levert dat tentamen van 50 vragen nog 7 % onjuiste beslissingen op. Beste mensen, laten we liever die terminologie van 'voldoende' en 'onvoldoende' prestatie loslaten, en daarmee een stuk woordmagie kwijt spelen. Onze toetsen zijn er ongeschikt voor. Bovendien is het toch ook zo dat de waardering voor een klimmende mate van stofbeheersing een geleidelijk stijgende functie is, en niet een functie die ergens een grote sprong omhoog maakt, een sprong die merkwaardigerwijs traditioneel bij voorkeur bij 60 % stofbeheersing gemaakt wordt.



Stelling 6.Het is beter de zak-slaag grens als beleidsinstrument te beschouwen, dan als iets dat correspondeert aan de magische grens tussen voldoende en onvoldoende stofbeheersing.

De conjunctieve examenregeling vraagt om het hanteren van zakslaag grenzen. Dat volgt uit de eis dat ieder vak 'voldoende' gemaakt moet worden. Wanneer er geen grens tussen voldoende en onvoldoende stofbeheersing aan te geven is, moet de rechtvaardiging voor de plaats van de zak-slaag grens ergens anders vandaan komen. En dat er een rechtvaardiging voor die grens gegeven moet kunnen worden is een vanzelfsprekende zaak: behoorlijk bestuur, of het administratief recht, vraagt dat. Valt er direct nog niet aan de examenregeling te tornen, dan is de zak-slaag grens te verdedigen als afspraak met de studenten. De afspraak is eenvoudig: wie er beneden scoort, om welke reden dan ook, moet van de herkansingsregeling gebruik maken. De student kan verteld worden dat de plaats van die zak-slaag grens zó gekozen is dat de studenten de gewenste mate van stofbeheersing door de bank genomen inderdaad realiseren. Het laatste is geen smoesje, geen leugentje om bestwil, het is precies de wijze waarop beleidsmatig van de mogelijkheden om met de zak-slaag grens te schuiven, gebruik gemaakt wordt. Teruggaand naar de U-vormige kromme voor de benodigde tijd om te slagen, is het makkelijk in te zien dat verschuiven van de cesuur leidt tot andere optimale strategieën.

80gif/80Belei4.gif

Effect van verbeterde doorzichtigheid van de toetsing op benodigde tijd om te slagen (verticaal)

[Figuur 4.5 Cesuurbepaling 1980. De figuur is nagetrokken. Dit type analyse is nu onder de eigen browser uit te voeren met de Java-applets voor moduul 7 of 8 uit het SPA-model.

De hoogte van de zak-slaag grens beïnvloedt het studeergedrag, en daarmee de resultaten die met het onderwijs bereikt worden. Zo simpel ligt dat. En dat is in lijn met wat docenten altijd al als uitgangspunt voor hun beleid hebben gehanteerd, zij het dat een inhoudelijke rechtvaardiging daarvoor niet altijd even eenvoudig te geven was. Ik wijs er ten overvloede nog eens op dat een en ander een doorzichtige beoordeling vraagt, goede voorlichting aan studenten, eventueel proeftentamens, en een tevoren bekend gemaakte zak-slaag grens. De figuur laat het effect zien van een sterk verbeterde informatie over de toetsing op de verwacht benodigde tijd om te slagen bij het gekozen streefniveau. Verbeterde doorzichtigheid heeft als positief resultaat dat de ongunstige 'links optimale' streefniveaus onaantrekkelijker worden. Hoewel de figuur het een beetje lijkt te suggereren, is het niet zo dat de relatief zwakkere studenten door de grotere doorzichtigheid met een studietijdverlenging opgezadeld worden.



Stelling 7. Herkansingen zijn onproduktief en demotiverend, en desondanks noodzakelijk, tenminste onder de traditionele conjunctieve examenregeling.

Wordt voor ieder studieonderdeel een zogenaamde voldoende geëist, dan kan het niet anders of er moeten herkansingsgelegenheden geboden worden. In de praktijk blijkt op grote schaal van die herkansingen gebruik gemaakt te worden.

Gaan we nog even terug naar de figuur voor verwachte tijd nodig om te slagen: wat daar als optimaal streefniveau uitrolt voor de eerste toets- gelegenheid, is ook het optimale streefniveau voor herkansingen. Tenminste, wanneer het aantal herkansingen niet beperkt is. De berekeningen achter deze figuur zijn dan ook gemaakt op grond van telkens hetzelfde streefniveau voor eerste opkomst en voor eventuele herkansingen. Misschien hebt U altijd al zoiets vermoed, maar het nooit uit durven spreken: dit betekent dat voor de gewone, hard werkende student het doen van een herkansing louter tijdverlies is: hij zal er de stof niet beter door gaan beheersen dan de eerste keer al het geval was. Even teruggrijpend op de enquête-vraag naar de reden waarom de student denkt gezakt te zijn: de meeste studenten die zakken hebben gewoon pech en zullen zich voor de herkansing terecht tot op ongeveer hetzelfde beheersingsniveau voorbereiden als voor de de opkomst gekozen werd.

Ik wijs erop dat het vele herkansen niet een gelijkmatig over alle studenten verdeelde tijdverspilling is, maar dat juist die categorieën studenten die dat het minst kunnen dragen, met de zwaarste herkansingslasten opgescheept worden. De conjunctieve examenregeling werkt zeer ongelijke onderwijskansen in de hand, zou je mogen zeggen.

Al met al betekent het vele herkansen een fantastische verliespost, die kwijt te spelen zou zijn door over te gaan op een geheel ander soort examenregeling.

Stelling 8. Uiteindelijk zal de examenregeling vérgaand compensatorisch moeten worden.

In een compensatorische examenregeling komen géén of vrijwel geen herkansingen voor. Exameneisen zijn gesteld als minimaal te behalen gemiddeld studieresultaat, over alle vakken.

Compensatie is overigens algemeen gebruikelijk, denk aan cijfergewoonten per vak in het lager en middelbaar onderwijs, maar ook aan de wijze waarop voor een enkel tentamen de eindscore als totaalscore over alle gevraagde onderwerpen genomen wordt.

Het onderzoek naar het voordeel in efficiëntie van compensatorische regelingen moet nog verricht worden. Zoveel is echter al wel duidelijk, ook uit de voordracht die ik U heb gegeven, dat voor de hand liggende tegenwerpingen geen hout snijden. Met name argumenten over minimum-niveaus per vak die toch gegarandeerd zouden moeten blijven, zijn gebaseerd op de misvatting dat onder traditionele regelingen die garanties er wél zouden zijn. Denk maar aan het gegeven voorbeeld over het scheiden van de bokken en de schapen.

De voor de hand liggende studiefase om te beginnen met een compensatorische regeling, is de propedeuse. Voor een propedeuse-regeling zijn dan wel bijzondere maatregelen te treffen om te voorkomen dat langs een achterdeur opnieuw enorm tijdverlies gaat ontstaan doordat teveel studenten gedwongen worden de hele propedeuse te herhalen. In de tekst in het congresboek heb ik zowel voor dit speciale punt, als voor de andere besproken onderwerpen, verwezen naar publicaties die een meer volledige uiteenzetting bevatten. en waar ook de technieken gegeven worden. In deze voordracht heb ik niet méér kunnen doen dan enkele saillante punten onder Uw aandacht te brengen, hopelijk met het effect dat Uw nieuwsgierigheid gewekt is.



percentages gezakten 1e opkomst [sheet]

strafrecht 44 Interne I 38
Inleiding 49 Pathologie II 45
Practicum 53 Chirurgie I 35
Rechtssociologie 37 Interne II 51
Ideeëngeschiedenis 53 Pathologie III 28
Burgerlijk recht 71 Chirurgie II 9
Practicum II 56 Kindergeneeskunde 19
Staathuishoudkunde 28    
Soconomie 12    
Propedeuse rechten
Leiden '79-'80
Crombag et al.
O.v.O. Leiden
  3e en 4e jaar geneeskunde
Groningen '77-'78
Cohen-Shotanus en Mooiweer
ORD '79
 

wiskunde 28 Hoofdvak deel 1 45
Natuurkunde 70 Hoofdvak deel 2 57
Fysische chemie 42    
Organische chemie 33    
Dierkunde 19    
Staathuishoudkunde 28    
Propedeuse Landbouwhogeschool
januari '78
Muggen
C.O.v.O. Wageningen
augustus 1979
  Sociale geografie
propedeuse '79-'80
VU A'dam
Hoeksma, Bernaert, van Os
Afdeling Onderwijsresearch VU
 


Beleid bij tentamens en examens.





 

Ben Wilbrink, Centrum voor Onderzoek van het Wetenschappelijk Onderwijs (COWO), Universiteit van Amsterdam.



1. Beoordelen in het onderwijs is geen fysisch meten. Studenten praten terug: zij richten zich in hun voorbereiding op het verkrijgen van een bepaalde beoordeling, en lopen daarmee op de beoordeling vooruit.



Vaststellen hoe hoog de stofbeheersing van de student is, is niet hetzelfde als niveaubepaling in een kennistank m.b.v. een peilstok. De beoordeelde student heeft zelf belang bij de uitslag, en zal die uitslag dan ook naar zijn hand proberen te zetten.; In de voorbereiding mikt de student al op een bepaald resultaat. Je zou kunnen zeggen dat een goed tentamen dát tentamen is waarbij de student inderdaad de score behaalt waarop hij zich voorbereid heeft. Wil het onderwijs goed functioneren, dan moeten studenten in staat zijn om hun tentamenresultaat redelijk te voorspellen. Zou dat niet het geval zijn, dan zouden zij zich in het wilde weg op tentamens moeten voorbereiden, en dat zou tot chaotische toestanden leiden. Kennelijk is het dan ook zó dat de tentamenresultaten van een groep studenten een tamelijk getrouwe afspiegeling,zullen vormen van wat zij ook aan resultaten bedoelden te halen (Wilbrink 1980b, bijlage D). Bijvoorbeeld: zijn er nogal wat gezakten, dan heeft een grote groep studenten een fors risico genomen om te zakken, willens en wetens.

2. Studenten gedragen zich rationeel: zij proberen hun doet op de meest effectieve wijze te realiseren.



In het denken over onderwijs is deze stelling vruchtbaarder dan de veronderstelling dat studenten onwillig, onmachtig en onkundig zijn. Doorstromingsgegevens en studieresultaten wekken oppervlakkig bezien wel eens de indruk dat het laatste waarschijnlijker is dan het eerste, maar het zou gemakzuchtig zijn je daarin door oppervlakkige indrukken te laten verleiden. Tegen onwil en onkunde valt geen aardig beleid te voeren. Wie studenten onwil en gebrek aan capaciteiten toeschrijft, zegt in feite dat het beleid er geen boodschap aan heeft, en hanteert daarmee zijn opvattingen als dooddoeners. Wie ervan uitgaat dat studenten zich rationeel gedragen, zal achter zorgwekkende studieresultaten gaan zoeken naar de oorzaken ervan in het onderwijs zélf, en in de wijze waarop het béoordelingsstelsel (= beloningsstelsel) is ingericht. Wanneer veel studenten zakken, is ofwel het tentamen te zwaar, ófwel is het voor studenten een verstandige strategie om voor dat vak een relatief hoog zakrisico te nemen. Wie zich-vervolgens de vraag stelt waarom die strategie in dit bepaalde geval effectief zou kunnen zijn, zal zeer waarschijnlijk tot een goed inzicht in de beoordelingssituatie komen, en kan op grond van dat verkregen inzicht goed beleid voeren. Deze rationaliteit houdt niet in dat alle studenten zich dan ook identiek zouden gedragen. Verre van dat. Iedere student brengt zijn eigen doelen, waarden, en capaciteiten mee, en daarom zal hij zich doorgaans ánders gedragen dan veel van zijn medestudenten, zonder minder effectief in zijn gedrag te zijn.



3. Het doel van de student is doorgaans niet wat de docent vindt dat zijn doel zou moeten zijn. Uit die discrepantie komt wederzijds onbegrip voort, dat leidt tot onmachtig beleid.

De docent ziet het tentamen als een bijkomstigheid en een noodzakelijk kwaad; voor de student is het tentamen het enige dat echt telt.

De docent ziet graag dat er vanuit belangstelling voor het vak gestudeerd wordt; voor de student gaat het er om voor het tentamen te slagen.

De docent ziet graag zo hoog mogelijke cijfers; de student gaat het er allereerst om dat hij slaagt, een goed cijfer is daarbij een versiering.

De docent ziet herkansen als een uitzondering voor degenen die door bijzondere omstandigheden gezakt waren; de student ziet zakken en herkansen eerder als een risico dat hij niet kan vermijden zonder bijzonder veel extra tijd in de studie te steken: zakken is een berekend risico.

De docent vraagt veel tijd voor zijn vak; de student springt zo zuinig mogelijk met zijn tijd om, weegt het nut van extra studietijd af tegen de daardoor verminderde kans om te zakken.

De docent vraagt inzicht in het vak, waarmee hij meestal iets bedoelt dat verder gaat dan de tentamenvragen die hij stelt; de student legt zich toe op het kunnen beantwoorden van de vragen die hij op het tentamen verwacht.

De docent ziet graag dat de student zich belangstellend in de geboden stof verdiept; de student wil graag weten welk soort vragen hij op het tentamen mag verwachten.

Dit zijn twee verschillende werelden. Er moeten diepe kloven overbrugd worden om beide denkwerelden op één lijn te krijgen. Het beleid kan leren dat studenten zich richten op die zaken waar het voor hen echt op aan komt. Vervolgens kan het beleid ervoor zorgen dat dat ook de zaken zijn waar het in het onderwijs op aan hóórt te komen. Werkend vanuit de stelling dat studenten zich rationeel gedragen, moet zo`n beleid ook haalbaar zijn.



4. Een examenregeling die eist voor ieder vak geslaagd te zijn, lokt uit dat er vaak gezakt Wordt. De student slaagt met de minste moeite voor alle vakken wanneer hij risico's neemt af en toe te zakken.

Leef je in de situatie van de student in: hij moet slagen, eventueel na herkansing, maar zit met drie onzekerheden:

(a) hij weet niet precies welk soort vragen gesteld zullen worden;

(b) hij weet slechts bij benadering hoe goed hij de stof beheerst, ook al zou hij precies weten om welk soort vragen het bij dit tentamen gaat.

(c) het tentamen is maar een steekproef: er wordt maar een beperkt aantal vragen gesteld, en daar kan hij pech of geluk bij hebben. Door het steekproefkarakter van het tentamen is de precieze score niet te voorspellen, ook al zou je precies weten hoe goed je de stof beheerst (gegeven de beheersing is de score binomiaal verdeeld, Wilbrink 1978).

Het is duidelijk dat in het oog van deze onzekerheden de student niet in staat is om het risico te zakken geheel tot nul te reduceren. Een bepaald risico zal hij moeten aanvaarden, en de vraag is dan hoe groot of hoe klein

dat risico mag zijn, gegeven de eigen doelen, waarden, financiéle omstandigheden, etcetera. Anders geformuleerd is dit de vraag naar het punt waar de verminderende meeropbrengst van een extra studieinspanning niet meer voldoende is om die extra studieinspanning te rechtvaardigen. De student bepaalt dat punt van juist voldoende (optimale) voorbereiding op intuitieve wijze, gebruik makend van zijn jarenlange studie-ervaringen.

Het is mogelijk om deze strategie van/voor de student te expliciteren in een wiskundig model, een tentamenstrategiemodel (Wilbrink 1978). Met de hulp van zo'n model kun je de effecten van bepaalde beleidsveranderingen doorrekenen, en op die wijze zoeken naar een optimaal beleid. Dat veronderstelt dat het model 6fwel een juiste weergave is van de wijze waarop studenten zich in werkelijkheid gedragen, 6fwel bruikbaar is om het onderwijs zó op te zetten dat studenten zich zullen gáán gedragen volgens de lijnen in het model uitgezet. Hoe dat ook zij, zo'n model maakt onderzoek, evaluatie, en onderwijsbeleid tot vruchtbare activiteiten. Op zijn minst legt het een theoretische basis onder het beleidsmatig handelen, en dat leidt er toe dat het beleid zich positief kan gaan ontwikkelen, in plaats van ad-hoe te blijven functioneren, van de hak op de tak te springen.



5. Een scherpe scheiding tussen 'voldoende' en 'onvoldoende' beheersing van de stof is een fictie. Wie het denken in die termen loslaat, kan tot een beter doordacht beleid komen.

In de bovengeschetste tentamenstrategie kijkt de student heel nuchter tegen de grens zakken-slagen aan: hij mikt er in zijn voorbereiding zó ver boven dat hij een aanvaardbaar risico overhoudt er onder terecht te komen. Dat zou de docent kunnen bedroeven, want het resultaat is dat er nogal wat studenten zakken, dat er veel herkanst wordt. De docent kan zich zorgen maken of die herkansers uiteindelijk wel op een 'voldoende' niveau zitten.

De docent kan hier best tot een rationeel beleid komen, wanneer hij maar afstand doet van het idee dat die grens 'voldoende-onvoldoende' heilig is. En dat aureool van heiligheid verbleekt makkelijk bij deze overwegingen:

(a) het steekproefkarakter van het tentamen betekent dat een scherpe grens voldoende-onvoldoende in tentamenresultatenhiet inhoudelijk te rechtvaardigen is. D.w.z.: het laten slagen van degeen met minimale score, en het laten zakken van degeen die één puntje tekort komt, is niet in inhoudelijke termen te rechtvaardigen.

(b) Afgezien van het steekproefkarakter van het tentamen is er voor de minimaal gewenste stofbeheersing geen scherpe grens aan te wijzen, maar op zijn best een bepaald gebied.

(c) De waardering voor verschillende niveaus van stofbeheersing is ongetwijfeld een geleidelijk stijgende functie van de mate van stofbeheersing, en niet een functie die ergens een steile sprong omhoog maakt (Wilbrink 1980b par. 3.6, -1980c).

Wat ligt dan méér voor de hand dan gebruik te maken van de tentamenstrategieén zoals de studenten die gebruiken?

De docent kan een tentamenmodet opzetten (Van,Naerssen 1976, Wilbrink 1978), waarin met name die tentamenstrategieën een hoofdrol spelen, en waarin de grens zakken-slagen zijn bepaalde plaats heeft. In dat model kun je bijvoorbeeld de grens zakken-slagen gaan verschuiven, en voor verschillende posities nagaan welk effect dat heeft op de tentamenstrategieën, en daarmee op de onderwijsresultaten die behaald kunnen worden bij deze groep studenten. Met behulp van het model kan voorspeld worden welke zak-slaaggrens het onderwijsresultaat optimaliseert.

Eén en ander is iets makkelijker gezegd dan gedaan. Een uitgebreide behandeling van deze methode van zak-slaaggrens bepaling geeft Wilbrink (1980b),waarbij ook effecten van gewijzigde herkansingsregelingen en dergelijke meegenomen worden.



6. Een examenregeling hoeft niet als beoordelingsstelsel gezien te worden. Het kan vruchtbaarder zijn de examenregeling te zien als een afsprakenstelsel waarin de wegen zijn aangegeven die tot slagen leiden.

In het tentamenmodel krijgt de grens zakken-slagen een louter instrumenteel karakter, wat in zekere zin voor de student altijd al het geval was. Het is dan ook beter om aan die grens niet meer de betekenis van het onderscheid 'onvoldoende-voldoende' toe te kennen, maar slechts de betekenis van een formele eis waaraan door de student te voldoen is om te slagen. De eis dat je voor alle vakken moet slagen is (tot op zekere hoogte) inhoudelijk te rechtvaardigen, en begrijpelijk te maken; voor ieder afzonderlijk vak is de zak-slaaggrens daarvan afgeleid, en in relatie tot dat bepaalde vak als niet veel meer dan een formele eis te beschouwen. De examenregeling wordt een afsprakenstelsel, een eenzijdig contract, dat vastlegt aan welke formele eisen-per-vak voldaan moet zijn om voor het examen te slagen. over de afspraken kan nuchter gesproken worden, zonder ondertonen die uit het onvruchtbare denken in termen van onvoldoende en voldoende prestaties stammen. Wanneer deze opvatting gemeen goed is, zal voor geen enkele student het zakken voor een tentamen nog een traumatische ervaring hoeven zijn: het hoort er immers bij, het werkt niet stigmatiserend. Voorzover zakken voor een tentamen redelijkerwijs gezien kan worden als voortvloeiend uit een verantwoorde studiestrategie van de student, mag dat zakken ook geen speciale nadelige consequenties hebben zoals bijvoorbeeld negatieve advisering m.b.t. het verstrekken van een studietoelage.



7. Ook in de conjunctieve examenregeling die als afsprakenstelsel gehanteerd wordt zijn de herkansingen tijdrovend en onproductief. Omdat de conjunctieve regeling niet zonder herkansingen kan,is die regeling inefficiënt.

Wanneer aan het aantal herkansingen geen beperking is opgelegd, is voor de herkansing de optimale tentamenstrategie gelijk aan die voor de eerste opkomst (de student heeft dan hetzelfde aantal tentamengelegenheden voor zich als de eerste keer, en wat tóen optimaal was, moet het ook nü zijn). Wanneer het aantal herkansingen beperkt is, zal bij ruwe benadering nog ongeveer hetzelfde gelden. Dat heeft ingrijpende gevolgen, want het betekent dat de student voor de herkansing waar hij voor slaagt de stof even goed beheerste als voor de voorgaande tentamens waar hij voor zakte (door pech). Met andere woorden: herkansingen leveren niets productiefs op, kosten slechts tijd en energie. Desondanks kun je het onder een conjunctieve examenregeling (voor elk vak slagen) niet zonder

herkansingen stellen, omdat dan ófwel het over-all niveau niet te handhaven is, ófwel zeer veel studenten ten onrechte niet voor het examen zullen slagen. Herkansingen zijn hier een noodzakelijk kwaad.

Het is natuurlijk wel mogelijk om dat noodzakelijk kwaad door geschikte maatregelen een stukje in zijn vervelende effecten te beperken. Bijvoorbeeld kan dat door herkansingen niet pas na drie maanden of zelfs nóg langer te geven, maar snel, zeg na een week. Daardoor zal weliswaar gretiger van de herkansingsregeling gebruik gemaakt worden, waaraan iets te doen is door een kleine bijstelling van die formele grens zakken-slagen, maar zal het totale tijdverlies teruggebracht kunnen worden zónder het 'niveau' aan te tasten. Het doorzichtiger maken van de tentamensituatie helpt ook drastisch:

door het geven van proeftoetsgelegenheid, het geven van voorlichting over het soort vragen waaruit het tentamen zal bestaan, e.d., wordt het de student mogelijk een scherper tentamenstrategie te volgen, met minder zak- risico's (zie Wilbrink 1980b hoofdstuk 4).



8. Uiteindelijk zullen examens compensatorisch moeten worden, waar alleen het over-all resultaat van belang is. Voor afzonderlijke vakken is een opzet als Individueel Studie Systeem een middel om verspillende herkansingen te voorkomen.

Wanneer de herkansingen onder een conjunctieve examenregeling noodzakelijkerwijs tot tijdverlies leiden, is het zaak uit te kijken naar een ander soort examenregeling waarin geen herkansingen (op deze schaal) meer voorkomen. Het voor de hand liggende alternatief is een compensatorische examenregeling, waarin het cijfergemiddelde over alle vakken tezamen aan een vastgesteld minimum moet voldoen om te slagen.

Met een compensatorische examenregeling kan hetzelfde afstudeerniveau gerealiseerd worden, maar dan zónder herkansingen dus zónder tijdverlies.

Het is niet noodzakelijk om bij een compensatorische regeling iedere herkansingsmogelijkheid voor afzonderlijke vakken af te schaffen, maar het is wel het meest logisch om de regeling zo op te zetten dat voor ieder vak of deelvak maar één tentamengelegenheid geboden wordt. om dat behoorlijk te laten verlopen moet er wel voldoende doorzichtigheid aan de student geboden worden, bijvoorbeeld door proeftoetsgelegenheid.

Verschillende varianten zijn denkbaar: mét of zónder dossierdiploma; mét of zónder de mogelijkheid om langer over de studie te doen dan de studieduur; eventueel met herkansingsmogelijkheden of minima per vak. De laatste varianten zijn van belang voor korte programma's zoals in de propedeuse, zie Wilbrink (1978, hoofdstuk g). De tijdbesparing van een compensatorische regeling t.o.v. de conjunctieve kan aanzienlijk zijn, zeg zo'n 10 tot 20 procent. Het hoeft geen betoog dat in zowel persoonlijke als maatschappelijke kosten/baten dat aanzienlijke sommen gaat belopen.

Een heel ándere mogelijkheid om aan onproductieve herkansingen te ontkomen is door het hanteren van een Individueel Studie Systeem opzet voor afzonderlijke vakken. Dit is een soort contractonderwijs waaraan geen afsluitend tentamen verbonden is, tenminste niet een tentamen waar de student nog eens voor zou kunnen zakken in de klassieke betekenis. Zo'n ISS is niet voor ieder vak geschikt, is ook niet een volledig antwoord op de problematiek van de herkansingen, maar laat zich zeker met een compensatorische regeling combineren. Enige studie over compensatorische regelingen is te vinden in Wilbrink (1978 hoofdstuk 8; 1977 paragraaf 6.6; 1979). Voor de problematiek van zak-slaag grenzen bij toetsen in ISS zie Wilbrink (1980a, c).


Van Naerssen, R.F. Het derde tentamenmodel met een toepassing. Tijdschrift voor Onderwijs Research, 1976, 2, 161-171.

Wilbrink, B. Cesuurbepaling. Amsterdam: COWO, 1977. html

Wilbrink, B. Studiestrategieën. Amsterdam: COWO, 1978. html

Wilbrink, B. Universitaire examenregeling: conjunctief of compensatorisch? in K.D. Thio en P. Weeda (redactie) Examenproblematiek. Stichting voor Onderzoek van het Onderwijs. Den Haag: Staatsuitgeverij, 1979. html

Wilbrink, B. Enkele radikale oplossingen voor kriterium gerefereerde grensskores. Tijdschrift voor Onderwijs Research, 1980, 5, 112-125. a. html

Wilbrink, B. Passing scores on domain referenced tests: an improved decisiontheoretic methodology for optimization. Amsterdam: COWO, 1980 c. pdf

Wilbrink, B. Cesuurbepaling (2e versie). Amsterdam: COWO, 1980 b.

Wilbrink, B. Uitval en vertraging in het W.O.: een overschat probleem. Onderzoek van onderwijs, 1980, 9 nr. 4, in druk. d. html



9-2004 \ contact ben apenstaartje benwilbrink.nl

Valid HTML 4.01!   http://www.benwilbrink.nl/publicaties/80BeleidTentamensSNC.htm