Er zitten duistere kanten1 aan het cijfergeven zoals dat in de moderne tijd (na ca 1850) in het onderwijs in gebruik is geraakt. Een afgrond van onfatsoen opent zich wanneer winnaars in deze samenleving het over een zesjescultuur bij verliezers gaan hebben2. Dat cijfergeven verhult een maatschappelijke ideologie van winner takes all, die grote delen van de jeugdige bevolking wegzet als minder waardevol voor de samenleving, of zelfs als waardeloos.3 Er komen geen grote ideologen aan te pas: de ideologen zijn wijzelf. We zetten de ideologie voort door onze geschiedenis niet te kennen4. Inderdaad: ook A. D. de Groot — 1966: Vijven en zessen — vroeg zich in zijn aanklacht tegen het cijfergeven geen moment af wat de historische wortels van dat cijfergeven waren (persoonlijke mededeling). Geeft die kennis ons macht? Laten we eens zien.
Na het overlijden van zijn bejaarde rector in 1903 kon het Stedelijk Gymnasium van Groningen, als laatste in Nederland, het traditionele rangordenen vervangen door het cijfergeven. Zoiets suggereert dat er een wereld van verschil ligt tussen rangordenen en cijfergeven, en waarschijnlijk was dat in de beleving van leraren inderdaad het geval. Wat moeten we ons voorstellen bij dat rangordenen? In Groningen hield iedere leerling in een puntenboekje niet alleen bij hoeveel fouten hij zelf in zijn werkjes had gemaakt, maar ook de fouten van de andere leerlingen in de klas5. Aan het eind van het jaar werd de leerling met de minste fouten gelauwerd, en kreeg hij een prijsboek6. De bedoeling is duidelijk: dat rangordenen moet motiverend werken. Het is een middeleeuwse humanistische onderwijsvernieuwing, ter vervanging van het (lijfelijk) straffen en vernederen — met de plak, de ezelsmuts — van de blunderende leerlingen. Maar motiverend werkte het alleen voor wie een reële kans op een goede eerste of tweede plaats had. Voor de anderen werkte het systeem, tot frustratie van pedagogen door de eeuwen heen, juist demotiverend. Geen lijfstraffen, maar wel vernedering. Denk nu niet dat rangordenen op zich een hopeloos ouderwets iets is: we doen het zelf dagelijks, op tal van manieren7, niet de minste daarvan is het rangordenen bij selectie en sollicitaties8. Waarom is er in het onderwijs dan van dat rangordenen afgestapt?
De klassikale opbouw van het curriculum is een uitvinding van de Zwolse Joan Cele (eind 14e eeuw)9. Voor het cijfergeven is zo’n uitvinder niet aan te wijzen, maar bij de Franse agrégation is er een stapsgewijze ontwikkeling van rangordenen naar cijfergeven geweest10. De eerste stap is om de rangorde zelf onafhankelijk te maken van het aantal kandidaten: orden altijd van 1 naar 10, en maak dus gelijke groepjes voor iedere categorie. U voelt hem al: stap twee is om de extreme scores niet te gebruiken wanneer het gevoel bestaat dat de kandidaten dit niet verdienen. Hoe schitterend is dit, in de eeuw waarin de wetenschap alles kan kwantificeren: het blijkt mogelijk om ook prestaties van kandidaten zo te kwantificeren. Let op wat er nu is gebeurd. Bij het rangordenen is er weinig vrijheid voor de leraar om een eigen oordeel toe te voegen, anders dan slechte punten voor gedrag uit te delen — strafpunten. Bij het cijfergeven is er juist veel vrijheid om cijfers te spreiden en om streng te zijn11. In de beleving van Nederlandse leraren is dat misschien niet zo, tot zij A. D. de Groot lezen, en inderdaad kunnen zij niet te ver afwijken van de impliciete normen die collega’s gezamenlijk stellen, ook via landelijke examens12. Impliciete normen als resultante van de vigerende onderwijscultuur, zijn normen die een rationele grond missen. Het cijfergeven is een versluiering van wat in wezen nog altijd het oude bekende tellen van fouten is, en dan rangordenen. Optimisme uit de 19e eeuw. Nepwetenschap. Zesjescultuur. Wie zijn daar de winnaars en verliezers van?
* Deze blog is geschreven op uitnodiging van Pim Pollen, CBE-groep. Voor mij was dit een mooie gelegenheid om een poging te doen het fenomeen ‘cijfergeven’ eens in een paar honderd woorden tot zijn kern terug te brengen. En dat tegelijk zo te doen dat belangstellenden in het onderwijsveld met deze kennis beter gewapend zijn bij de informatiestroom over cijfers, normen, en ‘de lat omhoog’ die bijna dagelijks over ons wordt uitgestort. Een aansporing ook voor de werkers in het onderwijsveld om sweeping statements over het onderwijs door te prikken: vraag naar onderbouwing, empirisch onderzoek, bronnen; kijk naar wie welke belangen heeft bij wat er wordt beweerd. Doorvragen tot er antwoorden komen, en anders de onzin laten vallen. Ook de anglicismen meteen maar uitbannen, geen sweeping statements meer, geen verheerlijking van alles wat uit angelsaksische kranten komt. Behalve dan het epitheton winner takes all, typisch van angelsaksische origine, het toppunt van meritocratie.
André Chervel (1993). Histoire de l'agrégation. Contribution à l'histoire de la culture scolaire. Paris: INRP Editions Kime.
James S. Coleman (1990). Foundations of social theory. Harvard University Press.
James S. Coleman (1994 unpublished). What goes on in school: A student’s perspective. html
Willem Frijhoff (1992). Universities: 1500-1900. In Clark, B. R., & Neave, G. R. (Eds.). The encyclopedia of higher education. Pergamon Press. II 1251-1259.
A. D. de Groot (1966). Vijven en zessen. Wolters-Noordhoff. (Een latere, mede door Wynand Wijnen geredigeerde heruitgave beschouwde De Groot niet als zijn eigen boek: hij drukte mij op het hart naar de originele uitgave van 1966 te verwijzen)
A. D. de Groot (1970). Some badly needed non-statistical concepts in applied psychometrics. Nederlands Tijdschrift voor de Psychologie en haar Grensgebieden, 26, 360-376. Didakometrisch en Psychometrisch Onderzoek, juni 1970. http://goo.gl/7ZgrN.
P. J. van Herwerden (1947). Gedenkboek van het Stedelijk Gymnasium te Groningen. Wolters.
Khen Lampert (2013). Meritocratic Education and Social Worthlessness. Palgrave Macmillan. site — [(nog) niet in KB eBooks] — sample chapter
Amy N. Langville & Carl D. Meyer (2012). Who's #1? The Science of Rating and Ranking. Princeton University Press. isbn 9780691154220 site
Robert F. van Naerssen (1970). Over optimaal studeren en tentamens combineren. Openbare les. Amsterdam: Swets en Zeitlinger, 1970. html
J. Spoelder (2000). Prijsboeken op de Latijnse school. Een studie naar het verschijnsel prijsuitreiking en prijsboek op de Latijnse Scholen in de Noordelijke Nederlanden, ca. 1585-1876, met een repertorium van wapenstempels Dissertatie Nijmegen. APA-Holland universiteits pers site. [voor de volledigheid hier vermeld; ik heb dit boek nog niet in handen gehad]
B. Wilbrink, W. van Hoorn, L. J. Th. van der Kamp en J. A. Algera (1990). Selectie voor politie-officier. Een onderzoek naar de selectieprocedure voor de toelating tot de Nederlandse Politie Academie. Stichting Centrum voor Onderwijsonderzoek van de Universiteit van Amsterdam - rapport 245 html
Ben Wilbrink (1992). Modelling the connection between individual behaviour and macro-level outputs. Understanding grade retention, drop-out and study-delays as system rigidities. html
Ben Wilbrink (1992). The first year examination as negotiation; an application of Coleman’s social system theory to law education data. html
Ben Wilbrink (1994). Arbeidsmarkt en hoger onderwijs: een blijvend problematische relatie. Tijdschrift voor Hoger Onderwijs, 12, 24-32. html
Ben Wilbrink (1994b). Wat met verbeteringen in de selectie-procedure is te bereiken: sekse-partijdigheid en rendement. In Edith van Eck, Ard Vermeulen en Ben Wilbrink: Doelmatigheid en partijdigheid van psychologisch onderzoek bij de selectie van schoolleiders in het primair onderwijs. Amsterdam: SCO-Kohnstamm Instituut. (rapport 359) html
Ben Wilbrink (1995). Leren waarderen: de geschiedenis. (SVO project 94707) http://goo.gl/mDJoK
Ben Wilbrink (1997). Assessment in historical perspective. Studies in Educational Evaluation, 23, 31-48. >html
Ben Wilbrink (1997b). Opsomming van de discussie over toelating bij numerus fixus-studies. Bijlage 3 bij Rapport van de commissie Toelating Numerus Fixusopleidingen (voorzitter P. J. D. Drenth) 'Gewogen loting gewogen.' 1997, p. 121-204. Sdu Servicecentrum. html
Ben Wilbrink (1997c). Terugblik op toegankelijkheid: Meritocratie in perspectief. In Marian van Dyck: Toegankelijkheid van het Nederlandse onderwijs. Studies (p. 341-384). Onderwijsraad. html
Michael Young (1958). The rise of the meritocracy, 1870-2033: An essay on education and equality. Thames and Hudson.
de onderstaande tekst van 1600 woorden moet ik reduceren tot circa 600 [is ondertussen gebeurd, dus] door een selectie uit de onderwerpen te maken. Waar ik aan denk is het volgende (en op basis daarvan schrijf ik een nieuw stuk):
De blog-tekst zal circa 600 woorden zijn, de deadline hiervoor is 23 juni. Mijn voornemen is om op termijn een artikel te schrijven, een tekst van 2000 tot 2500 woorden zeg maar, mogelijk toch weer korter dan dat, voor bijvoorbeeld Didaktief.
Zesjescultuur? Wie zeggen dat?
Het zijn boven ons gestelden die het woord ‘zesjescultuur’ in de mond nemen. Toch hebben juist zij vaak de voorwaarden voor die zesjescultuur geschapen — met perverse prikkels of uit liefdeloze onverschilligheid. Of uit overtuiging: wie niet mee kan of wil komen, is waarde-loos (Lampert, 2013). Ik zou hier kunnen stoppen, maar toch wil ik ook een ander verhaal doen. Heeft die zesjescultuur dan misschien te maken met een machtsspel tussen onderwijsveld en politiek, tussen leerlingen en leraren, tussen scholen en inspectie? En kunnen we dat misschien ook speels opvatten?
Maar wacht even, wat is er bedoeld met zesjescultuur? Laat ik het zo beschrijven: het gaat om een vermeende overmaat aan prestaties die nipt voldoende zijn (vandaar de zesjes) of anderszins middelmatig. Het is dus nogal een generalisatie, die zeker geen recht doet aan de inspanningen van velen.
Het is goed om te bedenken dat cijfers staan voor judicia, zoals ‘twijfelachtig’, ‘goed’ en ‘cum laude’. Want dat roept meteen de vraag op: wat is ‘goed’? Wat is ‘twijfelachtig’? Dan doel ik niet op die onderwijsminister die voor de oorlog de betekenis van de ‘5’ veranderde van ‘even voldoende’ naar ‘bijna voldoende’ (Bartels 1963). De waardering kan zijn voor het resultaat dat de leerling neerzet, rekening houdend met zijn capaciteiten — toegevoegde waarde, zouden we kunnen zeggen. Of slaan op een absolute standaard die ergens is vastgelegd — wat de commissie-Meijerink ons heeft proberen te verkopen. Het gekke is dat we al heel lang een volkomen andere manier van waarderen gebruiken: een meritocratische (Young, 1958) waarin vooral telt of prestaties ‘beter’ zijn dan die van anderen.
‘Zesjescultuur’: dat gaat over cijfergeven en cijfers halen. Weet iedereen dan waarover we het hebben? Weten de cijfergevers het zelf? Velen kennen het boek bij uitstek over dat onderwerp: ‘Vijven en zessen’ van A. D. de Groot (1966). Hij beschrijft hoe lerarengroepen binnen de school elkaar aftroeven op het punt van aandacht en tijd die zij van de leerlingen krijgen: dat gaat via het cijfergeven. De Groot moest bekennen—op mijn rechtstreekse vraag—dat het niet bij hem was opgekomen om te zoeken naar de wortels van dat cijfergeven. Dat is verrassend. Het geeft ook aan dat vrijwel niemand van de cijfersgevers uit kan uitleggen waar zij precies mee bezig zijn.
Waarschijnlijk is ons cijfergeven in de 19e eeuw ontstaan uit het vigerende stelsel van rangordenen. In Groningen ging dat zo: iedere leerling hield in een eigen boekje de gemaakte fouten bij, niet alleen van hemzelf, maar ook van de klasgenoten; bij de afsluiting van het jaar werd de leerling met de minste fouten gelouwerd en beloond met een prijsboek. In de geschiedenis van de Franse concours d’agrégation wijst Chervel (1993, p. 136 e.v.) aan hoe eerst de rangorde van slechtst naar best werd gestandaardiseerd tot een rangorde op het beperkte bereik van 1 tot 10 in plaats van dat van 1 tot het aantal deelnemers, en hoe vervolgens de extreme scores ongebruikt werden gelaten wanneer de indruk bestond dat de slechtse kandidaten die lage scores eigenlijk niet verdienden, of de beste de hoogste scores. Eenmaal in gebruik, kon elders dat moderne systeem worden overgenomen. In Nederland was het Stedelijk Gymnasium van Groningen de laatste die het rangordenen verving door cijfergeven (in 1903).
Het rangordenen is een pseudo-objectief systeem om leerlingen te motiveren hun uiterste best te doen. Maar zo werkte het eeuwenlang niet, omdat alleen de nummers een en twee, soms ook drie, een beloning kregen in de vorm van een kostbaar prijsboek. Pedagogen hebben hier altijd mee in hun maag gezeten, omdat zij ook wel zagen dat dit systeem ontmoedigend is voor bijna alle andere leerlingen. En dat heeft weer met het klassikale onderwijs te maken, in de 19e eeuw door de staat dood-geüniformeerd, maar ooit in Zwolle als een briljante vernieuwing ontstaan. Joan Cele, vriend van Geert Groote, ontwikkelde in de 14e eeuw een curriculum op basis van niveaugroepen. Hij moest wel, hij had tot wel 900 leerlingen uit deze Europese streken. Maar zijn groepen waren heterogeen naar leeftijd, zijn lessen bestonden maar uit een vak — Latijn — en leerlingen konden halfjaarlijks naar een volgende groep wanneer ze de stof kenden (een soort leren-voor-beheersing). Bij Cele is iedere onderwijsgroep een tamelijk homogene groep, waarin het wel degelijk eerlijk kan zijn om met een prijzensysteem op basis van rangordenen naar gemaakte fouten, whatever, te werken. Ergo, wie in het huidige klasssikale systeem met competitie wil werken, moet dat niet op individueel niveau doen, maar de klas verdelen in twee gelijkwaardige groepen die met elkaar de sportieve strijd aangaan. Ha, dat gebeurde zo ook aan de Leuvense universiteit, in de eeuw van Erasmus: strijd tussen de vier pedagogieën: het Varken, de Lelie, de Burcht en de Valk.
Cele onderzocht zelf halfjaarlijks welke leerlingen naar een volgende groep konden, en ik stel me zo voor dat hij vooral een abolute maatstaf hanteerde. Waarschijnlijk was de gemiddelde verblijfsduur in een Cele-klasje iets meer dan twee keer een half jaar, zoals ook aan universiteiten een collegecyclus in de regel vaker dan een keer werd gehoord.
Het interessante van dat rangordenen van leerlingen is dat de leraar naast het beoordelen van wat goed of fout is, weinig ruimte heeft voor een eigen subjectief oordeel. Dat verandert met de overgang van rangordenen naar cijfergeven radicaal, ook al blijft het oordeel van goed of fout de basis. De leraar heeft nu grote vrijheid om te spelen met de cijferschaal. In eigen land zien we dat meteen gebeuren in Thorbecke’s Hogere Burger School: leraren veroordelen altijd bijna een kwart van de leerlingen als ongeschikt — ongeschikt voor toelating, voor de overgang, in het eindexamen (Posthumus, De Gids 1940). Het kan vriezen of dooien, wereldoorlog of niet, industrialisatie, depressie: altijd wordt bijna een kwart als ongeschikt veroordeeld. Het gekke is dat de HBS-leraren met deze starre gewoonte zichzelf collectief hebben beroofd van de mogelijkheid om over de boeg van het cijfergeven behoorlijk beleid te voeren. Zesjescultuur in optima forma.
Is dat mogelijk: het cijfergeven gebruiken om te sturen? Ja, James Coleman heeft in zijn Foundations of Social Theory laten zien hoe je dat kunt onderzoeken. Ik heb dat onderzoek gedaan voor propedeusestudenten in Amsterdam zie hier. Er is sprake van een collectieve onderhandelingssituatie. En eigenlijk weten we dat ook al wel: wanneer alle studenten de lijn gaan trekken, is het voor docenten lastig om daar goed op te reageren. Iets anders is: hebben docenten in de gaten hoe dit spel wordt gespeeld? Maken zij eigenlijk wel goed gebruik van de situatie? Nee, dus.
Nu wil het geval dat Robert van Naerssen al veel eerder (1970) een tentamenmodel ontwikkelde dat uitgaat van de eenvoudige waarneming dat studenten zich strategisch voorbereiden op hun tentamen — soms of vaak door op een ‘zesje’ te mikken — en van de al even eenvoudige slotsom dat het voor docenten dus mogelijk moet zijn om met de inrichting van hun toetsen en vooral ook van de examenregeling, dat strategische gedrag te beïnvloeden. En daarmee dus ook de studieresultaten en het studierendement. Kortom: de heilige graal waar iedereen nog steeds naar op zoek is. En soms wordt hij gevonden, zoals hier. In deze judo met ‘zesjescultuur’ van studenten is het de kunst om tot een win-win-situatie voor iedereen te komen. En dat blijkt dus mogelijk te zijn.
En dan de zesjescultuur als dans net boven de grens voor wat nog juist als voldoende wordt beoordeeld. Die dans is heel riskant, want een toets is meestal maar een armzalige steekproef, de kandidaat weet zelf niet exact hoe goed de stof erin zit, dus dat verwachte/gehoopte zesje kan ook zomaar een vier zijn. Op zich is dit nog moreel neutraal: zowel de hardwerkende marginale student, als het luierende talent heeft ermee te maken. Op zich hoeft de geringe trefzekerheid van toetsen geen moreel probleem te zijn; Edgeworth wees er in enkele belangrijke artikelen eind 19e eeuw al op dat de kandidaten door extra inspanning de eigen kansen op succes immers kunnen vergroten. A. D. de Groot wees er in 1970 op dat de docent/de instelling/het Cito dan wel de morele plicht heeft ervoor te zorgen dat kandidaten zich inderdaad doeltreffend op de toets kunnen voorbereiden. De Groot heeft er dus geen probleem mee dat er op zesjes wordt gemikt: dat is eigen verantwoordelijkheid van de kandidaten, en tot op zekere hoogte is het de plicht van de docent om dat mogelijk te maken. ‘Tot op zekere hoogte’ betekent bij De Groot: de kandidaten moeten zelf het risico kunnen dragen dat ze ondanks een adequate voorbereiding zakken.
Het is dus allemaal een spel, met spelregels voor beide partijen. Maar ook bloedserieus voor de relatief zwakke studenten (die er ook zijn in topopleidingen zoals wiskunde, vliegtuigbouw): kunnen zij echt wel het vege lijf redden door met veel inspanning die zesjes te halen? Of lopen ze cumulatief steeds grotere achterstanden op? Bij vakken die een cumulatieve kennisopbouw hebben zou dat best eens het geval kunnen zijn, en zouden juist de zwakkere studenten voor de hogere cijfers moeten gaan.
Laat ik het niet vrolijker maken dan het is: met ‘spel’ bedoel ik dat er heldere spelregels zijn: voor een voldoende resultaat moet je tenminste een ‘6’ scoren (al dan niet gemiddeld). Is dat eerlijk? Binnen het meritocratisch gedachtengoed: ja. Edgeworth, grondlegger van de mathematische statistiek, legde dat eind negentiende eeuw al uit: de leerling kan de kans om te zakken beperken door zich beter voor te bereiden. Eerlijk genoeg? Nog niet helemaal: voorwaarde is dat de leerling dat ook doeltreffend moet kunnen, zoals A. D. de Groot in 1970 bepleitte. En ceteris paribus: veronderstellend dat al het andere gelijk blijft of als gegeven moet worden beschouwd; maar waarom zouden we dat doen? Verander die examenregeling en toetsgewoonten. Verander het onderwijsstelsel.
http://www.benwilbrink.nl/publicaties/zesjescultuur.htm http://goo.gl/0G3f1