Rapport SVO (Stichting voor Onderzoek van het Onderwijs) subsidie #94707 aan SCO-Kohnstamm Instituut

Leren waarderen:
de geschiedenis

Ben Wilbrink

1996


Inhoud

Inleiding
Waarom geschiedenis?
Wat het wil zeggen iets te 'weten'
Joan Cele, de 14e-eeuwse vader van het westerse klassikale lesprogramma
Examens aan de middeleeuwse Parijse universiteit
Het dispuut: een verloren onderwijs- en examenvorm
Straf of beloning; punten- en cijferstelsels
Competitieve examens en de staat
Chinese examens als voorbeeld voor de westerse?
Synthese en discussie
Referenties




Inleiding

Prestaties waarderen met cijfers is in het onderwijs heel gewoon, zo gewoon dat deze vorm van waarderen ook buiten het onderwijs makkelijk is te gebruiken, maar wie wanneer en waarom dat waarderen met cijfers heeft uitgevonden, daarvoor is in de literatuur nauwelijks aandacht. Misschien was het Cambridge's William Farish in 1790, die suggereerde dat waarderen met cijfers tot minder discussie zou leiden bij het bepalen van de rangorde van examenkandidaten (Hoskins, 1979, p. 243). Hoe dat ook zij, zeker is dat hedendaagse cijfergevers onbekend zijn met de historische wortels van het cijfergeven, en dat zij zich van dat niet-weten onbewust zijn. Deze niet als zodanig ervaren leemte in de kennis van het dagelijkse cijfergeven maakt reflecteren op het eigen professionele handelen van de docent, en dat van de toetsdeskundige, er niet makkelijker op. Een zekere bedrijfsblindheid voor het bijzondere karakter van onze beoordelingsgewoonten is een speciaal geval binnen de thematiek van de culturele psychologie waarin de relatie tussen denken en cultuur wordt geproblematiseerd (Rogoff & Chavajay, 1995).

Bij het beoordelen in het onderwijs zijn sommige praktijken zo vanzelfsprekend dat het idee alleen al om ze ter discussie te stellen niet opkomt, terwijl tegelijk over andere beoordelingspraktijken heftige debatten worden gevoerd door wetgevers en andere betrokkenen. Hoe docenten met eigen toetsen en overhoringen beoordelen is zo vanzelfsprekend geworden dat alleen over technieken nog discussie plaatsvindt. Landelijke gestandaardiseerde toetsen zijn omstreden en daarover vindt zowel publieke als politieke discussie plaats. De Amerikaanse beweging voor authentiek toetsen (Berlak et al., 1992; Wiggins, 1993) probeert door docenten zelf gemaakte toetsen terrein terug te laten winnen op gestandaardiseerde toetsen. De Groot (1966) stelt in zijn Vijven en zessen juist het vanzelfsprekende van toetsen en cijfergeven indringend aan de kaak, en vraagt anderen om consequenties aan zijn analyse te verbinden: "Wie bindt de kat de bel aan?" (p. 246).

Debatten vinden plaats in speciale commissies en in tijdschriften, en in de politiek over high-stakes beoordeling van prestaties van scholen. Zo stelde in de 80-er jaren in de Verenigde Staten de Ford Foundation een 'Nationale Commissie voor Testaangelegenheden' in om de effecten van het omvangrijke gebruik van gestandaardiseerde tests en toetsen op de samenleving te onderzoeken; de commissie geeft een serie naar thema's georganiseerde publicaties uit, zoals de bundel van Gifford & O'Connor (1992). In Engeland zijn er zowel positieve als negatieve ontwikkelingen. Tot de positieve behoort die van de Records of Achievement, een ontwikkeling weg van de in Engeland gebruikelijke externe examinatoren naar beoordeling door degene die de leerling het best kent: de leraar (Hall, 1989; Jessup, 1991). Tot de negatieve behoort die van toetsen die de overheid het onderwijs opdringt, zelfs leidend tot een boycot van die toetsen (Blenkin & Kelly, 1992; Harrison, 1995). In Nederland is het toetsen van overheidswege, mandated testing, in 1995 in het voortgezet onderwijs geïntroduceerd, zodat de komende jaren de discussie vooral over die vorm van toetsen zal gaan, en weer niet over hoe leraren didactisch beter verantwoorde vormen van terugkoppeling kunnen gebruiken.
Hoewel er zeker enige bezinning op het beoordelen is, betreft dat vooral de methoden van het beoordelen, niet de vraag waarom er eigenlijk wordt beoordeeld. Ook De Groot en Wiggins laten onbesproken hoe het beoordelen zijn zo prominente plaats in het onderwijs kon krijgen. De antropoloog Hanson (1993) behandelt wèl de geschiedenis van het testen, waaronder toetsen in het onderwijs, beginnend met de laat-middeleeuwse heksenprocessen, en komt via deze historische oefening tot een kritische analyse van de plaats van het testen in de Amerikaanse samenleving. Vanuit disciplines als de antropologie, de sociologie, of het recht zijn inzichten over het beoordelen te verkrijgen die betrokkenen tot nadenken kunnen stemmen. Meer in het algemeen zijn er twee benaderingen die in staat zijn bezinning op eigen gewoonten af te dwingen: vergelijking met andere landen, en historisch onderzoek.

Vergelijkende studies over beoordelen zijn schaars. Over de overgang tussen voortgezet en hoger onderwijs gaan de bundels van Clark (1985), Broadfoot, Murphy en Torrance (1990), en Eckstein en Noah (1992), en de monografie van Eckstein en Noah (1993). Deze studies laten onverwachte verschillen zien tussen beoordelingspraktijken in verschillende landen, en genereren daardoor vragen over de rechtvaardiging van de eigen beoordelingspraktijk; voor antwoord op die vragen is dan wel analyse nodig van de historische en culturele omstandigheden waarbinnen die beoordelingspraktijken elders zijn gegroeid.

De geschiedenis kan een veel directer licht te werpen op de hedendaagse beoordelingspraktijk dan vanuit vergelijkende studies mogelijk is, omdat de geschiedenis veronderstellingen genereert over het waarom van de huidige praktijk. Een degelijke studie over deze historische achtergronden ontbreekt echter. Er zijn wel studies op deelterreinen, zoals Smallwood's (1936) geschiedenis van examens in de Verenigde Staten, of Prahl's (1974) geschiedenis van academische examens in West-Europa. Er zijn enkele signalen gegeven dat een historisch overzicht van testen en toetsen kan bijdragen aan het inzicht in de moeilijke situatie waarin westerse samenlevingen zich nu bevinden, zoals het essay over historische achtergronden van het testen van Webber (1989). Een meer volledig beeld van de geschiedenis van het beoordelen is niet beschikbaar, en zou moeten worden opgebouwd uit materiaal te verzamelen uit vele monografieën, schoolgeschiedenissen, en specialistische studies.

Het doel van dit essay is de belangrijkste thema's te schetsen die een plaats verdienen in de geschiedenis van het beoordelen, en aan de hand van dit materiaal uit te nodigen tot bezinning op de hedendaagse beoordelingspraktijk. Het begrip 'beoordelen' blijft daarbij aanvankelijk open, omdat de historische analyse dit juist vorm en inhoud moet geven. Het vertrekpunt is niet het hedendaagse begrip 'beoordelen' zoals dat is behandeld in Linn's (1989) Educational measurement of in De Groot en Van Naerssen's (1969) Studietoetsen: dat zou leiden tot een vooringenomen historische zoektocht. De literatuur is doorzocht met de bedoeling daarin ontwikkelingen te vinden die zouden kunnen raken aan de betekenis en de zin van het hedendaagse waarderen van leren. Het is een speurtocht naar mogelijkheden. Toch valt er wel een theoretisch kader voor deze zoektocht te formuleren. Zonder het zoeken in te perken op een wijze die tot spijt achteraf kan leiden, is vooraf al met zekerheid bekend dat het 'beoordelen' een begrip is dat niet eenduidig is te definiëren, maar dat staat voor een breed scala van activiteiten die een familieverwantschap met elkaar hebben. Twee varianten van beoordelen zijn de vergelijking van personen en de beoordeling van een enkele persoon. De vergelijking van personen is doel op zich, zoals bij selectie van een tevoren bekend aantal van de besten het geval is; of de vergelijking is functioneel voor een ander doel, zoals waar competitie wordt bevorderd om het leren te intensiveren. Bij de examens in het Chinese keizerrijk gaat het om het eerste, terwijl het bij het prijzenstelsel in de Latijnse scholen om het laatste gaat. De beoordeling van een enkele persoon kent eveneens twee varianten: de vergelijking met een norm, zoals bij selectie zonder getalsbeperking, en de vergelijking tussen twee beoordelingsmomenten, zoals bij het beoordelen van vorderingen. Nieuwe studenten aan de middeleeuwse universiteiten die hun Latijn niet goed kennen - vergelijking met een norm - worden daarin eerst bijgespijkerd door hun meester. Het beoordelen van vorderingen gebeurt vaak informeel in de vorm van lof en blaam die de meester dagelijks uitdeelt. Over vormen en inhouden valt voorafgaand aan de historische zoektocht minder met zekerheid te zeggen, behalve dat vormen uiteenvallen in mondelinge en schriftelijke, terwijl in sommige gilden meesterproeven worden gevraagd. Dat voor de Engelse civil service in de 19e eeuw juist de winnaars van de mathematical tripos examens in Cambridge aantrekkelijke kandidaten waren, is voor de hedendaagse beschouwer een verrassing: die wiskunde zouden de winnaars als topambtenaar zelden meer nodig hebben. De geschiedenis produceert meer van dergelijke raadsels, waar de historische context het antwoord op moet geven. Omgekeerd kan de historische analyse aangeven wat in de huidige beoordelingspraktijk raadselachtig is, omdat de geschiedenis het vanzelfsprekende problematiseert.




Waarom geschiedenis?

De universiteit is na de kerk de oudste instelling in de westerse wereld, en heeft met zijn geschiedenis van meer dan acht eeuwen de twintigste eeuw een aantal tradities geschonken, waaronder die op het gebied van het beoordelen, die de westerse samenleving mede zijn wezenlijke trekken geven. Dat is dan een goede reden om te proberen de historische wortels bloot te leggen van onze manieren van vragen stellen, waarderen met cijfers, bevorderen, en examineren. Kliebard (1995) wijst erop, in zijn essay Why history of education?, dat de geschiedenis niet zozeer leert wat wel en wat niet adequaat is gebleken, maar dat hij bezinning op huidige praktijken vergemakkelijkt. Inzicht verkregen uit historische ontwikkelingen zou ertoe kunnen leiden dat de vraag naar de beste methoden van beoordelen niet meer leidt tot de Pavlov-reactie mogelijke methoden aan te reiken, maar tot de wedervraag: waarom beoordelen?
De respectabele leeftijd van beoordelingstradities suggereert dat zij goed bestand zijn tegen veranderingen in de culturele omgeving, en dat zij weerstand zullen bieden tegen voorgenomen veranderingen in onze tijd. Zo is de kenmerkende organisatie van de school in klassen, met het eeuwige probleem van het zittenblijven, een overgeërfde vorm, niet een bewust gekozen vorm die steunt op onderwijstheorie. Het tegendeel is het geval: zittenblijven bestaat nog steeds, in weerwil van onderzoek dat de ondoelmatigheid ervan heeft blootgelegd (Shepard & Wilson, 1989). In de laatste halve eeuw, zeg sinds Posthumus (1940), is in Nederland het zittenblijven nauwelijks teruggedrongen, gezien de huidige situatie in het voortgezet onderwijs die is onderzocht door Reezigt, Guldemond en Ros (1994).

Universitaire examens en de klassikale groepering van leerlingen zijn voor de hand liggende onderwerpen voor historische analyse. Het idee van schoolklassen en het naar klassen geordende lesprogramma is zes eeuwen oud, zoals hierna wordt besproken. Examens in de 12e eeuw hebben wel kenmerken gemeen met hedendaagse examens, maar dat betekent niet dat zij dezelfde functie en betekenis hebben voor betrokkenen in de 12e eeuw als voor die in de 20e. Het beoordelen moet in zijn historische context worden bestudeerd, alleen dan is het mogelijk te achterhalen hoe een bepaalde praktijk een oplossing kan zijn voor problemen en opgaven waar historische actoren zich voor zagen gesteld.

To assume problem identity through time is, for the historian of ideas, the first step on the road to what may be a most serious falsification of the historical record, for when we misconceive the precise character of a thinker's problems, we are apt to misunderstand the nature of the solutions he proposes. (Laudan, 1977, p. 177)

Ook is het mogelijk dat oplossingen uit het verleden de tussenliggende eeuwen hebben overleefd, terwijl het onderwijs niet meer de bijbehorende problemen kent. Posthumus (1940) wees al op de verbazingwekkende constantie in percentages zittenblijvers in de HBS, ondanks de ingrijpende maatschappelijke veranderingen van de voorafgaande driekwart eeuw.

De bestudeerde periode ligt tussen de vroege middeleeuwen en het einde van de 19e eeuw. De keuze voor de middeleeuwen als aanvangsperiode ligt voor de hand: de westerse cultuur wordt dan opgebouwd, waar er eerder nauwelijks of geen schriftelijke cultuur is. De culturele erfenis van de oudheid speelt daarbij een rol, maar er is in het algemeen geen continuïteit tussen het onderwijs in de oudheid (Marrou, 1948) en dat in de middeleeuwen in het westen (Riché, 1962) of in de moslimse wereld (Dodge, 1962). De twintigste eeuw kent geen opmerkelijke ontwikkelingen in vormen en inhouden van het beoordelen; in deze periode is er sprake van variaties op, en verfijning en verharding van overgeleverde beoordelingspraktijken, in reactie op groeiende deelname aan onderwijs in aantallen en in tijd (Wilbrink & Dronkers, 1993). Zo concludeert Montgomery (1965) in zijn studie over Britse examens dat de huidige examenpraktijk tamelijk direct wortelt in die van Oxford en Cambridge in de vroege 19e eeuw.
Omdat het westen culturele en andere invloeden ondergaat vanuit zowel het verre- als het midden-oosten, zijn ook deze in de studie betrokken. China kent al vanaf enkele eeuwen voor Christus schriftelijke examens voor toelating tot hoge overheidsfuncties. Deze examens hebben zo'n dominante plaats in de Chinese samenleving, dat ook het onderwijs volstrekt ondergeschikt is aan deze examens. Omdat er altijd contacten tussen China en het westen zijn geweest, met uitzondering van enkele eeuwen voorafgaand aan de reizen van de Polo's, is het mogelijk dat het Chinese voorbeeld in het westen is nagevolgd, of tenminste dat het bepaalde ontwikkelingen in het examineren in het westen heeft bevorderd. De moslimse wereld heeft invloed op de westerse omdat zijn culturele ontwikkeling enkele eeuwen eerder plaatsvindt, en er in Zuid-Europa intensieve contacten en in het hoger onderwijs ook vormen van samenwerking zijn geweest.
In zo mogelijk chronologische volgorde komen zeven thema's aan de orde. Het eerste thema is de middeleeuwse opvatting dat kennis alleen kennis is wanneer deze kan worden opgezegd, of wanneer op standaard-vragen standaard-antwoorden kunnen worden gegeven. Het tweede thema is de organisatie van het onderwijs in groepen leerlingen die met ongeveer dezelfde stof bezig zijn, een Zwolse uitvinding, en de beoordelingsvormen waar dat toe leidt. Het derde thema is dat van het universitaire onderwijs en zijn examens in de middeleeuwen. Het disputeren, een niet meer bestaande combinatie van onderwijs en examen, vormt het vierde thema. Het vijfde thema is hoe straf en beloning over de eeuwen heen als motivatie voor de leerlingen zijn gebruikt. Met het zesde thema verliest het onderwijs zijn onschuld: staten oefenen hun invloed uit op het onderwijs om eigen noden te lenigen, en gebruiken daar examens als instrumenten voor. Het zevende thema legt verband tussen deze verloren onschuld en het model van de klassieke Chinese examens; of zou dat verband er niet zijn? Binnen enkele thema's wordt nog afzonderlijk gekeken naar de rol van tijd, omdat er voor leren nu eenmaal tijd nodig is, en er voor de noodzaak om tijd te investeren in het leren niet altijd aandacht bestaat in modellen voor het waarderen van leren. Telkens wordt na een kort overzicht eerst het thema zelf langs historische lijnen uitgewerkt, waarna ook latere ontwikkelingen worden geschetst, en wordt afgesloten met een meer speculatieve verbinding met vergelijkbare situaties in het heden: wat leert het verleden over huidige vormen van beoordelen, welke vragen stelt het verleden aan de vanzelfsprekendheid van de hedendaagse praktijk? De historische studie sluit af met een overzicht, en een verbinding met het algemene toetsmodel zoals dat in deel twee is te ontwikkelen, en met de empirische studie van het beoordelen als een onderhandelingsproces tussen docenten en studenten in deel drie. Het toetsmodel en het empirisch onderzoek benutten de vrijheden die de historische excursie heeft opgeleverd door het beoordelen als studieobject te benaderen buiten de geaccepteerde theorie over toetsen en beoordelen om.




Wat het wil zeggen iets te 'weten'

Geletterdheid betekent in de vroege middeleeuwen in West-Europa dat men belangrijke teksten uit het hoofd kent, en dus ook het Latijn beheerst. Het leren van de Latijnse grammatica gaat in de vorm van vragen en antwoorden, in het onderwijs is dat van begin af aan een dominante didactische vorm, en altijd gaat het dan om uit het hoofd geleerde vragen en antwoorden. Door de eeuwen heen blijft geheugenkennis een belangrijke plaats in het onderwijs houden, ook wanneer het tekort aan (leesbare) manuscripten geleidelijk aan verdwijnt. Wanneer in het begin van de 19e eeuw schriftelijke vormen van examineren opkomen, wil dat niet zeggen dat daarmee uit het hoofd geleerde kennis niet meer belangrijk zou zijn; aanvankelijk is eerder van het tegendeel sprake, gezien de mate waarin er met behulp van repetitoren voor de examens wordt 'gestampt.' Omdat ook in het hedendaagse onderwijs nog een sterke nadruk ligt op uit het hoofd leren, werpt deze historische oefening de vraag op of die nadruk in alle gevallen wel is te legitimeren..

Het onderwijs in de vroege en hoge middeleeuwen is te kenmerken door het uit het hoofd leren van godsdienstige teksten: "Iets weten betekent het uit het hoofd kennen" (Riché, 1989 p. 218). De motivatie voor het leren van bijbelteksten en andere godsdienstige teksten is om zo de kans te vergroten na de dood tot de hemel te worden toegelaten (Hildebrandt, 1992, p. 25). Er zijn ook praktische redenen om teksten uit het hoofd te leren. Niet alleen zijn handschriften schaars en dus niet altijd bij de hand, ze zijn ook moeilijk te lezen: om een tekst te kunnen lezen, moest men deze al kennen, bijvoorbeeld uit de lessen van een meester over die tekst (Lowe, 1926; Bolgar, 1954, p. 111). Ook in de moslimse wereld zijn handschriften dubbelzinnig, daar is het vooral omdat ze alleen in medeklinkers zijn geschreven. De moslimse leerling moet door het opzeggen van een tekst zijn meester bewijzen dat hij de tekst kent, in welk geval de meester hem de bevoegdheid verleent om deze tekst verder te onderwijzen (Berkey 1992, p. 29 e.v.). Het onderwijs dient hier om de culturele erfenis te bewaren en in staat te zijn deze door te geven (Berkey , p. 23 e.v. ). Omdat deze culturele erfenis uit godsdienstige teksten bestaat, is studeren een godsdienstige activiteit (Berkey , p. 55).

In de middeleeuwen heeft veel kennis de vorm van vragen en antwoorden, en dat geldt dan vooral de kennis van de Latijnse grammatica die in deze vorm uit het hoofd wordt geleerd door de jonge monniken. Voor de monniken is het mediteren een belangrijke bezigheid, bestaande uit het opzeggen van godsdienstige teksten. Omdat dit Latijnse teksten zijn moet de West-Europese monnik eerst de Latijnse grammatica leren om ze te kunnen begrijpen (Coleman, 1992, p. 144). Dus leert hij de Romeinse grammatica van Donatus uit het hoofd (Bowen, 1972, p. 211), of een van de eenvoudiger grammatica's voor beginners (Mostert, 1995, p. 110; Post, 1954; Frederiks, 1960, p. 74). Deze grammatica's zijn geschreven in de stijl van vragen en antwoorden, een stijl die al in de oudheid gebruikelijk is, en bijvoorbeeld ook te vinden in de Bijbel in de ondervraging van Adam en Eva (Viola, 1982, p. 12). Fortgens (1956) geeft een voorbeeld uit het begin van de Donaet, een werkje dat

is opgesteld in een soort catechismus-stijl van vraag en antwoord. De eerste zin luidt: Partes orationis quot sunt? Octo. Quae? Nomen pronomen verbum adverbium participium coniunctio praepositio interiecto. (Hoeveel woordsoorten zijn er? Acht. Welke? Naamwoord, voornaamwoord, werkwoord, bijwoord, deelwoord, voegwoord, voorzetsel, tussenwerpsel). Deze partes orationis 'woordsoorten' worden dan achtereenvolgens besproken. (p. 24)

Al dit geheugenwerk is gebaat bij enige ondersteuning: vele handschriften hebben dan ook afbeeldingen die dienst moeten doen als geheugensteuntjes. De kunst van het onthouden (Yates, 1966, The art of memory) wordt in de late middeleeuwen algemeen beoefend. De jezuïet Matteo Ricci probeert zelfs om de Chinezen te overtuigen van het nut ervan voor de voorbereiding op hun examens. De mandarijnen zijn onder de indruk, maar deze technieken slaan in het China van eind 16e eeuw niet aan (Spence, 1984). Toch zijn er ook in de middeleeuwen altijd wel meesters die naast het uit het hoofd leren ook het begrijpen benadrukken; vooral humanisten zoals Erasmus maken daar een punt van (Bot, 1955, p. 54 ).

De meester is druk met het laten opzeggen van teksten, en het stellen van de vragen zoals deze letterlijk in de gebruikte grammatica staan (Bolgar 1954, p. 111); oefening, begeleiding en beoordeling lopen hier nog vloeiend dooreen. Leerlingen ondervragen elkaar met de vragen uit het boek, die ook uit het hoofd worden geleerd. Vragen-en-antwoorden is de dominante didactische vorm in het middeleeuwse onderwijs. De juiste antwoorden weten op vragen over godsdienstige teksten is van groot belang. Uit dit soort van vragenstellen groeit de catechismus, en daaruit weer wat later de catechetische methode wordt genoemd. Een bijzonder voorbeeld van dit type ondervraging is het tweedaagse examen dat Arminius had te ondergaan voordat hij zijn leerstoel in Leiden kon aanvaarden (Schotel, 1875):

"Daarenboven zou Arminius tot doctor in de godgeleerdheid (een eere die vóór hem aan niemand bewezen was) worden bevorderd, voor en aleer hij in de Universiteit mocht profeteren en lezen, en bij die gelegenheid de examinatie van doctoren in de theologie in 't byweesen van den geheelen senaat der Universiteit moeten ondergaan.'' (curatoren aan de Heeren van Amsterdam.) Het examen "duurde twee dagen en eindigde met de schriftelijke verklaring van Gomarus, Arnoldus en Helmichius: 'dat Arminius niets had verclaert dat zoude mogen strijden met de confessie of catechismus, waarop zij elkander de hand gegeven en Arminius met die professie geluc gewenscht hadden.'" (p. 76)

Deze archetypen van beoordelen zijn tot in de 19e eeuw dominant in het onderwijs, ook in het hoger onderwijs (Foden, 1989, p. 12). In Harvard worden omstreeks 1650 de ochtenden gebruikt voor het opzeggen van lessen (Rudolph, 1977, p. 31), zoals omstreeks dezelfde tijd ook aan de Illustre School van Den Bosch gebeurt onder zijn eerste oprichter Maresius (De Haas, 1926, p. 112) Pas in de tweede helft van de 19e eeuw wordt in de Amerikaanse colleges het opzeggen vervangen door voordrachten van de docent of door groepsdiscussies (Rudolph, p. 144). In de colleges wordt in feite niet beoordeeld: in de koloniale tijd zijn de mondelinge examens bedoeld om indruk te maken op het toegestroomde publiek, en niet om studenten te toetsen in de huidige betekenis van dat woord (Rudolph, p. 245). Pas na 1830 worden in Yale en Harvard schriftelijke examens ingevoerd (Rudolph, p. 146). In Cambridge groeit de vorm van de examens sinds 1770 toe naar volledig schriftelijk, Oxford volgt op enige afstand die ontwikkeling (Rothblatt, 1974, p. 290, 294).

De eerste schriftelijke examens in Cambridge volgen in zekere zin nog de catechetische methode, omdat vragen die verschillende lezingen toelaten worden vermeden: 'om het werk van de studenten nauwkeurig en zonder twijfel te kunnen beoordelen worden verschillen van mening tussen beoordelaars zo mogelijk voorkomen en wordt zorgvuldig omschreven welke kennis van de kandidaten wordt verwacht' (Rothblatt, 1974, p. 292-94). In de eerste decennia van de 19e eeuw wordt de bepalende factor voor de uitslag van de tripos examens in Cambridge steeds meer de snelheid waarmee de student zijn antwoorden kan opschrijven (Ball, 1921, p. 289, 297), wat er op duidt dat de vragen tamelijk eenvoudig en eenduidig zijn. Soffer (1994, p. 159) laat zien hoe in de examencultuur in Oxford het onderwijs in de geschiedenis is aangepast aan het streven van de studenten naar goede examenresultaten: het bestaat, anders dan in continentaal Europa, uit het onderwijzen (en bij examens terugvragen) van wat als historische 'feiten' wordt gepresenteerd. Onschuldig is deze misvorming van examens en het onderwijs allerminst, omdat de Civil Service op deze manier voor een levenslange loopbaan medewerkers recruteert die een misvormd beeld hebben over het verleden van de Engelse staat (Soffer, 1994). Eenvoudig terug te vragen kennis speelt bij examens tussen voortgezet en hoger onderwijs in de meeste landen nog steeds een rol; in Japan is dat nog het meest pregnant, gezien het belang van triviale vragen over gebeurtenissen, plaatsen en namen bij de universitaire toelatingsexamens die in Japan in hoge mate beslissend zijn voor de verdere maatschappelijke loopbaan (Rohlen, 1983, p. 61; Bowman, 1981, p. 305; Takeuchi, 1991, p. 109).


tijd


In de vroege middeleeuwen spelen kloosters een belangrijke rol in het behouden en overdragen van literaire cultuurschatten uit het verleden, hoewel geletterdheid zeker niet beperkt is tot religieuzen (McKitterick, 1989). Tijd wordt beleefd als toebehorend aan de Heer en niet als iets dat naar eigen goeddunken kan worden besteed, maar toch kent het kloosterleven een zekere ongeordendheid van tijdbesteding, waaraan Benedictus met zijn regels voor het kloosterleven een abrupt en definitief einde maakt (Borst, 1993). In de verdere middeleeuwen kent het onderwijs aan Latijnse scholen en universiteiten een strikte dagelijkse ordening. Later verwatert de discipline, en deze zal pas terugkeren in de bureaucratische vormen die staten aan het onderwijs opleggen waarbij, strenger dan Benedictus, ouders worden gedwongen hun kinderen op strikt voorgeschreven tijden en plaatsen staatsonderwijs te laten volgen. Paterson (1989) beschrijft hoe voor Engeland en Schotland de overheid erin slaagt het zich voegen naar de wettelijke voorschriften als normaal, en ongeoorloofd verzuim als abnormaal en dus problematisch en strafbaar gedrag te bestempelen. Herinneringen van Engelse oud-leerlingen uit die tijd schetsen allerminst een beeld van opvoedkundig verantwoord onderwijs, wel van controle van de staat over de kinderen van lagere sociale klassen (Humphries, 1981).

Bijna iedere volwassene in de ontwikkelde landen heeft ervaren dat zelfs in onze tijd een belangrijk deel van het vraag-en-antwoord spel in het onderwijs, en van het beoordelen, bestaat uit het opzeggen of reproduceren van leerstof en het geven van de 'juiste' antwoorden op bekende (soorten) vragen. De meeste gestandaardiseerde toetsen tellen alleen het aantal 'juist beantwoorde' vragen. Het verschil met de middeleeuwen is dat van de kennis van de juiste antwoorden niet meer het zieleheil afhangt, maar wel de verdere loopbaan. De bezinningsvraag is: wat is er zo heilig aan onze leerstof dat het zou rechtvaardigen dat deze (letterlijk) kan worden gereproduceerd en dat er op dergelijk 'weten' maatschappelijk wordt geselecteerd? Het uit het hoofd kennen van feiten, formules en teksten hoort toch eer uitzondering dan regel te zijn. Bloom c.s. (1956), Van Westrhenen (1977), en Wilbrink (1983) werken deze regel constructief uit tot een systematiek voor het formuleren van vragen over gegeven leerstof: Bloom vanuit de psychologie, Wilbrink vanuit de kennistheorie, en Van Westrhenen vanuit een combinatie van beide. In Nederland is deze thematiek nadrukkelijk aan de orde bij de basisvorming, waar sprake is van een accentverschuiving van 'het leren van de stof' naar vormen waarin leerlingen samen met anderen zich actief inzicht verwerven; de poging om de resultaten van dat vernieuwde onderwijs te 'toetsen' wijst erop dat de bezinning op het onderwijs zich (nog) niet heeft uitgestrekt tot de toetsing. Toch is het principe eenvoudig, en eerder door De Groot (1972, p. 45) onder woorden gebracht: "Een belangrijke tweedeling is die in taken waarvoor objectieve, minimale prestatie-eisen kunnen worden gesteld (P), en andere taken waarvoor dit niet kan. Bij deze tweede categorie gaat het alleen om het verricht hebben van bepaalde, gecontroleerde en bijgeschaafde handelingen (H)." Op die handelingen hoort dus niet ook nog eens een toets over handelingen te volgen. In deze gedachtengang zijn eindexamens voor het voorgezet onderwijs verspillend omdat docenten ook zonder examens goed in staat zijn voor hun leerlingen in een einddocument aan te geven wat hun vorderingen (afgeronde handelings-onderdelen) zijn. In Engeland wordt voor zwakkere leerlingen op deze manier gewerkt met de ook met werkgevers afgesproken systematiek van het schooldossier, de Records of Achievement (Broadfoot, 1986). In Nederland is een recente ontwikkeling dat de Stuurgroep Tweede Fase Voortgezet Onderwijs voorstelt, in de geest van De Groot, om het schoolonderzoek te vervangen door een examendossier. Er is aan het einde van de 20e eeuw een groeiend besef dat het in het onderwijs niet alleen om toetsbare kennis gaat, dat het leren voor toetsen en examens een minder dominante plaats in het onderwijs verdient dan het in de 19e eeuw heeft gekregen.




Joan Cele, de 14e-eeuwse vader van het westerse klassikale lesprogramma


De vroege middeleeuwen kennen al scholen, verbonden aan een klooster, parochiekerk, of het hof van een vorst. In de 14e eeuw trekken sommige scholen zoveel leerlingen aan, dat het onderwijs een organisatorische opgave wordt. Zoals Benedictus het kloosterleven met zijn regels ordende, zo brengt dan de Zwolse Joan Cele orde in zijn school door een indeling in acht klassen te ontwerpen. Deze vernieuwing wordt in heel Europa overgenomen, samen met zijn 'examens' voor de overgangen. Voor een lesprogramma met alleen Latijn is zo'n ordening met halfjaarlijkse promotiemogelijkheden functioneel. In later eeuwen komen daar meer vakken bij, terwijl tegelijk de staat deze klassen graag als leeftijdsgroepen ziet. Wat ooit onder Cele een soepel stelsel was, gaat dan wringen en scheuren: zittenblijven wordt meer en meer een probleem, en wat is dan nog de betekenis van 'gewaardeerd leren' wanneer beoordelingen van prestaties kunnen leiden tot zittenblijven?.

Joan Cele is rector van de school van Zwolle van ongeveer 1375 tot 1415, en voert daar belangrijke vernieuwingen door in de organisatie van school en leerstof. Cele is een befaamd meester: hij heeft de zorg voor circa 800 tot 1000 leerlingen in een stad met slechts ongeveer 5000 inwoners (Post, 1954, p. 99, Frederiks, 1960, p. 16). Leerlingen stromen toe vanuit Utrecht, Luik, Vlaanderen, en Duitsland. Cele heeft twee Parijse meesters in de artes ingehuurd om het onderwijs in de filosofie voor de meest gevorderde leerlingen te geven, maar het overgrote deel van de leerlingen is bezig Latijn te leren. Cele lost zijn organisatieprobleem voor dit overweldigend grote aantal leerlingen op door een strikte indeling van zowel de leerlingen als de leerstof in verschillende klassen, wat een belangrijke vernieuwing in het onderwijs is. Ook met deze nieuwe indeling zijn de acht klassen in de school van Cele nog heel groot, zodat binnen iedere klas een indeling in groepen van tien, decuriae, wordt gemaakt (Frederiks, 1960, p. 66; Codina Mir, 1968, p. 60). Iedere groep heeft een aanvoerder die verantwoordelijk is voor het leren en voor de orde; deze aanvoerder wisselt iedere week. Post geeft veel details over de klassikale structuur van het onderwijs van Latijnse scholen in de late middeleeuwen in de Lage Landen. In de tijd van Cele hebben niet alleen de Latijnse scholen een tamelijk ongeordende organisatie en lessenstructuur, ook de universiteit van Parijs heeft in de eerste eeuwen van zijn bestaan lesprogramma's zonder streng voorgeschreven volgorde waarin de colleges over de literatuur voor het betreffende examen 'gehoord' moeten worden. Een aanwijzing voor die rommeligheid is ook het bestaan van repititieboekjes die de stof juist wel op een geordende manier weergeven voor de studenten die vlak voor hun examen staan (Lewry, 1982, p. 102).

De klassikale indeling van Cele maakt een regeling nodig voor de bevordering naar een volgende klas. Er is ieder half jaar gelegenheid om naar een hogere klas te gaan (Codina Mir, 1968, p. 172-3), maar de meeste leerlingen doen meer semesters over een klas. Voor de lagere klassen bestaat het 'examen' voor de overgang uit het door de leerling laten opzeggen van het geleerde; voor de hogere klassen let Cele ook op verkregen inzicht (Frederiks, 1960, p. 86). Kennelijk neemt Cele zelf voor alle leerlingen de overgangsbeslissingen, zoals later in Straatsburg ook rector Sturm deze beslissingen in eigen hand heeft (Bot, 1955, p. 49). Voortaan hebben deze examens in de Latijnse scholen meerdere functies tegelijk: om de leerlingen binnen hun klas een rangorde te geven, om overgangsbeslissingen te nemen, en vooral om de leerlingen te motiveren om hard te werken.

De vernieuwingen van Cele zijn zo belangrijk omdat zijn leerlingen deze vernieuwingen over scholen in Noord- en West-Europa verspreiden. Bij deze snelle verspreiding speelt een belangrijke rol dat vele leerlingen behoren tot de Broeders des Gemeenen Levens van de met Cele bevriende Geert Grote (Van Zijl, 1963), een beweging die investeert in het oprichten van scholen. Ook de universiteit van Parijs neemt deze didactische vormen over. De schoolregels van de jezuïeten, de Ratio Studiorum, zijn geïnspireerd op het voorbeeld van het onderwijs aan de universiteit van Parijs, de modus parisiensis, zodat via de jezuïeten de vernieuwing van Cele over heel Europa wordt verspreid, en zeker niet alleen naar de jezuïeten-scholen (Codina Mir, 1968, p. 319 e.v.). Joan Cele is daarmee de grondvester van het Europese model van klassikaal georganiseerd onderwijs, van examens voor de overgang naar hogere klassen, en mogelijk ook van het rangordenen van leerlingen naar prestaties (Frederiks, 1960, p. 66; Codina Mir, 1968, p. Ch. III, IV; Scaglione, 1986, p. 12; Frijhoff, 1992b, p. 10). Het historische belang van de vernieuwingen die Joan Cele in zijn school aanbrengt is pas onlangs onthuld door het werk van Post, Frederiks en Codina Mir. Zo kon Ariès nog in 1960 een studie over de middeleeuwse ontwikkeling van klassikaal georganiseerd onderwijs presenteren zonder op de hoogte te zijn van de Zwolse vernieuwingen in de 14e eeuw (Ariès, 1960, p. 188-223: Origine des classes scolaires).


tijd


Joan Cele groepeert zijn leerlingen naar hoever ze zijn met de stof, niet naar hoe oud ze zijn. Omdat de leerstof niet uit een veelheid van vakken bestaat, maar slechts uit één vak, levert dat groeperen geen ernstige problemen op. Halfjaarlijks vindt er een hergroepering plaats, leerlingen blijven dus net zo lang in dezelfde 'klas' als ze nodig hebben om de stof te leren die Cele voor die klas heeft geprogrammeerd. Samen met de toch al ongelijke leeftijd waarop leerlingen onderwijs gaan volgen, leidt dit tot klassen die naar leeftijd heel heterogeen zijn samengesteld. Bevorderen naar een volgende klas gebeurt bij Cele dus op de zuivere grondslag dat de stof behoorlijk wordt gekend, niet omdat de stof beter wordt gekend dan andere leerlingen in dezelfde klas doen. In dit systeem is er geen sprake van 'zittenblijven,' al kan het makkelijk gebeuren dat leerlingen eens een half jaar langer in een bepaalde klas zitten dan strikt noodzakelijk zou zijn. Maar wat heet 'strikt'? Omdat het uit het hoofd leren van grammatica of van klassieke auteurs het wezen van dat onderwijs is, is een extra half jaar in een bepaalde klas ook niet direct een verlies. Bovendien is in het in de middeleeuwen gangbare 'leerlinghelpersysteem' (Ackstaller, 1933) iedere leerling belast met het helpen van andere leerlingen zodat er altijd zinvolle taken zijn voor leerlingen die al verder zijn dan anderen.

Hoe anders is dat met hedendaagse curricula die bestaan uit veel verschillende vakken, nog tegelijk onderwezen ook, met ieder een eigen hoge mate van complexiteit, en waar het in vergelijking tot het middeleeuwse curriculum veel meer gaat om het begrijpen van de leerstof. Het is niet onwaarschijnlijk dat een wezenlijk verschil tussen moderne lesprogramma's en de laat-middeleeuwse ligt in de complexe vakkenstructuur van de eerste, en de homogeniteit van de laatste. In de loop der eeuwen komen er andere vakken bij, zodat de voortgang van de leerling in het ene vak uit de pas kan gaan lopen met die in een ander. In de 18e eeuw komt het op sommige scholen voor dat bevorderingen per afzonderlijk vak worden gegeven (Buchinger, 1991: 97). Het begrip 'continuous progress' van Goodlad en Anderson (1963) houdt in dat leerlingen ongehinderd voortgang maken in vakken A en B, ongeacht hun voorgang in vakken C en D. In een middeleeuwse school met alleen vak A is het makkelijk om groepen van ongeveer gelijk gevorderden te maken; in de hedendaagse school is de klassikale organisatie alleen dan zinvol op te heffen, zo waarschuwen Goodlad en Anderson (p. 53), wanneer er een alternatief is waarin ongehinderde voortgang voor verschillende vakken is gewaarborgd. De onmacht van docenten bij het 'uitvoeren' van het klassikale onderwijs, of het gebrek aan professionele richtlijnen bij die uitvoering, blijkt keer op keer uit de opsomming van redenen die zij desgevraagd geven voor laten zitten of juist niet laten zitten van leerlingen. Goodlad en Anderson (1963) ondervroegen docenten, en kregen lijsten met redenen waaruit blijkt dat dezelfde redenen voor de ene groep docenten pleiten vóór zittenblijven, voor de andere juist daartegen. Wald (1986, 125-149) rapporteert hoe 89 schoolleiders onafhankelijk van elkaar denken over zittenblijven als probleem, en mogelijke oplossingen daarvoor: zij denken daar verschillend over, zij hebben bijna ieder hun eigen diagnose en aanbeveling of oplossing. Reezigt, Guldemond en Ros (1994) onderzochten hoe scholen, maar ook leerlingen en hun ouders, omgaan met zittenblijven: net als het weer overkomt het je, er is weinig aan te doen, er is geen beleid (we hebben het altijd al zo gedaan), de regels zijn nu eenmaal de regels. Wat de ene school als positieve effecten van zittenblijven ziet, ziet de andere als negatieve (Reezigt et al., p. 147), daarmee het Amerikaanse onderzoek van Goodlad en Anderson bevestigend.

De 19e-eeuwse klassikale school gaat terug op de vernieuwing van Cele, maar de klassen worden dan op bureaucratische wijze gevormd door voorgeschreven leeftijdscategorieën en verblijfsduren. Op die bureaucratie levert Paulsen (1921, p. 642, 647) kritiek: waar voorheen leerlingen werden bevorderd op basis van hun leervermogen, zijn het in het Duitsland van de 19e eeuw met zijn overbelaste schoolprogramma's en leerlingen de bureaucratische regels waar docenten zich bij het bevorderen naar richten (zie ook Ingenkamp, 1972, p. 24, 42). Al in de 17e eeuw formuleerde Comenius de onderwijsfilosofie die deze moderne schoolorganisatie naar het model van de staande legers legitimeert, althans in de optiek van de staat (Ingenkamp, 1972, p. 16). Ook in Engeland is in de 19e eeuw militaire discipline het parool in het basisonderwijs (Humphries, 1981, p. 71). In de 18e en 19e eeuw komt in de Latijnse scholen in Nederland het bureaucratische staaltje voor dat jonge leerlingen (minores) oude leerlingen (maiores) in dezelfde klas voorbij kunnen streven in prestaties en dus ook bij het behalen van prijzen, zonder dat zij daarmee het recht op overgang naar de volgende klas verwerven (van der Blom, 1978, p. 125). Het hedendaagse klassikale onderwijs is wat zijn essentiële trekken betreft ongewijzigd overgenomen uit de vorige eeuw, waardoor ook de 19e-eeuwse vormen van beoordelen hun bestaan makkelijk tot en met de twintigste eeuw hebben kunnen rekken. Onderwijs dat niet op enige vorm van klassikale organisatie steunt is een uitzondering (Goodlad & Anderson, 1963, theorie van continuous pupil progress; Freudenthal-Lutter, 1964, 1975)..

De geschiedenis laat zien hoe een klassikale ordening in de middeleeuwen functioneel is, maar in een bureaucratisch geordend onderwijs met naar leeftijd opgebouwde klassen, Jahrgangsklassen (Ingenkamp, 1972), en met een groot aantal vakken die de klassikale groep in gelijk tempo moet doorlopen, leidt tot spanningen die zich ontladen in afstromen en zittenblijven. Leraren en schoolleiders geven met hun tegenstrijdige opvattingen over dat zittenblijven aan dat zij met overgangsbeslissingen niet professioneel omgaan; onderzoekers geven aan dat ze dat ook niet kunnen, omdat empirisch onderzoek geen voordelen van zittenblijven heeft kunnen aantonen (Shepard & Wilson, 1989). Een van de belangrijkste beslissingsproblemen voor leraren onttrekt zich aan een rationele benadering omdat betrokkenen niet zien dat het daarvoor nodig is de mogelijke uitkomsten van wel of niet laten zitten tegenover elkaar te analyseren en te waarderen, een besliskundige benadering zoals ook in deel twee wordt aangewend voor de bouw van een algemeen model voor toetsen.




Examens aan de middeleeuwse Parijse universiteit

Tegelijk met de vorming van de eerste universitaire gemeenschappen van meesters en studenten krijgen de universitaire examens vorm. Deze examens zijn een belangrijke en oorspronkelijk Europese vernieuwing: ze worden niet langer door de vertegenwoordiger van de paus, maar door een college van meesters afgenomen. De uitslag van zo'n examen is een afspiegeling van de maatschappelijke positie van de kandidaten, niet van de geleverde prestaties. Zakken voor een examen is er niet bij, behalve op grond van moreel gedrag. Toch moet er wel degelijk worden gepresteerd, daarvoor zorgt de meester van de betreffende kandidaat door hem pas voor te dragen wanneer deze aan de verplichtingen om het examen te mogen afleggen heeft voldaan. Het examen kwalificeert voor het meesterschap, geeft het recht om te doceren, en is dan ook een afspiegeling van de taken van de meester: een college geven, vragen over de stof beantwoorden, en een dispuut leiden. In hedendaagse termen gaat het hier om onderwijs dat bijna als functietraining is te bestempelen, en om examens die nauw aansluiten op de functie-eisen; de functie is het meesterschap. De voorgeschreven boekenkennis en vaardigheid in het disputeren zal de toekomstige meester vrijwel dagelijks nodig hebben, zodat de geldigheid (NIP 1988) of validity (Messick, 1995) van deze examens hoog is, behoudens corruptie en sommige aan leden van de adel toegekende graden..

De middeleeuwse universiteit van Parijs is een organisatie van meesters, in tegenstelling tot de universiteit van Bologna die dan een organisatie van (rijke) studenten is. Toch zijn de meeste Parijse meesters tegelijk ook student: wie afstudeert in de 'propedeutische' artes faculteit is verplicht vervolgens twee jaar als meester in die faculteit te werken, daarnaast kan men als student verder in een van de 'superieure' faculteiten theologie, rechten of geneeskunde. Het is niet mogelijk in Parijs te studeren zonder een meester te hebben (Thorndike, 1944, p. 30), analoog aan het hedendaagse niet kunnen promoveren zonder een promotor te hebben. De pas aangekomen student zoekt allereerst een goede meester. De meester is verantwoordelijk voor zijn studenten, ziet er op toe dat zij hun tijd doorbrengen met studeren en niet in ijdelheid, geeft dagelijks studieopdrachten, en overhoort deze (Schwinges 1992, p. 223). De meester bevordert de onderlinge wedijver door de student met de beste prestatie van de dag te belonen, en de student die de grootste blunder heeft gemaakt belachelijk te maken: hij krijgt de ezelskap. Voor de middeleeuwse student is beoordeeld worden de dagelijkse praktijk (Cobban, 1975, p. 209).

De meester, de magister, heeft de verantwoordelijke taak om studenten die daar voldoende toe zijn voorbereid voor te dragen voor het examen. De examens zijn formele en publieke gebeurtenissen: het komt zelden voor dat een kandidaat wordt afgewezen (Schwinges (1992, p. 235), en als dat al voorkomt dan ligt de reden in het morele gedrag van de kandidaat. De kandidaat wordt ondervraagd op zijn kennis van de voorgeschreven boeken, moet een college geven over een tekst die slechts enkele uren tevoren willekeurig is aangewezen (Weijers, 1987, p. 390), en moet deelnemen in een publiek dispuut. Het examen is daarmee een afspiegeling van de taken waarvoor het examen kwalificeert: die van de meester. In de vroege Duitse universiteiten worden de kandidaten voor het examen in de 'propedeutische' artes getoetst met vragen en antwoorden die in de voorafgaande jaren uitvoerig zijn geoefend (Schwinges, 1986, p. 356). Het niveau van deze examens in de artes is vaak lager dan dat van vele scholen, zoals die van de Broeders des Gemeenen Levens (Schwinges, p. 336). Al in de 13e eeuw zijn er voor de kandidaten voor dit examen repititieboekjes in omloop, waaruit blijkt dat het bij deze examens gaat om eenvoudige vragen en antwoorden (Lewry, 1982, p. 116). Deze boekjes vervullen een behoefte van studenten die kennelijk universeel is, want ook in China worden er in de middeleeuwen boekjes uitgegeven met vragen en antwoorden en met model-gedichten voor de examens voor overheidsfuncties (Hu, 1984, p. 13).

De meester met de groep aan hem toevertrouwde studenten doet denken aan dezelfde vorm die eeuwen eerder in kloosters voorkomt. Een wezenlijke vernieuwing, karakteristiek voor de universiteit als nieuwe instelling, is dat het examen wordt afgenomen door een commissie van meesters die handelen op gezag van de vertegenwoordiger van de paus. Verger (1992a, p. 43) zegt over deze nieuwe universiteiten dat zij de enige instituten zijn die onderwijs en examens nauw relateren en dat dat een van de belangrijke vernieuwingen is die het middeleeuwse universitaire systeem introduceert. De inzet voor het examen is de vergunning om te onderwijzen, de licentia ubique docendi, wat een waardevol certificaat is omdat het de eigenaar toestaat overal in de Christelijke wereld te onderwijzen en studenten te trekken (Bannenberg 1953, p. 12). In de eeuwen voorafgaand aan het ontstaan van de universiteiten verklaart de meester zichzelf bevoegd om te onderwijzen, of heeft hij een geschreven document van zijn eigen meester, terwijl toestemming om te onderwijzen tijdelijk wordt verleend door de plaatselijke vertegenwoordiger van de kerk (Verger, 1992b, p. 145). Het ontstaan van de examens rond 1200, valt samen met een zeker verlies aan autonomie van de individuele meester (Rüegg, 1992, p. 23). De meester wordt afhankelijk van zijn examinerende collega's, alleen zij kunnen immers zijn student voordragen voor de 'vergunning om te onderwijzen.' Een andere manier om de invoering van examens te beschrijven is dat de kanselier van Parijs zijn autonomie bij het benoemen van meesters verliest: er komt nu immers een examen aan te pas dat wordt afgenomen door een commissie uit de universitaire meesters. Voor benoemingen in de theologische faculteit is er zelfs een regelrechte vergelijkende selectie omdat de paus in het begin van de 13e eeuw een numerus fixus van acht plaatsen vaststelt (Rashdall 1895/1987i, p. 466). Geleidelijk groeit er een onderscheid tussen het examen en de benoeming tot meester (Moraw, 1992, p. 247, 254; Rüegg, p. 20). Nog weer later kwalificeren de examens wel voor de betreffende professie, maar geven ze daar nog geen toelating voor, want een academische graad is een kwalificatie die ondergeschikt is aan afkomst en rijkdom (Moraw, p. 246). De nieuwe universiteit met zijn examens definieert voor het eerst in de westerse geschiedenis wat kennis is, en moedigt zo professionalisering aan (Bullough, 1978, p. 508). Hoezeer deze professionalisering op basis van kennis karakteristiek wordt voor de westerse samenleving is door Stehr (1994) gedocumenteerd in zijn Knowledge Societies.

Het universitaire examen is een nieuwe institutie waarvoor geen model bestond, noch in het verleden, noch in enig ander land. Webber (1989, p. 36) suggereert dat dit plotselinge opduiken van examens is bewerkstelligd door contacten met China, zoals van Marco Polo en zijn ooms. Er zijn drie problemen met deze veronderstelling. Ten eerste komen de Polo's pas eind 13e eeuw terug uit China en dan bestaan deze universitaire examens al. Ten tweede zijn er voorafgaand aan de 13e eeuw geen directe contacten van het westen met China omdat pas de postwegen van Dzjenghis Khan die contacten mogelijk maken. Ten derde hebben de Chinese examens geen gelijkenis met die van de universiteiten behalve dat de beoordeling eveneens gebeurt door commissies waarvan de leraar van de kandidaat geen deel uitmaakt. Het verkeer van wetenschappelijke ideeën en van technologie tussen China en Europa, vooral in de oudheid en de middeleeuwen, is bestudeerd door Needham (1954, p. 222).; technologieën vinden inderdaad hun weg van China naar het westen, maar wetenschappelijke ideeën niet. De Moslims hebben wel contact met China in de periode dat het westen dat contact had verloren, maar enige invloed van Chinese examenpraktijken op het hoger onderwijs in de moslimse wereld is in Needham (1980, p. 388-491, p. 416 e.v.) niet te vinden. Een andere mogelijke invloed op het ontstaan van universitaire examens is vanuit het hoger onderwijs in de moslimse wereld, maar daar zijn rond het jaar 1000 de meesters strikt autonoom in het aan hun studenten verlenen van vergunningen om te onderwijzen; de conclusie van Makdisi (1981, p. 224), die de invloeden vanuit de moslimse wereld op die van het westen onderzoekt, is dat de vormen van organisatie van de westerse universiteiten werkelijk vernieuwingen zijn. Needham (1963) denkt wèl dat er sprake is van overdracht van het idee van examens vanuit China via de moslimse wereld naar Europa, en wel voor examens die kwalificeren voor de uitoefening van de geneeskunst; een probleem met de doorwrochte analyse van Needham is dat hij de specifieke vorm van examens niet in zijn beschouwing betrekt, in tegenstelling tot Makdisi. Ook een verband tussen universitaire examens en het afleggen van meesterproeven in sommige gilden is moeilijk te leggen, of het moet zijn als invloed van het universitaire voorbeeld op gildepraktijken. Gilden ontstaan in de 12e eeuw (Epstein, 1991) en dat valt samen met het ontstaan van de universiteiten, die zelf gilden zijn.

De methoden voor het geven van colleges en het bestuderen van de daarin behandelde stof maken het noodzakelijk de colleges over moeilijke boeken meer dan eens in zijn geheel te volgen om de tekst en de commentaren erop goed te kunnen leren. De examenregels schrijven dan ook voor hoe vaak de reeks colleges voor de opgegeven boeken moet zijn gevolgd, bijvoorbeeld de oude logica van Aristoteles twee keer in de gewone colleges en een keer in de cursorische (Thorndike 1944, p. 227). Dit herhalen is een natuurlijk kenmerk van het onderwijs aan de middeleeuwse universiteiten, mede daardoor kunnen de studies ook buitengewoon lang duren, tot wel 16 jaar voor de studie tot en met de theologische faculteit (Verger, 1992a, p. 43).

De middeleeuwse universiteit ordent naar maatschappelijke positie, niet naar studieprestatie, 'verdienste' betreft de positie, niet de prestatie. De juiste rangorde is uiterst belangrijk, zelfs bij de plaatsen die bij de dagelijkse colleges worden ingenomen; rijke studenten kunnen zich plaatsen kopen in de 'bank voor de edelen' (Schwinges, 1992, p. 203, 205 e.v. ). In Parijs worden de examendeelnemers na afloop ook in een rangorde gezet, de locatus, maar deze is allereerst een volgorde naar maatschappelijke positie, en anders is de tijd die men al studeert nog van belang: hoe langer die tijd, des te hoger de positie (Rashdall, 1895 i, p. 459; Schwinges (1986, p. 355; 1992, p. 234). In de middeleeuwse universiteit zijn studieprestaties in de huidige betekenis van belang bij de dagelijkse lessen en overhoringen, en daarmee voor de toelating tot de examens, maar zijn deze in de examens en hun uitslagen niet nadrukkelijk herkenbaar. Prahl (1974, p. 140) ziet de middeleeuwse examencultuur echter wel als een weg voor maatschappelijke mobiliteit omdat althans in beginsel de universiteiten vrij toegankelijk zijn van welke rang of stand men ook is; dat hoeft nog niet te betekenen dat intellectueel presteren een voorwaarde is om examens te halen, wel dat men over voldoende middelen moet beschikken om aan de verplichtingen voor het examen en de kosten van het examen zelf te kunnen voldoen. Overigens komen zeer veel studenten niet eens toe aan de eerste examens, omdat ze maar voor een enkel jaar komen studeren (Schwinges, 1992, p. 196)..

De middeleeuwse universitaire examens zijn niet selectief en evenmin competitief. Het niveau van de examens, althans voorzover de kandidaten niet van adel zijn, wordt in feite bewaakt door de meesters die hun studenten pas voordragen wanneer deze voldoende zijn voorbereid, waarvoor overigens de universitaire regelingen ook de nodige voorschriften geven. Er is dus enige selectiviteit in de studie die voorbereidt op de examens, en dat kan ertoe leiden dat studenten die geen vorderingen maken door hun orde worden teruggeroepen en zo de studie moeten staken (Lansink, 1960, p. 180). Deze examenvorm heeft een hedendaags equivalent in de universitaire promotie, waar niet de promotie zelf maar de lange aanloop ernaar toe selectief is. Het vergelijkende examen is een nog te behandelen ontwikkeling in de moderne tijd. De werkelijke beoordeling van de vorderingen van de studenten gebeurt dan ook in de dagelijkse contacten met de eigen meester. De meester verbetert, controleert, en motiveert zijn studenten, drie functies van de didactische interacties tussen de meester en zijn studenten die al in de middeleeuwen in elkaar verstrengeld zijn. Wie niet meer aan de eisen van de meester kan voldoen, geen lust meer heeft in doorstuderen, geen toereikende financiële middelen meer heeft, of de opdracht krijgt om naar het eigen klooster terug te keren, die staakt de studie. Een universitaire studie is vrijwel altijd een gedeeltelijke studie, vaak zelfs niet meer dan een enkel jaar: het patroon heeft grote gelijkenis met de deelname aan middelbaar onderwijs in de 19e en vroeg-20e eeuw, dat ook maar door weinigen wordt afgemaakt (Ringer, 1979, p. 57). Het in zo'n gedeeltelijke opleiding geleerde is bruikbaar in het verdere religieuze of burgerlijke leven: de middeleeuwen kennen geen klagers over hoge aantallen uitvallers uit de studie, al is er wel zorg over het nodige toezicht op de vaak nog zo jonge en ver weg gezonden studenten (Lansink, 1967). Ook de zonen van de 19e-eeuwse kleine middenstand trokken profijt van enkele jaren hogere burgerschool. De middeleeuwse voorgeschreven herhaling van collegeseries wijst erop dat het hedendaagse zittenblijven wel eens een atavisme zou kunnen zijn, omdat het mogelijk teruggrijpt op een ooit didactisch zinvolle vorm van overdoen van hele cursussen.




Het dispuut: een verloren onderwijs- en examenvorm

De wetenschappelijke cultuur ten tijde van het ontstaan van de universiteiten neemt een verrassend hoge vlucht omdat de dominante theologische cultuur van de kerk zich laat verenigen met het opnemen en op zijn waarheidsgehalte onderzoeken van de geschriften van heidense auteurs uit de Griekse en Romeinse oudheid; het dispuut is het instrument voor het zoeken naar de waarheid. De intellectuele botsingen die volgen uit de vergelijking van heilige en heidense geschriften krijgen de vorm van openbaar filosofisch onderzoek aan de hand van stellingen en de argumenten die daar zowel voor als tegen worden aangevoerd. Op meer neutrale grond hebben deze disputen zich eerder al ontwikkeld op juridisch terrein. Het disputeren is de kern van waar men zich binnen de nieuwe universitaire gemeenschappen mee bezighoudt, zoals wetenschappelijk onderzoek dat is voor de hedendaagse universitaire wereld. Achteraf gezien is het makkelijk het disputeren te kenmerken als de eenzijdige vorm die wetenschappelijk onderzoek in de middeleeuwen aanneemt: die van logische argumentatie, niet die van empirisch onderzoek. Het disputeren vraagt een grote bedrevenheid in het hanteren van logische argumenten (syllogismen) en parate kennis van de filosofische literatuur, waar in de theologische faculteit de parate kennis van de bijbel en van theologische geschriften nog bij komt. Het disputeren drukt dan ook een belangrijk stempel op het onderwijs en op de examens. Naarmate in later eeuwen de natuurwetenschappen met hun eigen methoden van empirisch onderzoek een belangrijker plaats in de intellectuele cultuur verwerven, raakt het disputeren meer en meer in diskrediet, tot het in de negentiende eeuw vrijwel overal is verdwenen. De vraag is of dit nu uitgestorven hoogtepunt van intellectuele tweekamp ons nog iets kan leren over hedendaagse vormen van toetsen van intellectuele capaciteiten, of daarin zelfs zekere sporen in heeft achtergelaten..

Het dispuut als intellectuele tweekamp, de disputatio, is de dominante methode in het middeleeuwse onderwijs, zoals het dat ook is in de middeleeuwse beoefening van filosofie en theologie. Beroemd zijn de disputen tussen Abélard en Willem van Champagne. Abélard is een edelman die de krijgskunst inruilt voor de kunst van het disputeren, in zekere zin een krijgskunst voor het verstand; hij beschrijft in zijn autobiografie de geest van zijn tijd, evenals de details van zijn woordenkampen met Willem (Thorndike, 1944, p. 3-6). Abélard's disputen trekken grote aantallen belangstellende studenten en markeren het begin van wat de universiteit van Parijs zal worden, of in de ogen van zijn vroegste leden de universiteit in Parijs (Ferruolo, 1988, p. 24). Het disputeren kent zeer veel verschillende vormen, terwijl er door de eeuwen heen ook belangrijke ontwikkelingen in de technieken en in de tradities van het disputeren zijn (Bazan 1982, p. 31). Beschrijvingen van het typische universitaire dispuut zijn onder andere te vinden bij De Rijk (1977, p. 129), en Lansink (1967, 174,188). Een dispuut is een belangrijke gebeurtenis: alle andere universitaire activiteiten zijn tijdens het dispuut opgeschort zodat iedereen de gelegenheid heeft om het bij te wonen. Het dispuut draait om een (probleem)stelling of vraag, de quaestio, die door de voorzittende meester is geponeerd. De stelling wordt verdedigd door een van zijn studenten, de respondens, terwijl andere meesters en studenten kunnen opponeren. Zo'n dispuut kan een halve of een hele dag duren, terwijl de afronding op de volgende dag plaatsvindt door de voorzittende meester die dan een overzicht geeft van de aangevoerde argumenten voor en tegen, en aangeeft waarom de oppositie heeft gefaald en wat de conclusie op het gestelde probleem moet zijn, de determinatio. Voor de respondens is de deelname aan het dispuut een examenverplichting. De autoriteit van de meester die de determinatio geeft is een belangrijk aspect van het dispuut (Makdisi 1974, p. 660), zodat het dispuut niet moet worden geïdealiseerd als een perfect rationele vorm van discussie. Kantorowitz (1938) geeft de volgende beschrijving van vroege Franse theologische disputen zoals geformuleerd door kardinaal Pitra:

We kunnen in de school naar binnen kijken. De meester zit voor, vraagt om tegenwerpingen en antwoordt daarop. De tegenwerpingen groeien in aantal, subtiliteit, en soms scherpte. Een zeer schrandere leerling registreert de zitting zorgvuldig, mengt zich in de discussie, en maakt zijn bedenkingen. De meester laat de tegenwerpingen ontkrachten, versterkt ze soms ook om ze des te harder aan te pakken, en geeft vervolgens de oplossing, de determinatio, de uitslag. (p. 46, vertaald)

Meestal zijn deze disputen oefeningen in het scherpen van de geest van de deelnemers, en in die hoedanigheid zijn ze verwant aan de didactische vorm van vragen en antwoorden (Hadot). Studenten bereiden zich op het disputeren voor door zich te oefenen met bekende stellingen en zoveel mogelijk opvattingen voor zowel als tegen die stellingen; voor dat doel circuleren er in de 13e eeuw in Oxford en Cambridge manuscripten met deze stellingen en hun voors en tegens (Makdisi, 1981, p. 249-250). De verwantschap tussen het disputeren en de vorm van vragen en antwoorden is nu ook duidelijker: een dispuut is in zekere zin een spel van vragen en antwoorden. Of zoals Pelster het formuleert (geciteerd door Makdisi, p. 249): het is in het belang van de studenten om voor zichzelf een uitgebreide verzameling aan te leggen van vragen met hun antwoorden en tegenwerpingen. Er is een zekere analogie tussen disputeren en schaken: het is voor beide gezelschapsspelen nuttig een behoorlijk aantal stellingen al op voorhand te beheersen, om daarmee de strijd beter naar eigen hand te kunnen zetten. De analogie is ook in deze zin door te trekken, dat het meesterschap in het disputeren pas is te bereiken met zeer veel oefening en ervaring. Dat vervolgens de ene meester vaardiger is in het winnen van disputen dan de andere, zal niet verbazen: zowel in de westerse universitaire (Abélard) als eerder in de moslimse wereld zijn er publiekelijke 'rangen van verdienste' in het disputeren. Het publiek vervult de rol van beoordelaar door zijn bewondering en afkeuring niet onder stoelen of banken te steken, en natuurlijk bestaat dat publiek vooral uit studenten die zelf al voldoende vaardig zijn in het disputeren om een oordeel te kunnen hebben over de prestaties van anderen.

In disputen tussen meesters kan de quaestio een klemmend filosofisch, juridisch of theologisch probleem zijn waarvoor men naarstig naar een oplossing zoekt; hier is het dispuut dan een methode om de waarheid te vinden of om ware kennis voort te brengen. In de middeleeuwen is het disputeren de enige methode om nieuwe kennis te ontwikkelen en om juist ontdekte of vertaalde theorieën kritisch te analyseren (Piltz 1981, p. 274). In de moslimse wereld van de 11e eeuw , eerder dan in het westen, is het disputeren al evenzeer een belangrijk instrument voor het ontwikkelen van het recht, en om die reden is het dan ook een belangrijke methode in het onderwijs. Makdisi (1981) stelt dat het disputeren in westerse universiteiten is afgeleid van het disputeren in de moslimse wereld; over deze stelling is het dispuut nog gaande. Voor de ontwikkeling van de logica speelt het disputeren een bepalende rol, zoals beschreven in Kretzmann & Stump (1988, p. 6), terwijl Lawn (1993) laat zien welke rol het disputeren speelt in de ontwikkeling van de geneeskunde en de natuurwetenschap.
Over het middeleeuwse disputeren bestaat een uitgebreide literatuur. Vele verslagen zijn bewaard gebleven in de specifieke literaire vorm van het door de meester geautoriseerde verslag; nog slechts enkele van deze verslagen zijn in gedrukte vorm beschikbaar. McDermott (1993) geeft in zijn bloemlezing uit de werken van Thomas van Aquino een aantal van deze quaestiones disputatae. In deze bloemlezing is ook een college van Thomas opgenomen, waarin dezelfde elementen zijn te herkennen als gebruikt bij het disputeren: argumenten en tegenargumenten, conclusies en weerleggingen. Op het gebied van de logica zijn een aantal disputen, met een inleiding tot het genre, te vinden in Kretzmann, Kenny & Pinborg (1982). Literatuurverwijzingen zijn te vinden bij Weijers (1987) en in Les genres littéraires dans les sources théologiques et philosophiques médiévales (1982).

Er is volgens Perreiah (1984, p. 85) weinig bekend over de rol van het disputeren in het middeleeuwse onderwijs zelf, over hoe studenten ervoor worden geoefend. Hij geeft gedetailleerd aan hoe rond 1400 'oefendisputen' in hun werk gaan: met heel strikte regels, zodat ze meer lijken op een schaakspel dan op een hedendaagse discussie in de rechtszaal. Deze regels zijn specifiek voor dit type dispuut, en daarnaast gelden natuurlijk de regels van de logica. In verband met deze oefendisputen spreekt Perreiah, in navolging van Aristoteles (Thema's 159a 250), nadrukkelijk van een instrument dat is bedoeld om de kennis van de deelnemers te toetsen.

In de jezuïetenscholen, dan liggen de middeleeuwen al in het verleden, is het disputeren bovendien een middel om de leerlingen te kunnen rangordenen naar verdienste (Compère, 1985, p. 83): de lager geplaatste leerling kan de rang van een hoger geplaatste winnen door deze in een dispuut te verslaan. Winnen of verliezen wordt bepaald door het aantal fouten dat iedere deelnemer maakt. Dit is ook de praktijk in de school van Sturm (Codina Mir 1968, p. 173). Deze manier van rangordenen door competitieve disputen is al in de late oudheid bekend (Lim, 1995), evenals in de moslimse wereld rond 1000 (Makdisi, 1981).

Disputen behouden een vooraanstaande plaats in universitaire programma's en examens tot de 18e eeuw, ze worden dan steeds meer belachelijk gevonden en ruimen in de 19e eeuw definitief het veld voor moderne vormen van examineren. In het lesprogramma van Harvard in het midden van de 17e eeuw zijn voor de middagen disputaties geroosterd (Rudolph, 1977, p. 31). In Leiden vinden in het begin van de 17e eeuw om de twee weken disputen plaats, zoals de door Ahsmann (1990) beschreven disputen in de juridische faculteit, die regelmatig in ernstige ongeregeldheden ontaarden (Schotel, 1875, p. 332). In Oxford en Cambridge nemen de studenten in de 18e eeuw de disputen niet meer serieus, het intellectuele vuur spettert er al langer niet meer vanaf, toch verdwijnen ze pas halverwege de 19e eeuw helemaal (Rothblatt, 1974, p. 288, 290) . Hoewel het disputeren dan vrijwel uitsterft, laat het in de intellectuele cultuur ongetwijfeld sterke sporen na. Het disputeren vraagt heel specifieke en goed getrainde vaardigheden; in de middeleeuwen wordt aan die training heel veel aandacht gegeven. Deze specifieke vaardigheden, gemeenschappelijk in een brede maatschappelijke bovenlaag, hebben waarschijnlijk hun stempel gedrukt op de geletterde cultuur van het westen, waaronder de onderwijscultuur (Rogoff & Chavajay, 1995).

Het disputeren heeft weliswaar de 19e eeuw niet overleefd, maar er zijn moderne activiteiten in het onderwijs die enkele essentiële eigenschappen delen met het disputeren. Disputen zijn publieke gebeurtenissen, en de deelnemers zijn gemotiveerd om een goede indruk op het publiek te maken. Beoordelen bestaat dan uit zowel de merkbare oordelen van het publiek als de zelf-beoordeling van de deelnemer, en het inhoudelijke oordeel dat de meester in zijn determinatio geeft over de argumenten van de deelnemers. Er is een moderne vorm die trekken gemeen heeft met het dispuut, en dat is het wetenschappelijk onderzoek. In de middeleeuwen is het dispuut het enige instrument voor wetenschappelijk onderzoek; het arsenaal van instrumenten is sindsdien uitgebreid, en het dispuut is afgevallen zonder dat overigens de intellectuele discours is verdwenen. Er is dus een zekere historische continuïteit tussen het middeleeuwse dispuut en hedendaags wetenschappelijk onderzoek. Om vandaag wetenschappelijk onderzoek te kunnen doen is een voorbereidende scholing nodig in wiskunde, statistiek, discipline-specifieke methodologie, en in het bijzondere soort scholastiek dat zich heeft ontwikkeld rond de vorm van publieke verslaglegging, zoals bijvoorbeeld voor de psychologie gecanoniseerd in het Publication Manual van de American Psychological Association (zie Madigan, Johnson, & Linton, 1995). De beoordelingskenmerken bij wetenschappelijk onderzoek zijn verwant aan die bij het dispuut: de verslaglegging is publiek, examenprogramma's schrijven voor dat men onderzoek moet hebben gedaan, de normen voor goed onderzoek zijn expliciet en binnen disciplines bestaat daar, behoudens bij paradigma-discussies, redelijke overeenstemming over. Een laatste belangrijk punt van overeenkomst is de intellectuele vrijheid, al is deze ook nooit absoluut: de vrijheid om te disputeren volgens de regels van het dispuut en niet die van de broodheer, vaak de kerk, en de vrijheid om het onderzoek in te richten volgens de regels van de wetenschappelijke methodologie en niet die van de opdrachtgever.




Straf of beloning; punten- en cijferstelsels

De kwaal is, wat eenzijdig maar dan ook kort samengevat, dat wij in ons denken over onderwijs aan één stuk door gericht zijn op discrimineren tussen leerlingen, terwijl wij onvoldoende denken over en nooit behoorlijk definiëren wat wij eigenlijk met hen willen bereiken. (De Groot, 1966: V)

Om leerlingen te motiveren hun best te doen is altijd al gebruik gemaakt van externe prikkels zoals beloning en straf, met naar plaats en tijd verschillende accenten daarin, en in de tijd een ontwikkeling van lijfstraffen naar stelsels van abstracte beloning en straf in de vorm punten, en later van cijfers. De straf voor het maken van fouten kan onmiddellijk worden gegeven in de vorm van een slag met de plak op de vlakke hand, maar in uitgewerkte didactische stelsels zoals van de humanisten, onder wie de jezuïeten, is welbewust een sterk competitief element ingebracht zodat leerlingen voortdurend onderling worden vergeleken op gedrag en prestaties. De competitie speelt zich op twee niveaus af: dat van de vaak dagelijkse competitieve oefeningen, en dat van (half-) jaarlijkse prijzen voor de beste leerlingen. Wie de beste leerlingen zijn wordt bepaald door regels die in schoolverordeningen vastliggen en die soms een uitgebreide administratie van behaalde punten met zich meebrengen. Dat in een competitief stelsel niet iedereen prijzen kan krijgen, hoe goed de prestaties ook zijn, en dat dit stelsel nauwelijks motiverend kan zijn voor leerlingen die zichzelf kansloos achten in deze competitie, is altijd wel als nadeel erkend, maar heeft de bloei van dit stelsel niet verhinderd. De overgang van het klassieke puntenstelsel naar een cijferstelsel vindt plaats wanneer deze kritiek op het prijzenstelsel toeneemt, en wanneer examens een prominente rol krijgen in de verdeling van maatschappelijke kansen. Met het cijfergeven is echter niet meer dan schijn-objectiviteit in het onderwijs ingebracht, een ontsporing van het 19e-eeuwse streven de samenleving, dus ook het onderwijs, in getallen en statistieken vast te leggen.

In het onderwijs is vanouds straf gebruikt om leerlingen te 'motiveren' hun aandacht bij schoolwerk te houden. De schoolleiders in de middeleeuwen zijn gerechtigd om leerlingen te straffen, zelfs voor misdaden buiten de school gepleegd. Voor de middeleeuwse leerling behoort straf tot de dagelijkse routine. Een meester in Luik, Egbert, kritiseert de hardvochtige straffen in de scholen van zijn tijd, de 11e eeuw (Schoengen, 1911, p. 316). Joan Cele is streng maar rechtvaardig in zijn straffen, hanteert plak en roede met verve, maar altijd naar omstandigheden afgemeten, zodat Frederiks (1960, p. 56) spreekt van een humane behandeling van leerlingen die voor de 14e eeuw een vooruitgang betekende. Lichamelijke straffen komen in Engeland en de Verenigde Staten vandaag de dag nog steeds voor (Hyman, 1990, Harris, 1990, p. 193), terwijl het symbolisch bestraffen van minder goede prestaties en van minder gewaardeerd gedrag in het westerse onderwijs zo algemeen is dat het geen opzien baart. Straf heeft in het onderwijs altijd een belangrijke plaats gehad, getuige niet alleen tal van oude schoolverordeningen, maar ook hedendaagse 'strafartikelen' in leerlingenstatuten waaruit het voortbestaan van een archaïsche autoritaire relatie tussen meester en leerling blijkt (bijvoorbeeld door het niet toepassen van het beginsel van hoor en wederhoor voordat tot straffen wordt overgegaan).

De humanisten in de 15e en 16e eeuw zijn voorstanders van competitie en beloning in plaats van straffen als motivatie voor de leerlingen, en deze visie zal het hele onderwijs veroveren (Bot, 1955, p. 56 e.v.; Codina Mir 1968, p. 174). Scaglione (1986, p. 13) legt verband tussen het ontstaan van deze humanistische visie en de vernieuwingen van Joan Cele omdat deze de competitie in het onderwijs institutionaliseerde; hij wijst er ook op (p. 93) dat er in de renaissance een buitengewone leergierigheid bestaat, dat in tegenstelling tot de perioden er voor en er na. Vanuit die leergierigheid kan een competitieve schoolcultuur makkelijk als positief zijn ervaren. De invloed van de humanisten leidt tot het algemene gebruik om de beste leerlingen met prijzen te belonen, meestal een boek voor de twee of drie beste leerlingen van de klas, een gebruik dat het westerse onderwijs tot diep in de 19e eeuw domineert. Deze prijzen zijn in het onderwijs zeker geen bijkomstigheid: in de Latijnse scholen in de 18e eeuw worden vaak 1e, 2e en 3e prijzen uitgereikt voor klassen die slechts uit enkele leerlingen bestaan. De prijsboeken zijn zo kostbaar dat stadsbesturen nogal eens problemen hebben om ze te financieren. Ondanks het belang dat iedereen, de leerlingen niet in het minst, aan deze prijzen hecht, en ondanks de kostbaarheid ervan, zijn deze prijsboeken niet ijverig gelezen, getuige de goede staat waarin vele exemplaren nu nog blijken te verkeren (Spoelder, 1978).

Het prijzenstelsel brengt een boekhouding van prestaties gedurende het hele jaar met zich mee; daarbij zijn punten te winnen door goed gedrag, en te verliezen voor fouten en misdragingen. Dit prijzenstelsel is de bestaansreden voor het puntenstelsel, het stelsel van notae, dat pas in de 19e eeuw wordt vervangen door cijferstelsels. De middeleeuwse scholen van de Broeders hebben al een uitgewerkt stelsel om leerlingen naar verdienste te rangordenen: de overgangsonderzoeken worden gebruikt om leerlingen in volgorde van verdienste te plaatsen. Leerlingen kunnen hun rang aanvechten, dan wordt er een wedstrijd gehouden met de naaste hoger geplaatste leerling waardoor de volgorde kan omkeren (Codina Mir, 1968, p. 173). Nog in de 19e eeuw bestaat bij de tripos examens in Cambridge die mogelijkheid om een hogere rang dan de toegekende te verkrijgen door alsnog het bewijs te leveren dat men die hogere rang verdient (Ball, 1921, p. 283). Om te kunnen rangordenen, moet er een administratie van prestaties zijn; wat als prestatie telt is al te zien in de middeleeuwse universiteiten. Haskins (1923/1965, p. 74) geeft uit een 15e-eeuws studentendagboek het voorbeeld van de dagelijkse disputatie die de meester met zijn leerlingen houdt, waarbij zowel een prijs als een symbolische straf (asinus) wordt gegeven om te behouden tot het volgende dispuut. Dezelfde praktijk bestaat in Calvijn's Academie van Genève in 1559 (Scaglione, 1986, p. 46-7); dan worden er al punten of notae bijgehouden, de notae asini of ezelspunten voor fouten en domheden, de notae sermonis soloecismi voor slecht Latijn. In de jezuïetenscholen zijn competitie en het rangordenen naar prestaties kernpunten in het pedagogische programma (Scaglione, p. 74). Uit de 17e eeuw zijn lijsten met deze rangordes bewaard gebleven (Compère, 1985, p. 83, geeft een voorbeeld). Eeuwen eerder zijn in de moslimse wereld dezelfde praktijken voor het rangordenen naar verdienste van leerlingen te vinden (Makdisi 1981, p. 81, 91): ongeacht hun afkomst zitten leerlingen al naar gelang hun prestaties dichter bij de meester of verder af, en kan deze volgorde dagelijks veranderen.

Het algemene bezwaar tegen het prijzenstelsel is dat vele leerlingen nooit in staat zullen zijn een eerste of tweede prijs te bemachtigen, zodat zij in feite door dit stelsel niet gemotiveerd kunnen worden. Er bestaan ook bezwaren tegen de morele problemen die het gevolg zijn van de strijd om de prijzen: fraude, leedvermaak, liegen, en onder hoge druk staan (Van Herwerden, 1947, p. 41; Fortgens 1958, p. 115). Aan het Erasmiaans Gymnasium te Rotterdam wordt in 1878 het prijzenstelsel afgeschaft:

Maar al enige jaren tevoren waren in de school stemmen opgegaan om een einde aan de prijsuitdeling te maken. Van twee zijden ontvingen Curatoren brieven met het verzoek het prijzenstelsel af te schaffen: van de leraren èn - bien étonnés de se trouver ensemble - van de leerlingen. In hun schrijven wijzen de leraren erop, dat 'deze misstelling, die op paedagogische gronden bestreden en veroordeeld wordt, veel tijd voor de zoogenaamde prijsthemata verloren doet gaan'. De leerlingen van de vijfde en vierde klasse geven 'met verschuldigden eerbied' het verzoek te kennen een einde aan het stelsel te maken, 'omdat hierdoor een onedele jalouzie wordt verwekt, waarvan de bewijzen niet ver te zoeken zijn.' Bovendien is in hun ogen het systeem onbillijk, 'daar de uitslag van het werk van eenige uren (nl. de prijsthemata) voor een gansch jaar beslist tot dezen uitslag'. (Spoelder, 1978, p. 120)

In de 18e en begin 19e eeuw ontwikkelt zich in Cambridge geleidelijk een hoger-onderwijsvariant op het prijzenstelsel, en wel een competitief examen, de mathematical tripos; deze ontwikkeling wordt gevolgd in Oxford (Ball, 1921, p. 264, 283; Rothblatt 1982, p. 17, 18 noot 56). Vanouds hebben in Cambridge de proctors het recht om na het disputeren aan de kandidaten vragen te stellen. In 1710 vindt die ondervraging, door een ingrijpende verbouwing die dan plaatsvindt, voor het eerst op dezelfde dag en in dezelfde ruimte plaats. Deze uit nood geboren organisatie van het examen bevalt goed, en wordt na de verbouwing voortgezet. Door deze in tijd en plaats gelijke ondervraging van alle kandidaten is het dan ook mogelijk om de kandidaten onderling te rangordenen, en vanaf 1748 wordt die rangorde gedrukt en daarmee nadrukkelijk openbaar gemaakt (Rothblatt 1974, p. 295). In 1763 wordt een slim systeem ingevoerd (Ball 1921, p. 268): de kandidaten worden dan op voorhand ingedeeld in groepen van ongeveer gelijke gebleken capaciteiten, classes genoemd, in plaats van de eerdere groepsindeling naar het college waar men toe behoorde. Deze indeling vergemakkelijkt het de examinatoren om binnen iedere groep de kandidaten naar prestaties te rangordenen. Deze maatregel geeft aan hoe belangrijk het rangordenen dan al is, maar ook dat de class waartoe men behoort voor de meeste kandidaten de belangrijkste uitkomst van onderwijs en examen is. Schriftelijke examens, waar aanvankelijk de opgaven nog worden gedicteerd, vervangen later de mondelinge examens tegenover een commissie. Kandidaten die weten dat ze zich onvoldoende hebben voorbereid kunnen hun schaamte verbergen door te kiezen voor een pass in welk geval hun naam niet in de erelijst wordt opgenomen en zo hun schande voor het publiek verborgen blijft (het examen vindt aan het eind van het derde jaar van inschrijving plaats, en kan niet worden uitgesteld of overgedaan). Zo worden in Cambridge tot 1910 de deelnemers aan de mathematical tripos naar prestatie gerangordend: de beste prestatie wordt geëerd met de titel Senior Wrangler, de slechtste met zowel een titel als een attribuut: de Wooden Spoon. Een foto van de laatste Wooden Spoon in 1910 met zijn manshoge houten lepel is afgedrukt in Stoker (1927, tegenover p. 34). Deze competitieve examens zetten de studenten onder grote druk (Rothblatt 1982, p. 6), en zij zoeken bij voorkeur en tegen extra betaling de steun van externe repetitoren. Er zijn daarmee twee ontwikkelingen tegelijk in gang gezet: er moet ook door jongelui uit kringen waar dat allerminst gebruikelijk was behoorlijk worden gepresteerd, en de examens dicteren in hoge mate de aard en inhoud van de studie, de backwash van examens. Een opvallende maar uiteindelijk niet beklijvende ontwikkeling is dat studenten voor hun opleiding tot het examen zich massaal en tegen hoge kosten wenden tot repetitoren, terwijl tegelijk de dons die voor het onderwijs zijn aangesteld dat verwaarlozen.

In de 19e eeuw is het rangordenen van leerlingen aanvankelijk nog algemeen in het voortgezet onderwijs, om dan geleidelijk overal door cijferstelsels te worden vervangen (zie voor Frankrijk Caspard, 1992, p. 19-23). Volgens Compère (1985, p. 83) komt er in Frankrijk voor 1850 geen cijferstelsel voor. In Duitsland is waarschijnlijk in het begin van de twintigste eeuw het rangordenen nog algemeen: Stern (1920) vergelijkt de scores van leerlingen op zijn intelligentietest met hun rang in de klas, niet met hun cijfers. In Nederland is het Groningse Gymnasium ongeveer de laatste school die in 1901 de overgang van punten- naar cijferstelsel maakt (Van Herwerden, 1947, p. 41). De geschiedenis van cijferstelsels is voor de Verenigde Staten beschreven door Smallwood (1936); zie ook Rudolph, (1977, p. 15-16, 147) en Geisinger (1982): ook daar vindt de ontwikkeling van puntenstelsel tot cijferstelsel en dan tot letter grades in de 19e eeuw plaats, kennelijk zonder daarbij Europese ontwikkelingen na te volgen. In Cambridge worden bij de tripos examens in 1836 voor het eerst cijfers of punten gebruikt om het gemaakte werk te beoordelen; Ball (1921) zegt daarover:

Mr Earnshaw, de senior moderator in 1836, zei mij te geloven dat de tripos van dat jaar de eerste was waarin alle papers werden voorzien van een cijfer, en dat in de voorgaande jaren de examinatoren deels afgingen op hun globale indruk van de kwaliteit van de gegeven antwoorden. (p. 297, vertaald).

Kort na de invoering van de cijferbeoordeling komt er in Cambridge een einde aan de a priori indeling van examenkandidaten in verschillende classes van gelijke verdienste (Ball, p. 268), ooit ingevoerd om het vergelijkende beoordelen juist te vergemakkelijken en oneerlijke beoordelingspraktijken tegen te gaan (Ball, p. 297). Kennelijk gaf de beoordeling met cijfers zoveel vertrouwen dat een eerste indeling naar prestatieniveaus niet meer nodig leek. In Cambridge was men zich al in 1873 bewust van het belang voor de examenkandidaten om de schaarse voorbereidingstijd op een goede manier over de verschillende onderwerpen te verdelen, en speelde men daarop in met de puntentoekenning voor de diverse onderwerpen (Ball, p. 300 e.v.). De bedoeling was dat de betere studenten zich zouden kunnen concentreren op een klein aantal onderwerpen waarop zij dan de maximale score zouden kunnen behalen: helaas bleek oppervlakkig bestuderen van de hele stof altijd een betere strategie te zijn. De discussie over punten en weging in relatie tot studiestrategie zet zich dan nog vele decennia voort, en is van het type waarvoor Van Naerssen (1970) een wiskundige onderbouwing heeft willen geven. De opkomst van het cijferstelsel in Engeland is ook door Rothblatt (1993, p. 44) kort beschreven; zijn analyse is dat de competitieve examens in Cambridge en Oxford vroegen om objectieve beoordeling, en dat om een geloofwaardige objectiviteit te bereiken het programma inhoudelijk werd versmald om het mogelijk te maken met cijfers te beoordelen zonder dat examinatoren het onderling over die cijfers niet eens zouden kunnen worden.

Cijferstelsels verschillen van land tot land (Lienert, 1987, p. 40), maar de basis van die stelsels is overal in de westerse wereld dezelfde: het is het rangenstelsel, ontdaan van zijn exclusieve prijzen voor de besten, en pseudo-geobjectiveerd door fouten te evalueren op een cijferschaal in plaats van ze alleen maar te tellen. Het tegenwoordige onderscheid tussen scoren en waarderen maakt dat begrijpelijk. Scoren is het beoordelen van de juistheid van antwoorden; de zo bepaalde score wordt gewaardeerd met een cijfer. Een cijferstelsel bevat ten opzichte van een puntenstelsel de waardering als een extra stap die subjectiviteit introduceert die in het puntenstelsel niet aanwezig is. In het puntenstelsel wordt de rang bepaald op basis van de gesommeerde punten (notae) van alle leerlingen in de klas, een objectieve procedure, hoewel de literatuur wel voorbeelden geeft waarin toegekende punten zijn aangevochten (in Den Bosch: De Haas, 1926, p. 98; het Erasmiaans Gymnasium: Van der Blom, 1978, p. 21). In het puntenstelsel worden wel puntenboekjes bijgehouden door alle leerlingen en docenten. Zo hebben in Groningen alle leerlingen negligentie- of ignorantieboekjes waarin alle punten worden aangetekend, niet alleen die van de leerling zelf, maar ook die van alle andere leerlingen, en niet alleen die voor fouten, maar ook die voor gedrag, verzuim, etcetera (Van Herwerden, 1947, p. 41); Rudolph (1977, p. 147) geeft een parallel voorbeeld voor Harvard. Deze puntenboekjes in het westerse onderwijs hebben gelijkenis met de persoonlijke 'boeken van verdienste en onverdienste' die in de cultuur van het China van de 16e en 17e eeuw een belangrijke rol spelen: in een soort dagboekjes worden goede en slechte daden aangetekend, en deze boekjes spelen een rol in het religieuze maar ook in het maatschappelijke leven (Brokaw, 1991). Ik heb geen aanwijzingen voor enige invloed van deze opmerkelijke Chinese traditie op die van de westerse puntenboekjes.

In het cijferstelsel worden de fouten in het gemaakte werk of de opgezegde les gewaardeerd met een cijfer; achteraf gezien is het probleem met die werkwijze dat er geen normen zijn om aantallen fouten of andere ruwe scores objectief en geldig te kunnen vertalen naar cijfers. In onderzoek na 1945 zoals beschreven in Vijven en zessen van De Groot (1966) of Zur Problematik der Jahrgangsklasse van Ingenkamp (1972) is het cijfergeven bij uitstek subjectief gebleken. Cijferstelsels suggereren de aanwezigheid van absolute normen die in werkelijkheid ontbreken; omdat puntenstelsels deze suggestie niet in zich hebben, is er met de overgang op cijferstelsels sprake van een regressieve ontwikkeling in het beoordelen. De huidige toetstheorie, die is gebaseerd op de methodologie van het meten van individuele verschillen, restaureert als het ware het oude puntenstelsel, maar in ongewenste vorm omdat individuele verschillen hier tot een doel op zich zijn geworden in plaats van een middel om leerlingen te motiveren. In cijferstelsels zijn hoge cijfers bovendien een bijna even (kunstmatig) schaars goed als de eerste en tweede prijzen dat voorheen waren (Deutsch 1979, p. 393-94), zodat ook hier geen werkelijke winst ten opzichte van het voorafgaande puntenstelsel is geboekt. Wel maken de pseudo-objectieve cijferstelsels het politici nog beter mogelijk om van de scholen te eisen dat zij 'resultaten' boeken. Engeland doet in de 60-er en 70-er jaren van de 19e eeuw ervaringen op met het afrekenen van scholen op basis van toetsresultaten. In de Verenigde Staten hebben in dat proces gestandaardiseerde toetsen de cijfers van de docenten verdrongen, met volgens Resnick & Resnick (1985) ernstige gevolgen voor de doelmatigheid van de primaire leerprocessen en de kwaliteit van lesprogramma's. Maar ligt er geen interne tegenspraak in het voorgaande besloten: gestandaardiseerde toetsen zijn toch gerelateerd aan normen? Zogenaamd gestandaardiseerde toetsen ontlenen hun normen aan landelijke representatieve steekproeven van leerlingen, en dergelijke normen zijn om die reden louter relatief. Het is voor ons in het laatste decennium van de 20e eeuw moeilijk te doorgronden hoe groot de invloed van eeuwen humanistisch rangordenen in het onderwijs en vooral op het beoordelen is geweest, en mogelijk haasten we ons te snel van het ene moderne alternatief - doelstellingen, studietoetsen, beheersingsleren, authentiek toetsen - naar het andere zonder te beseffen wat eigenlijk de situatie is waarvoor we naar alternatieven zoeken. Kan deze analyse een constructieve wending worden gegeven?
In het westerse onderwijs is al vroeg sprake van een combinatie van inhoudelijke sturing en correctie van leerlingen, en het gebruiken van die correcties in een stelsel van beloning dat is gebaseerd op de gedachte van competitie. Daarmee is in de didactiek al vroeg een keuze gemaakt voor een nadruk op extrinsieke motivatie door beloning en straf, en niet op intrinsieke motivatie zoals het verwerven van vaardigheden die aan de leerling kan geven. Anders gezegd: er is al vroeg een onderwijscultuur ontstaan waarin de verantwoordelijkheid voor de vooruitgang van de leerling niet bij zijn meester, maar bij hemzelf wordt gelegd. Het cijferstelsel is een versluierde vorm voor wat in essentie nog het oude prijzenstelsel is: hoge cijfers hebben nog steeds een prijs-karakter, terwijl lage cijfers de leerling in de regionen van straf brengen, als lage cijfers al niet zelf als straf worden ervaren. Meer dan ooit tevoren hebben gunstige en ongunstige beoordelingen maatschappelijke gevolgen voor de leerlingen. Wordt de leerling zelf verantwoordelijk gehouden voor zijn of haar prestaties, dan is het belangrijk om het uitdelen van cijfers zo 'objectief' mogelijk te doen. Daarmee doemt de vraag op of deze verondersteld-eerlijke uitdeling van beloning en straf wel wenselijk is; voor de vergelijkbare maar hardere situatie van het bestraffen van crimineel gedrag zijn er argumenten om deze vraag met 'nee' te beantwoorden, omdat dit blijkt te leiden tot discriminatie (Hudson, 1987). De vraag leidt tot een dilemma, omdat De Groot (1970) een sterk pleidooi houdt dat erop neerkomt dat de leerling die zelf verantwoordelijk is, door de leraar dan ook in staat moet worden gesteld die verantwoordelijkheid te dragen. De Groot stelt als kwaliteitseis voor het waarderen van leren dat leerlingen in staat zijn gesteld om zich adequaat op toetsing voor te bereiden: toetsen moeten doorzichtig zijn. De eis van doorzichtigheid verhindert niet dat toetsen en cijfers toch als oneerlijk kunnen worden ervaren; als het belangrijk is om dat te voorkomen, moeten onderwijs en beoordeling anders worden ingericht. De geaccepteerde theorie over beoordelen gaat impliciet uit van de fictie dat leerlingen zich niet gericht voorbereiden op toetsen, en heeft geen plaats voor doorzichtigheid (zie Wilbrink, 1986, over het verschil tussen testen en toetsen). De geaccepteerde theorie is daarom onbruikbaar om de competitie voor cijfers te beschrijven of te onderzoeken.

In het verleden was het gewoon om in de beoordeling van de leerling ook zijn gedrag mee te beoordelen. En nog steeds is het zo dat leraren prestaties anders waarderen, al naar gelang zij menen te weten of die prestatie een gevolg is van capaciteiten of van inspanning (Weiner, 1994). Dat kan makkelijk zo ver gaan dat een proefwerk met het laagste cijfer wordt gewaardeerd wanneer de leraar fraude vermoedt; dan gebruikt de leraar zijn bevoegdheid om te beoordelen in feite om te straffen, en de rechter zal zeggen dat de bevoegdheid daar niet voor is gegeven (Cohen, 1983, p. 78). Een vanuit de doorzichtigheidseis heldere positie is dat prestaties worden beoordeeld ongeacht inspanning, capaciteiten, of vermoedens van fraude. Als de leerling zelf maar kan bepalen welke inspanning, gezien de eigen capaciteiten, gewenst is. De docent stelt dus doorzichtige eisen, maar is de docent ook vrij om de eisen op zo'n manier te stellen, dat de leerlingen bepaalde prestaties zullen leveren? Mag de docent toetsen zo inrichten dat deze de inspanning van leerlingen sturen? De Groot zou dat moeten beamen, want een toets doorzichtig maken betekent immers de condities zo maken dat de leerling weet welke inspanning tot succes op deze toets leidt. In deel twee wordt een algemeen toetsmodel gegeven dat is gebaseerd op de doorzichtheidseis en dat daarmee vooronderstelt dat het is toegestaan om de inspanning van de leerlingen te sturen door de inrichting van de beoordeling. De overheid heeft zich deze sturende rol altijd al aangemeten door in detail de eindexamens voor het middelbaar onderwijs te regelen. In de Angelsaksische landen groeit eveneens de discussie over de wenselijkheid om door de kwaliteit van toetsen en examens de kwaliteit van het onderwijs te sturen, door de altijd bestaande backwash van toetsen te benutten om te sturen. Heyneman & Ransom, 1990, stellen het mikken op backwash voor als krachtig instrument voor ontwikkelingslanden om het kwalificatieniveau van de bevolking omhoog te brengen.




Competitieve examens en de staat

Het ontstaan van de huidige beoordelingspraktijk in het onderwijs heeft te maken met de opkomst van de moderne staten in Europa, en met de opkomst van professies waarvoor examens een zowel afschermende als definiërende functie krijgen. Macdonald (1995) geeft een inleiding tot de sociologie van de professies; hij gaat in op de rol van de staat en van het patriarchaat in de ontwikkelingen over de laatste drie eeuwen, maar laat examens buiten beschouwing. Toch heeft in de meeste landen de staat in deze periode een beslissende rol in de vormgeving van examens, zoals in de Duitse staten (McClelland, 1991). Universitaire examens veranderen van de formaliteit of zelfs de farce waartoe ze in de 18e eeuw waren vervallen, tot instrumenten die ten dienste staan van hogere belangen dan die van de examinatoren zelf, zoals die van de staat of van een professie. Het gevolg is dat ook de belangen van de studenten bij een goede examenuitslag toenemen, en dat zij zich in hun studie steeds sterker door de exameneisen laten sturen. De competitie om prijzen verandert in competitie om maatschappelijke posities waar examens toegang toe kunnen geven.

De inschrijvingen aan de meeste Europese universiteiten nemen aan het einde van de 17e eeuw af en blijven in 18e eeuw laag (Rothblatt 1982, p. 3). In veel landen bestaan er dan in feite geen examens meer of zijn deze een aanfluiting. Zo is in de colleges van de Amerikaanse koloniën geen sprake van serieuze examens (Rudolph 1977, p. 145). In Duitsland is er al eerder kritiek van Luther op het kunnen kopen van academische graden, en dergelijke kritiek blijft bestaan tot in de 18e eeuw de roep klinkt om de corrupte universiteiten maar helemaal op te heffen (Prahl, 1974, p. 298). Engeland kent in de 18e eeuw de wall lecture: de examenkandidaat houdt een college, maar de examinatoren zijn daar niet eens meer bij aanwezig (Engel 1974, p. 307), en inderdaad slaat de verveling in Oxford en Cambridge in die tijd hard toe (Rothblatt, 1974, p. 247). De Nederlanden laten hetzelfde patroon zien van universitair verblijf dat het kenmerk van een maatschappelijke stand is (Frijhoff, 1981, p. 292) en dat geen serieuze examens als afsluiting kent (Wachelder 1991, p. 70). Aan deze 18e-eeuwse universitaire slapte komt een einde wanneer staten belang krijgen bij hoger opgeleiden voor het vervullen van hogere ambtelijke functies.

De algemene trend in continentaal Europa is in de 17e en vooral de 18e eeuw dat de staat probeert greep te krijgen op de universiteiten en hun examens om zo zowel het aantal als de kwaliteit van hun hoger overheidspersoneel, en ook van de professies, te kunnen controleren (Wuthnow 1989, p. 239; Frijhoff 1992; Lindroth 1976, p. 101). Engeland is een uitzondering door de autonome opkomst van competitieve examens in Oxford en Cambridge, maar meer nog omdat een modern ambtelijk apparaat hier pas in de 19e eeuw wordt gevormd (Fischer & Lundgreen, 1975, p. 459). Waar eerder iemands familie, bezit en relaties beslissend zijn voor het verkrijgen van begeerde overheidsfuncties, wordt nu verdienste zoals bevestigd in examens het eerste criterium. Dit betekent niet dat factoren zoals afkomst nu onbelangrijk worden, noch dat elite-posities bedreigd worden door nieuwkomers (Fischer & Lundgreen, 1975, p. 481). Het hanteren van het verdienste-criterium houdt niet in dat posities nu praktisch toegankelijk zijn voor al wie over talent beschikt: de kosten verbonden aan het bereiken van competitieve posities in het onderwijs zijn zo hoog dat alleen de gevestigde elite en rijke kooplieden deze kunnen dragen, zoals ook in de middeleeuwen in belangrijke mate het geval was (Schwinges 1986, p. 5, 343). Ook vorming als doelstelling van onderwijs (Rothblatt, 1993) verdwijnt niet, maar krijgt steeds meer concurrentie van op kwalificaties gerichte examenprogramma's die hun dictaat aan de studie opleggen. Pas in de 20e eeuw is er een explosieve ontwikkeling in de deelname aan onderwijs die ertoe leidt dat de kansen gelijker worden om talenten in het onderwijs te ontwikkelen. Maar ook dan slaagt de gevestigde elite er goed in zijn kinderen in maatschappelijke topposities te krijgen, aanvankelijk juist door, maar later ondanks competitieve examens. Via examens, waarin is vastgelegd welke kennis de moeite waard is om op welke manier te beoordelen, worden maatschappelijke posities en structuren afgebakend, en worden er nieuwe aan toegevoegd. In verschillende landen worden andere accenten gelegd vanuit andere historische, culturele en politieke constellaties; gezamenlijk geven zij een goed beeld van wat uiteindelijk een examencultuur zal worden die wereldwijd dezelfde wezenlijke trekken vertoont.

Engeland

De ontwikkeling van 'moderne' examens begint in Engeland al in de eerste helft van de 18e eeuw met de instelling van de Senate House examination in Cambridge, de latere mathematical tripos (Roach, 1971, p. 13). Het hoe en waarom van deze ontwikkeling is onbekend, hoewel Rothblatt (1974) een overvloed aan relevante feiten en boeiende speculaties geeft. In Engeland hebben de universiteiten het initiatief, zij het dat dit geen bewust gestuurde ontwikkeling is, terwijl op het continent de overheden het initiatief bij de ontwikkeling van examens nemen. Fischer en Lundgreen (1975, p. 459) benadrukken dat Engeland ook relatief laat is met het opbouwen van zijn civil service, wat kan verklaren dat de Engelse staat ook laat is met zijn invloed op de ontwikkeling van examens. Roach (1971, p. 12) bevestigt de doorslaggevende rol die de Engelse universitaire examens spelen als model voor de examens voor de overheidsdienst die in het midden van de 19e eeuw tot stand komen. Rothblatt (1982, p. 15) beschrijft de grote invloed van de universitaire examens als voorbeeld voor 'scholen, militaire academies, plaatselijke examens en verschillende takken van de ambtelijke bureaucratie, met uitzondering van het departement van onderwijs en van buitenlandse zaken.' Scholen gaan dan opleiden voor deze examens, zoals Bryant (1986) beschrijft:

Een zeer groot aantal Londense scholen van verschillende niveaus maken gebruik van deze publieke examens. Eagle Hall Collegiate School in Southgate bijvoorbeeld bereidde in 1872 voor op de examens voor de Civil Service, Preliminary Medical, Incorporated Law Society, Oxford en Cambridge Middle Class, en anderen [Bisson, 1872]. The College, Tollington Park, bereidde voor op University Locals, het College of Preceptors, de Civil Service, Royal College of Surgeons, Apothecaries' Hall en Pharmaceutical Society Examinations' [Bisson, 1879]. (p. 171, vertaald)

In de tweede helft van de twintigste eeuw worden schriftelijke examens vervangen door psychologische tests, wat niet wegneemt dat dan toch nog buiten-proportioneel veel alumni van Oxford en Cambridge in de Civil Service worden opgenomen: kennelijk vindt de selectie van Engeland's hoogste ambtenaren nog steeds vooral plaats in een traject van scholing en examens waarin public schools en Oxford en Cambridge dominant aanwezig zijn (Kellner & Lord Crowther-Hunt, 1980). De geschiedenis van de wijze waarop voor de Engelse Civil Service is gerecruteerd en geselecteerd, zoals beschreven door Chapman (1984), is een geschiedenis van argumenten voor en tegen examens en psychologische tests. Ellis (1994) beschrijft hoe Oxford en Cambridge nog steeds toegangskaarten geven tot de meest invloedrijke posities in de Engelse samenleving, en daarmee een betekenis hebben die ver uitgaat boven wat hun examens in strikte zin inhoudelijk behelzen.


Frankrijk


De Franse traditie van vergelijkende examens voor de grandes écoles vangt aan in 1747 met een legaat van Louis Legrand bestemd voor een jaarlijkse wedstrijd tussen 10 Parijse scholen (Palmer, 1985, p. 24). In de late 18e eeuw worden er steeds meer examens ingesteld, die ook strenger worden, voor de werving voor technische instituten van het leger, zoals de école des ponts et chaussées, en na de revolutie de école polytechnique, een opleiding die een door vele Europese landen nagevolgd voorbeeld is. Frijhoff (1992, p. 1256) geeft een overzicht van het Franse hoger onderwijs in de 18e en 19e eeuw. De overheid maakt in Frankrijk, voor het eerst in zijn geschiedenis, het slagen voor examens bepalend voor een overheidsloopbaan; daartoe worden examens ingesteld die eerder in deze vorm niet bestonden. Maar ook voor toelating tot de Académie des Sciences wordt streng geselecteerd, wat in scherp contrast staat met de open toelating tot de Royal Society of London (Crosland, 1995). Napoleon brengt het onderwijs dat voor de staat zelf van groot belang is, dat is het hoger onderwijs en de daarop voorbereidende lycea, onder het strikte regiem van examens: de universiteit wordt afgeschaft en opnieuw opgericht met als voornaamste taak om de examens voor de lycea af te nemen, en ook de examinatoren worden door examens geselecteerd.

Napoleon gaf als eerste op centralistische wijze gestalte aan openbaar elite-onderwijs. Deze centralistische trekken vertoont het Franse onderwijs nu nog. Van meet af aan werd zo greep gehouden op de parameters van intellectuele vorming: de (gedetailleerde) onderwijsprogramma's, de vergelijkende examens, en niet te vergeten, de leraren en hun opleiding.
Het openbaar elite-onderwijs was bedoeld om de staat te voorzien van officieren en een hoger kader van ambtenaren. Zonder zich te bekommeren om het volksonderwijs - een onwetende pater was hiervoor goed genoeg - gaf Napoleon gestalte aan de 'Université', een relatief autonome en hiërarchische orde van wetenschappers die verantwoordelijk werd voor het universitaire en pre-universitaire onderwijs. (...) Eén van de centrale taken van de leden van het wetenschappelijk corps was de controle op de examens, met name het baccalauréat, het eindexamen van het pre-universitaire lyceum (Ringer, 1979: 122). Deze controle betrof ook het privé-onderwijs, dat zich daar tegen verzette, in sommige periodes met succes. De controle op het docentencorps zelf van de Université was geregeld door een centrale inspectie en het competitieve, vakgerichte examen: de agrégation. (...) De hoogst geplaatsten in de universitaire hiërarchie hadden de prestigieuze Ecole Normale Supérieure doorlopen (Prost, 1968: 71, 72). (Blom, 1995, p. 51-52)

Suleiman (1978) is minder mild dan Blom in het karakteriseren van de greep die de staat, en vooral Napoleon, zich verschaft op het onderwijs. Onderwijs moet staatsbelangen dienen, anders zou het die juist in gevaar kunnen brengen. Daartoe is indoctrinatie een gerechtvaardigd middel; zo heeft Napoleon een paar keer overwogen zijn topopleidingen te sluiten omdat de studenten afwijkende opvattingen zouden hebben. Voor de organisatie van het onderwijs worden de disciplinerende technieken uit zowel het leger als de kerk ingezet, wat leidt tot een uniforme inrichting van de lycea. Het is verleidelijk om hier het beeld te gebruiken van standaardisatie met het oog op de vergelijkende examens voor toelating tot de grandes écoles, maar dat zou een anachronisme zijn. Suleiman ontleent aan Barnard's (1969) Education and the French Revolution, de volgende beschrijving.

De school werd het evenbeeld van een regiment. Hij werd verdeeld in compagnieën, ieder met 25 leerlingen, met een sergeant en met vier korporaals. Het schoolleven werd geregeld met trommel-signalen en in vele lycées waren periodieke 'route marches' onder begeleiding van militaire muziek een geregeld onderdeel van het curriculum. Het schooluniform van de leerlingen bestond uit een groene jas met een lichtblauwe kraag en garneersel en met metalen knopen met daarin de naam van het lycée gestanst. (p. 21, vertaald)

Aan het einde van de 20e eeuw zijn de zeer selectieve examens voor toelating tot de grandes écoles nog steeds de toegangspoort tot topposities in zowel de politiek als het bedrijfsleven (Suleiman, 1978).


Duitsland


De Pruisische vorsten bouwen in de 18e eeuw de meest doelmatige bureaucratie van Europa op, waarvoor zij examens instellen voor toelating tot hogere overheidsfuncties, ook met de bedoeling om zo het monopolie van de aristocratie op deze functies te doorbreken (Prahl 1974, p. 300). Zo wordt in die eeuw naast de faculteiten van theologie, rechten en medicijnen een studierichting ingesteld die voorbereidt op overheidsfuncties. Om de aantallen kandidaten daarvoor te reguleren worden er beperkingen ingesteld, die overigens ook voor de andere faculteiten zouden gaan gelden, in de vorm van een eindexamen voor het gymnasium: de Abitur. In de 19e eeuw zijn de studenten in deze studies voor overheidsfuncties, veel Brotstudenten die onbemiddeld zijn, druk met blokken voor hun door de staat georganiseerde examens; aan deze groep studenten is het Humboldtiaanse ideaal van de universiteit niet besteed (McClelland 1980, p. 200). Groeiende aantallen studenten leiden vervolgens tot bureaucratisering van deze staatsexamens, daarbij de natuurlijke neiging van de Brotstudenten tot blokken voor hun examens nog versterkend (McClelland 1980, p. 277 e.v.). In deze krachtige ontwikkelingen vanaf de vroege 18e eeuw worden de vorm en de functie van het beoordelen in het Duitse onderwijs definitief bepaald.


Nederland


De behoefte van de Nederlandse staat in de 19e eeuw aan geschoolde ambtenaren is door Van IJsselmuiden (1990) onderzocht. De kleine kring van topambtenaren in die eeuw is te karakteriseren als een 'ambtenarenfamilie' waarin het ambt van vader op zoon overgaat, nadat ter plekke de zoon door de vader op eigen kosten is ingewerkt. Uitzonderingen zijn de technische specialisten die bijvoorbeeld voor onze waterwerken nodig zijn, en die ook bijzonder beloond worden, en ambtenaren bestemd voor uitzending naar Nederlands Indië. Voor lagere ambtenaren wordt een klerkexamen als toelatingsdrempel gebruikt, dat pas in 1934 wordt afgeschaft; volgens Van IJsselmuiden (1990, p. 269) "was het niveau van het middelbaar onderwijs zodanig gestegen, dat het klerkexamen gevoeglijk kon worden afgeschaft." Thorbecke's Hoogere Burgerschool (HBS) is met zijn afsluitende examens door staatscommissies van gecommitteerden een belangrijke stap naar een meer op meritocratische leest geschoeid onderwijs (Bartels, 1963). Dergelijke staatsexamens spelen in de 19e eeuw in Nederland een belangrijke rol. Zo vindt er een verrassende principiële discussie plaats over toelatings- en overgangsexamens, over welke Thorbecke bij herhaling zijn afkeer uit, zoals in een rede in de Tweede kamer op 30 november 1871 (Thorbecke, 1876):

Examens van toelating en van overgang .... Hoe kan het iemand bevreemden, dat ik noch toelatings- noch overgangsexamens wil, waartegen ik mij steeds verzet heb? Hetgeen ik niet wilde is ingeslopen; in de jongste jaren is de heerschappij wederom gekomen aan een schoolsch begrip van dwang, waardoor het onderwijs, met name het middelbaar onderwijs, waarmede wij nu van doen hebben, eene soort van fabriek zou worden. Mijne verklaarde meening was steeds, dat het genot van het onderwijs aan de hoogere burgerscholen vrij moet zijn gelijk aan de universiteiten. (p. 87)

De HBS wordt vanuit dit liberale denken opgezet als onderwijs dat vrij toegankelijk is, dat wil zeggen dat ouders zelf moeten beoordelen of hun kind voor deze of gene klas voldoende is voorbereid; omdat het eindexamen de vorm van een staatsexamen heeft, is dat examen het instrument om het niveau van het onderwijs te bewaken. De leraren en inspecteurs menen echter dat dit stelsel van open toelating niet werkbaar is, en onder hun druk verdwijnt de open toelating, tot spijt van Thorbecke, al na enkele jaren uit de wet (Bartels, p. 92 e.v.). Thorbecke ziet alleen plaats voor toelatingsexamens bij militaire en verwante opleidingen die voorzien in een specifieke en kwantitatief beperkte behoefte van de staat, zoals die aan ambtenaren voor de Oost. Fasseur (1993) schrijft de geschiedenis van deze ambtenaren voor de Oost: niet alleen hun opleiding in Leiden en Delft en de pogingen om daar serieuze en op Engelse leest geschoeide examens aan te koppelen, maar ook hoe gebrekkig opgeleide ambtenaren zonder kennis van lokale omstandigheden rampzalige (militaire) verwikkelingen hebben veroorzaakt. Hoe de Nederlandse topambtenaren en parlementsleden na de Tweede Wereldoorlog zijn gerecruteerd is onderzocht door Eldersveld, Kooiman en Van der Tak (1981). Het blijkt dat achtergronden en loopbanen nogal heterogeen zijn, met daarin voor bijna alle topambtenaren een universitaire of hogere technische opleiding en voor bijna 60% van de parlementsleden een universitaire opleiding. Dronkers en Hillige (1995) laten zien hoe na 1945 in Nederland examens een ondergeschikte rol spelen in de manier waarop de oude maatschappelijke elite nog steeds beslag weet te leggen op de topposities in de samenleving, in afwijking van het patroon van ook neerwaartse mobiliteit dat vanuit de sociologische theorie werd verwacht.


De Verenigde Staten


De Verenigde Staten vormen een uitzondering op het algemene patroon van staatsinvloeden op onderwijs en examens: er is geen centrale 'staat' die invloed uitoefent. Het huidige stelsel van hoger onderwijs kent een uitgesproken profilering van onderwijsinstellingen, vooral naar het niveau van de studenten die zij toelaten, met een bijbehorende industrie die de selectieve tests daarvoor aanlevert. Deze bijzondere situatie is niet gewild door een centrale overheid, die immers ontbreekt, maar is de ongewilde uitkomst van ontwikkelingen in het verleden. Hoezeer ook ongewild, de Amerikanen zien dit selectieve stelsel graag als een rationeel stelsel dat belangrijke Amerikaanse waarden belichaamt. Het resultaat van deze bijzondere Amerikaanse ontwikkeling is echter niet zo bijzonder: de selectiviteit van het onderwijs is vergelijkbaar met die van het huidige onderwijs in Frankrijk en in Japan. Dat geldt ook de manier waarop de elite erin slaagt de eigen kinderen via vaak kostbare onderwijstrajecten maatschappelijk een vliegende start te geven (Kingston & Lewis, 1990). Astin (1985), terugkijkend op drie decennia eigen onderzoek naar de selectiviteit van het Amerikaanse hoger onderwijs, spreekt over een Amerikaanse mythe, omdat het geloof dat meer selectieve instellingen zoals de Ivy League universiteiten ook beter onderwijs zouden geven, in empirisch onderzoek niet is bevestigd. De stelling van Astin is dat (toelatings-) examens wel maatschappelijk selecteren, maar dat die maatschappelijke selectie niet heeft te maken met de kwaliteit van het onderwijs waar die examens voor toelaten.


Japan


In Japan begint de moderne tijd met het Meiji-bewind in 1868, en dat creëert meteen een meritocratische structuur voor de uitbouw van het overheidsapparaat. Het bijzondere van Japan als staat is dat het een conglomeratie is van verschillende groepen die elkaar in een machtsevenwicht houden, een federatie in zekere zin, maar volstrekt anders dan de federatie van staten die de Verenigde Staten vormt (Van Wolferen, 1989). Examens en examencultuur groeien in Japan uit de samenloop van al deze belangen en hun culturele achtergronden. Japan heeft in de samoerai een machtige groep met een uitgesproken meritocratische cultuur die vanuit een dominante positie in de Meiji-regering zijn stempel drukt op de Japanse examencultuur die daarmee al even uitgesproken meritocratisch wordt. De Meiji-regering met zijn gerichtheid op het westen heeft een deskundig ambtenarenapparaat nodig. In eerste instantie wordt gekeken naar het model van de Chinese examens, waarvoor in 1868 inderdaad een blauwdruk klaar ligt, maar dit plan komt niet tot uitvoering; wel roepen enige departementen dan eigen opleidingen in het leven. Nog voor de eeuwwisseling worden voor de selectie van hogere ambtenaren examens ingericht naar Pruisisch model (Spaulding, 1967 ). Enige decennia lang worden opleiding en selectie volgens strikt meritocratische principes uitgevoerd; het eenmaal zo gevestigde systeem wordt vervolgens in stand gehouden door de machthebbers die het zelf heeft gecreëerd, en die dankzij dit systeem hun positie hebben bereikt (Rohlen, 1983:61). Dit is hetzelfde mechanisme dat in Engeland zorgt voor de brede navolging die de competitieve examens van Cambridge en Oxford in de Engelse samenleving krijgen.

Het moment waar voor de ambitieuze Japanse adolescent alles om draait is de toelating tot het hoger onderwijs, in het bijzonder de toelating tot de universiteit van Tokyo, omdat zowel overheid als bedrijfsleven voor hun hogere functies recruteren uit de afgestudeerden van alleen de 'allerbeste' universiteiten (Kubota, 1969, p. 162). De aanhalingstekens geven aan dat het universitaire onderwijs, ook dat van de universiteit van Tokyo, in vergelijking tot dat van het westen weinig voorstelt. In feite is het toelatingsexamen allesbepalend: wie dat haalt, kan enkele jaren uitrusten van de ratrace naar dat toelatingsexamen toe. Want dat is de werking van het examensysteem op het onderwijs: dat wordt gericht op deze competitieve examens, en vele ouders vullen het voor hun kinderen aan met kostbaar en intensief privé-onderwijs. Ook na de tweede wereldoorlog blijft dit meritocratische stelsel gehandhaafd, en komen ook de kinderen van de Japanse adellijke families rond de keizer onder het meritocratische regime te vallen (Lebra, 1993). Dit stelsel leidt onder de groeiende deelname aan het voorgezet onderwijs tot een nationale bezetenheid met examens (Zeng, 1995). Hoewel de nadelen van dit extreem ver doorgevoerde examensysteem door velen worden gezien, is het niet duidelijk wie dit stelsel op welke manier zouden kunnen veranderen: de Japanners hebben om specifiek culturele redenen voor de extreme meritocratie geen alternatief, omdat deze meritocratie de samenleving beschermt tegen de spanningen en conflicten die anders zouden voortvloeien uit stelselmatige bevoordeling van leden van de eigen familie en groep.

Europa kent in de 19e eeuw nog nauwelijks onderscheid tussen examens die het onderwijs afsluiten en examens die worden gebruikt voor personeelsselectie, zoals dat vandaag nog steeds het geval is bij bijvoorbeeld het Franse concours voor de beperkte toelating tot elite-instellingen in het hoger onderwijs, en in Japan bij de selectie voor prestigieuze universiteiten zoals de universiteit van Tokyo: deze examens vormen de bekroning van het voorafgaande middelbare onderwijs, en zijn de facto de toelatingsselectie tot maatschappelijke topposities. In de 19e eeuw is onderwijs zowel een investering in menselijk kapitaal als een instrument om te sorteren. Met de uitbreiding van het onderwijs zoals dat vooral na de Tweede Wereldoorlog het geval is, lijkt de beoordeling van de prestaties van leerlingen zijn functie als personeelsselectie te verliezen, zelfs zo ver dat er verschillende professies ontstaan: specialisten gericht op toetsen als beoordelingsinstrumenten, en psychologen die werken met tests als instrumenten bij de personeelsselectie. Deze scheiding van professies brengt ook een scheiding van professionele codes met zich mee. In het veld van de personeelsselectie is een professionele code een vanzelfsprekendheid en is deze neergelegd in richtlijnen uitgevaardigd door professionele organisaties van psychologen en personeelsfunctionarissen, zoal niet in wetgeving of in CAO's (de aanbevelingen van de Commissie Hessel: Een sollicitant is ook een mens). Nederlandse docenten die hun eigen toetsen gebruiken ontberen tot nog toe een professionele code, terwijl in de Verenigde Staten recent door organisaties van leraren wèl codes zijn ontwikkeld (Code of professional responsibilities in educational measurement, 1995).

Er is altijd al vermoed dat examens niet perfect betrouwbaar en geldig zijn, zoals door Thorbecke in 1851:

Ik moet opmerken, dat een besluit uit een examen, hoe ook ingerigt, geenszins in allen deele wis is.

Het is beter, ook om de examenvrees van de kandidaten te verminderen,

wanneer het examen zóó wordt afgenomen, dat niet meer de geheele toekomst der jonge menschen van den uitslag van het examen afhangt (Thorbecke, 1978, p. 79).

De eerste uitvoerige analyse van de betrouwbaarheid van examens gebeurt door Edgeworth in 1988 (p. 626; zie ook Roach 1971, p. 283): hij merkt op dat examens in feite functioneren als loterijen, waar iemands kansen op succes samenhangen met de mate waarin men over meer, respectievelijk minder vaardigheden beschikt dan andere deelnemers. De gewogen loting zoals in Nederland sinds 1975 gebruikt voor studies met een door de overheid vastgesteld beperkt aantal beschikbare plaatsen zou met dit technische argument van Edgeworth te onderbouwen zijn. De Tweede Kamer stemde voor deze gewogen loting in feite in met een combinatie van het meritocratische principe dat behaalde cijfers beslissend zijn, en het gelijkheidsbeginsel dat onder gelijk gekwalificeerden alleen nog kan worden geloot (Frijhoff, 1992a).

Kenmerkend voor de ontwikkeling in het beoordelen in de 18e en 19e eeuw is dat het een ernstige aangelegenheid wordt waar voor de beoordeelden zeer grote belangen op het spel staan. Het gaat niet langer alleen om de eer de prijs te winnen, nu hangt ook de toekomstige loopbaan ervan af. Het is geen wonder dat in die omstandigheden de beoordelingen het onderwijsklimaat gaan bepalen: het beoordelen dient nu vele andere heren en belangen naast het traditionele belang van de cultuuroverdracht. Het beoordelen dient niet langer didactische doelen, maar dicteert deze in de vorm van blokken voor examens die alleen gaan over delen van de stof die examineerbaar zijn. Rothblatt (1982) schetst deze ontwikkeling in zijn studie over de examendruk voor studenten in Oxford en Cambridge in het begin van de 19e eeuw. Voortaan telt voor studenten alleen nog datgene wat uiteindelijk ook zal worden geëxamineerd. Die misvorming van de motivatie is tot op heden bij ons gebleven, ook in de beweging voor 'authentiek toetsen' (Berlak et aliis, 1992), die nog steeds een beweging voor toetsen is, stilzwijgend veronderstellend dat toetsen en onderwijs niet zonder elkaar kunnen.

Omdat er nu zoveel afhangt van de uitslag van proefwerken, overgangsvergaderingen, en examens, bestaat er grote druk in de richting van het gebruik van vragen waarbij verschillende beoordelaars het makkelijk met elkaar eens kunnen zijn over wat juiste en wat foute antwoorden zijn, en op procedures voor het tellen van fouten en het toekennen van cijfers die de indruk van nauwkeurigheid en objectiviteit geven. Beoordelaars staan nu als examinator aan de kant van de staat of van hun professie, en niet meer zoals de middeleeuwse meester aan de kant van de leerling en de student. Beoordelen op verdienste heeft zijn keerzijde: hij leidt ook tot vergroting van de afstand tussen beoordelaars en beoordeelden. Toch heeft dat meritocratische beoordelen, eenmaal gemeengoed, het mede mogelijk gemaakt dat in de twintigste eeuw geleidelijk aan getalenteerden uit alle maatschappelijke lagen meer gelijke onderwijs- en loopbaanmogelijkheden worden geboden, hoewel dit in de woorden van sommigen, zoals Ringer (1979, p. 261), een twijfelachtig goed is. De wortel van die twijfel ligt in de aard van de nadruk op verdienste: er zijn immers grote investeringen nodig om zich die verdienste te verwerven, en niet iedereen kan of wil zich die investering permitteren. In elitaire kring in de 19e eeuw worden examens dan ook niet als bedreiging van de eigen maatschappelijke positie gezien, integendeel (Sutherland, 1984). Roach (1971) citeert een uitspraak van Gladstone uit 1854:

I do not hesitate to say that one of the great recommendations of the change (to open competition) in my eyes would be its tendency to strengthen and multiply the ties between the higher classes and the possession of administrative power. As a member of Oxford I look forward eagerly to its operation. There, happily we are not without some lights of experience to throw upon this part of the subject. The objection which I always hear there from persons who wish to retain restrictions upon elections is this: 'If you leave them to examinations, Eton, Harrow, Rugby, and the other public schools will carry everything.' I have a strong impression that the aristocracy of this country are even superior in natural gifts, on the average, to the mass; but it is plain that with acquired advantages their insensible education, irrespective of booklearning, they have an immense superiority. This applies in its degree to all those who may be called gentlemen by birth and training. (p. 193)

Naar het minder bedeelde deel van de samenleving leveren examens met hun beloning naar verdienste het argument dat de beter bedeelde posities 'verdiend' zijn, zoals dat in extreme mate met de examens in het keizerlijke China het geval was.

De geschiedenis van de 18e en 19e eeuw laat zien hoe examens worden gebruikt voor doelen die soms ver zijn verwijderd van oorspronkelijke doelen van het onderwijs, ja dat examens worden ingezet om deze doelen juist te bepalen, en dat er vervolgens opleidingen ontstaan die voorbereiden op deze examens. Dat beleid, of dat nu van een overheid komt of van maatschappelijke belangengroepen, is sinds de 19e eeuw niet wezenlijk veranderd, zoals onlangs nog eens gedemonstreerd met Engeland's 1988 National Curriculum en het daaraan gekoppelde testprogramma (zie Blenkin en Kelly, 1992, voor een kritische analyse op basis van de eerste ervaringen in nursery schools en primary education). Deze historische ontwikkeling botst met de hedendaagse mythe dat een examen niet meer is dan de afsluiting van een onderwijsprogramma. Daarom hoort bij de vraag naar de geldigheid van dit of van dat examen, samen met de voorbereidende proefwerken en overgangsbeslissingen, ook een historische analyse, een uitbreiding op de geldigheidsanalyse waar Messick (1995) een breed voorstel voor heeft gedaan. De hoge status van examens en toetsen kan wel wat minder, ten gunste van bijvoorbeeld 'handelingsonderdelen' die in een examendossier een plaats kunnen krijgen. Dan is het ook mogelijk om eerlijk te zijn over de toetsen en examens die nog overblijven en te erkennen dat deze vooral zijn bedoeld om de studie te sturen: het algemene toetsmodel in deel twee gaat uit van deze 'sturing.'




Chinese examens als voorbeeld voor de westerse?

Het is algemeen erkend dat de Chinese examens de oudst bekende examens zijn, maar over de mogelijke invloed op de opkomst en de vorm van westerse examens is minder met zekerheid bekend; ook zonder die invloed zijn China's examens de moeite van het bestuderen waard omdat zij in uitvergrote vorm de relatie tussen examens en onderwijs, en tussen meritocratie en maatschappelijke ongelijkheid laten zien. De plaats die de Chinese examens in de samenleving innemen heeft meerdere auteurs verleid tot het maken van vergelijkingen met Europese examens en welke rol deze spelen voor de maatschappelijke elite in bijvoorbeeld Duitsland en Engeland. Daarbij treedt het meritocratische karakter van deze examens op de voorgrond, en daarmee de paradox dat examens die verdienste belonen samen kunnen gaan met het bestendigen van maatschappelijke ongelijkheid. De ontwikkelingen in Europa ten tijde van de vorming van sterke overheidsapparaten laten steeds meer overeenkomsten met deze Chinese situatie zien, zodat de vraag opkomt in hoeverre China's examens ook als model hebben gediend: dat was in de politieke discussie over de gewenste selectie van hoge ambtenaren zeker het geval. Omdat in het keizerlijke China de kracht van de examens de ontwikkeling van een behoorlijk onderwijsstelsel altijd heeft verhinderd, is dit een geschikt casus voor bezinning op de relatie tussen beoordelen en onderwijzen.

In de huidige literatuur over beoordelen in het onderwijs worden de keizerlijke Chinese examens vaak genoemd als de oudste bekende schriftelijke examens (Webber, 1989; DuBois, 1965, p. 8). De examens, en het soort bureaucratie waarmee zij samenhangen, lokken ook vergelijkingen uit met westerse situaties. Ringer (1969) trekt een vergelijking tussen de stand van de Chinese mandarijnen en die van de Duitse academici van voor de Tweede Wereldoorlog. Ook Wilkinson (1964) doet dat, maar dan gaat het om de Engelse machtsdragers die een gemeenschappelijk verleden hebben in hun public schools, zoals door Bishop (1967) samen met Wilkinson voor de laatste twee eeuwen is uitgetekend met empirische gegevens over de loopbanen van oud-leerlingen van Winchester, compleet met stambomen van Wykehamist families en hun onderlinge verbindingen. De keizerlijke examens gaan over de klassieken uit het Chinese erfgoed, zoals de boeken van Confucius en Mencius (vertaald door James Legge, 1892), naar aard maar zeker niet naar inhoud vergelijkbaar met de overwegend 'klassieke' literatuur waar de middeleeuwse universiteiten in Europa mee bezig zijn. De sociale klasse van Chinezen die voor zo'n examen zijn geslaagd wordt dan ook wel aangeduid als 'de literati,' zoals in het essay van Max Weber (1947) over deze literati.

Deze examens geven toegang tot de overheidsdienst en zijn buitengewoon selectief. Ze zijn voor het eerst op betekenisvolle schaal gebruikt in de T'ang dynastie rond 800, en in 1905 afgeschaft. De examens kennen een hiërarchische structuur: 'hogere' examens zijn alleen toegankeljk voor wie voor de voorgaande is geslaagd. Een korte karakteristiek van de eenvoudige provinciale examens is als volgt te geven. Om met enige kans van slagen deel te kunnen nemen is een intensieve studie van zeer lange duur nodig. De examens worden om de drie jaar gehouden in speciaal daarvoor gebouwde centra, waarbij van de vele duizenden deelnemers slechts enkele procenten slagen; wie niet slaagt, kan na drie jaar hard studeren opnieuw deelnemen. Het examen vindt plaats gedurende drie opeenvolgende dagen die men afgesloten van de wereld doorbrengt, in het eigen hokje ook afgesloten van de duizenden andere met wie geen contact mag worden onderhouden. Het examen is schriftelijk, en wordt zo onpersoonlijk mogelijk beoordeeld waartoe het gemaakte werk zelfs door klerken eerst wordt overgeschreven om herkenning van handschriften uit te sluiten. De omstandigheden van het examen zijn intimiderend, wat gevoegd bij de bijgelovigheden waarmee het afleggen van deze examens is omringd het geheel tot een zo overspannen gebeurtenis maakt dat de kenschets 'examenhel' ongetwijfeld raak is. Er kunnen maar een beperkt aantal geslaagden zijn, waarbij de eerste plaatsen nog weer een bijzondere betekenis hebben. De geslaagden genieten een ongelooflijk hoog maatschappelijk aanzien, zoals door Van Gulik beschreven met de hoofdfiguur in zijn 'rechter Tie' verhalen, en hoewel er lang niet altijd meteen een zorgeloze overheidsloopbaan volgt is die dan niet meer veraf. Voor wie niet slaagt, is de investering in de studie van de klassieken niet anders terug te verdienen dan in het doen van een nieuwe poging: er zijn nauwelijks maatschappelijke alternatieven, zelfs werken als leraar is door de lage status van dat beroep zeer onaantrekkelijk.

De examens zijn door-en-door meritocratisch, onder invloed van de Confuciaanse filosofie over de plaats van verdienste in een hiërarchische samenleving (Ho, 1968, p. 6); om aan deze meritocratische competitie mee te kunnen doen moet de familie wel over aanzienlijke middelen beschikken om zijn kandidaat gedurende zeer veel jaren vrij te kunnen stellen van produktieve arbeid. Hoewel deze examens meer dan twee millennia hebben bestaan, hebben ze in verschillende perioden ook verschillende vormen en functies gehad. Voor de T'ang dynastie, ca. 800, zijn ze beschreven door Des Rotours (1932, een vertaling van Chinese bronnen), Waley (1949) en Herbst (1988); voor de Sung dynastie, ca.1100, door Lee (1985); voor de Ming en de Tsing dynastieën van de 14e eeuw tot 1905, door Ho (1968) in Ladder of success en Miyazaki (1985) in China's examination hell.

De examencultuur in Europa heeft tussen de vroege 18e en de late 19e eeuw op vele onderdelen ingrijpende veranderingen ondergaan en heeft daarmee een sterkere gelijkenis met de Chinese examens verkregen: van mondeling naar schriftelijk, van gering persoonlijk belang tot bepalend voor ambtelijke loopbanen, van louter formeel tot bedoeld competitief, van kleine aantallen deelnemers tot aantallen die ver uit gaan boven beschikbare plaatsen. Deze ontwikkeling van examenvormen in de richting van gelijkenis met Chinese examens suggereert de mogelijkheid van enige invloed die van het Chinese model is uitgegaan. Europese intellectuelen in de 18e eeuw vereren China, en hun examenstelsel is in grote lijnen bekend. Adshead (1995) geeft een overzicht van de invloeden van China op de ontwikkeling van westerse en andere culturen. In de 18e en 19e eeuw zijn er tal van invloeden in de richting van meer competitieve examens, zoals het tot stand komen van vrije handel die in de mening van velen ook voor het bestuur en het onderwijs een goed model zou kunnen zijn (Roach, 1971, p. 16). Toch verdient de mogelijkheid van Chinese examens als model aandacht omdat in publieke discussies over selectie voor hogere ambtelijke posten velen zich er voorstander van tonen om examens naar het Chinese voorbeeld in te richten. Bijzonderheden over de manier waarop het Chinese model van invloed is op het Europese denken in de 18e en 19e eeuw over examens en hun plaats in de samenleving geven Têng (1943) and Guy (1965).

De mogelijke Chinese band, ook al zou die alleen maar een bevestiging zijn geweest in autonome Europese ontwikkelingen naar competitieve examens, vormt een extra prikkel tot reflectie op de dominante positie die examens in de hedendaagse samenleving hebben. De Chinese examens waren voor de keizer een middel om hoge ambtenaren te selecteren. Er bestond geen onderwijsstelsel waar deze examens onderdeel van uitmaakten. Integendeel: het bestaan van deze examens verhindert de ontwikkeling van een behoorlijk onderwijsstelsel, waartoe alleen in de Sung-periode rond 1100 een enkele serieuze maar mislukte poging wordt ondernomen door Wang An-Shih (Needham, 1961, p. 139). Het Chinese voorbeeld is dat van een examenstelsel dat de kwaliteit en zelfs het bestaan van een onderwijsstelsel heeft bedreigd, zoals het ook heeft bijgedragen aan het onvermogen van de mandarijnen in de 19e eeuw om China te verdedigen tegen de Europese en Amerikaanse overrompeling. De boodschap is dat selecteren geen produktief proces is: een samenleving die de vorming van menselijk kapitaal in het onderwijs ernstig neemt, doet er goed aan ervoor te zorgen dat selectieprocessen niet ten koste gaan van die vorming.




Synthese en discussie

De geschiedenis van het beoordelen in het onderwijs, van leren waarderen, is besproken door deze uiteen te leggen in zes thema's, met de examens van het keizerlijke China en hun mogelijk voorbeeldwerking voor Europa als zevende thema. Wat zo is onderscheiden in thema's is toch onderling sterk verbonden, zoals incidenteel in het voorgaande al bleek. Een sterke lijn is de ontwikkeling van competitie om te motiveren naar competitie als selectie. Competitie voor selectieve examens zet door zijn enorme belang voor alle betrokkenen zijn stempel op het 19e-eeuwse en daamee ook op het 20e-eeuwse onderwijs. Competitie is dan geen instrument meer om leerlingen en studenten alleen maar te motiveren: het wordt bepalend voor de manier van studeren, en via de voorgeschreven inhoud van de examens ook voor de inhoud van het onderwijs. Deze ontwikkeling in de plaats van competitie in het onderwijs raakt alle zes thema's, en heeft zijn analogie in het oude China. Dat competitie in het westerse onderwijs zo belangrijk wordt is geen natuurwet, maar is bepaald door specifieke culturele omstandigheden. Als dat zo is, dan moet het mogelijk zijn een didakometrie te ontwikkelen waarin geen competitie aanwezig is, noch in motiverende, noch in selecterende zin: in deel twee zal daarvan een voorbeeld worden gegeven in de vorm van een algemeen toetsmodel. Maar daar waar competitie in welke vorm dan ook aanwezig is, zou deze behoorlijk beschreven moeten kunnen worden: een techniek daarvoor zal worden ontwikkeld en toegepast in deel drie.

Aanvankelijk, zoals in de tijd van Karel de Grote, is er eenheid tussen de motivatie van leerlingen, de inhoud van het onderwijs, en de aansluiting daarvan op wat in de praktijk van alledag, ook aan het hof, nodig is aan kennis. Het uit het hoofd leren van een grammatica voor een taal die volslagen vreemd is moet dan toch al tot de minder aangename momenten van het onderwijs hebben behoord, maar dat onderwijs was door meesters zoals Pernolf, en Bernard van Chartres, geïntegreerd in hoe zij met hun leerlingen de klassieke teksten behandelden (Jaeger, 1994, p. 128). Het onderwijs rond het jaar 1000 is vitaal, maar het is onderwijs in een charismatische cultuur, niet in een intellectuele cultuur (Jaeger 1994), en heeft om die reden weinig in geschrift nagelaten, maar wel sporen in de stroming van het humanisme. De intellectuele cultuur van de late middeleeuwen, nog gedomineerd door het scholasticisme, ging toch gepaard met een hoge mate van leergierigheid die andere prikkels om te leren niet direct nodig maakte. In de 15e eeuw zetten dan ontwikkelingen in de organisatie van het onderwijs in, zoals de vorming van klassikale en nog kleinere groepen, die samen met de humanistische nadruk op het belonen van goede prestaties leiden tot de strak gereglementeerde en op competitie als motiverende kracht gebouwde didactiek van de jezuïeten (O'Malley, 1993). In het Europese onderwijs in de 17e eeuw is het rangordenen naar prestaties wijd verbreid, maar het blijft verbonden aan de bedoeling om het leren te prikkelen, en heeft weinig gevolgen voor de latere maatschappelijke positie van de leerlingen omdat deze vooral door afkomst en rijkdom wordt bepaald. Dat de rangorde van leerlingen in feite berust op nauw gedefinieerde kennis en intellectuele capaciteiten deert weinigen, het gaat bovendien in het onderwijs nog steeds vooral om zijn vormende waarde. In de 18e en vooral de 19e eeuw slaat het competitieve klimaat om van ritueel spel naar zakelijke ernst.

Zodra de Europese staten behoefte krijgen aan een bureaucratisch apparaat met goed opgeleide ambtenaren, en aan ingenieurs met specialistische opleidingen, ontstaat in Europa een tot dan onbekende situatie waarin er open competitie mogelijk is voor het verwerven van aantrekkelijke posten of van plaatsen in opleidingen die aantrekkelijke posten garanderen (technische hogescholen op het continent). Dit proces krijgt in verschillende landen onderscheiden vormen en kent onderscheiden uitkomsten, maar overal gaat het om competitieve examens, dus om een proces van meritocratisering (met een knipoog naar Young, 1958). Deze competitie dient niet meer om te motiveren, al is paradoxaal genoeg zijn motiverende kracht juist dan buitengewoon krachtig. De competitie dient om te selecteren, niet alleen omdat er zoveel meer gegadigden zijn dan er plaatsen te vergeven zijn, maar ook omdat competitie in het intellectuele klimaat van de 18e en 19e eeuw een goede naam heeft, zoals in de economische theorie van de vrijhandel en bij de vrije mededinging in de Chinese examens waarvan men in Europa op de hoogte is. De staatsambtenaren die hun positie hebben te danken aan dergelijke competitieve examens zien er een handig instrument in om het onder groeiende staatsinvloed staande onderwijs te reguleren, tot en met stelsels waarin scholen worden bekostigd naar rato van de prestaties van hun leerlingen op examens. Examens gaan zo het dagelijks leven van leerlingen, studenten, en van hun docenten bepalen. Die invloed op het dagelijks leven van de direct betrokkenen gaat heel ver, omdat het onderwijs geheel in de ban raakt van de voorbereiding op deze examens. Van de competitie als alleen maar motivatie voor leerlingen is dan niets meer over: de competitie is niet meer dienstbaar aan het onderwijs, maar bepaalt bij voorrang de inhoud en de vorm van het onderwijs zelf, nadat de staat of andere belangengroepen de inhoud van de examens hebben vastgelegd.

Rond 1800 zijn er dan twee ontwikkelingen die samen resulteren in druk in de richting van versimpeling van examenvragen en daarmee van het onderwijs: de eerste is dat door de toenemende belangen bij de examenuitslagen deze door de examinatoren overtuigend moeten zijn te onderbouwen; de tweede is dat vooral door toenemende aantallen studenten de examens schriftelijk worden en voor alle kandidaten dezelfde vragen bevatten. Het gaat bij examens steeds meer om een type vragen dat tot zo min mogelijk onenigheden leidt bij examinatoren die hetzelfde werk nakijken. De toenemende bureaucratisering van het examineren, waartoe nu ook gaat horen dat afzonderlijke antwoorden met cijfers worden beoordeeld zodat uitslagen op basis van deze cijfers kunnen worden 'berekend,' laat weinig ruimte meer voor complexere vaardigheden en talenten zoals die welke vroeger bij het disputeren een rol speelden. Daar komt nog bij dat sommige examens, zoals de mathematical tripos in Cambridge, naar inhoud weinig tot niets hebben te maken met de functies waarvoor deze examens zulke uitstekende toelatingskansen bieden; in dit opzicht zijn bepaalde Europese examens dan gelijk aan de Chinese examens die evenmin enige praktische relevantie hebben voor het werk van de hoogste bestuurders van de Chinese keizers. Maar ongetwijfeld zijn deze uitwassen van de 19e eeuw in de 20e eeuw verdwenen? Er zijn helaas weinig tekenen die daarop wijzen, waarbij een onderscheid valt te maken naar toetsen in het onderwijs, en personeelsselectie. Het onderwijs ontbeert verantwoorde technieken voor het formuleren van toetsvragen bij gegeven leerstof en doelen (Wilbrink, 1983), zodat leerlingen vaak vragen krijgen voorgelegd die zijn ontsproten aan de creativiteit van hun bedenker maar die geen duidelijke relatie tot relevante onderwijsdoelen hebben. Bij de aansluiting tussen onderwijs en arbeidsmarkt blijkt dat in veel gevallen die aansluiting er niet is, ook in die gevallen waar het onderwijs nadrukkelijk wel is bedoeld om aan te sluiten (zie voor het algemene geval: Van Hoof en Dronkers, 1980; en specifiek voor economen: Wilbrink, 1989). Die aansluiting tussen onderwijs en loopbaan is ook gebrekkig waar het gaat om de relatie tussen examencijfers en succes in het beroep: als die relatie er al is, dan is deze heel gering. Daarmee zijn we beland bij de personeelsselectie; ongetwijfeld zijn de tests die daar worden gebruikt wel relevant? Bij hedendaagse selectieprocedures spelen intelligentietests een belangrijke rol, omdat zij meestal de 'beste' voorspelling voor later functioneren geven. Zie Wilbrink, Van Hoorn, Van der Kamp & Algera, 1990, voor een evaluerende beschrijving van de selectieprocedure voor de Nederlandse Politieacademie waar het hele arsenaal aan tests en technieken van de selectiepsycholoog aan te pas komt. Maar wat is dat 'beste' niveau: dat blijkt hooguit maar een kwart van de variantie in functioneren te verklaren. Dat komt omdat de simpele maar goed gestructureerde vragen in de typische intelligentietest niet kunnen meten hoe mensen omgaan met de complexe en tegelijk ongestructureerde problemen waarmee ze dagelijks in hun beroep en persoonlijk leven worden geconfronteerd (Sternberg, Wagner, Williams & Horvath, 1995). Toch laat het recente werk van Sternberg zien dat het mogelijk is om tests te ontwikkelen voor de praktische intelligentie die het dagelijks leven, in tegenstelling tot schoolse situaties, vraagt; het is dus niet zo dat de noodzaak om tests of examens massaal en toch goedkoop af te kunnen nemen dwingt om simpele vragen te maken. Van welke kant het beoordelen in het onderwijs ook wordt bekeken, alle signalen wijzen erop dat een 19e-eeuwse erfenis de inhoudelijke kwaliteit van toetsen en examens houdt beneden de eisen die daar aan het eind van de 20e eeuw aan mogen worden gesteld.

De competitieve trekken van het huidige westerse onderwijs staan bepaald niet hoog op de agenda van het wetenschappelijk onderzoek, maar toch zijn er talrijke onderstromen waarin die competitie als zodanig wel aan de orde is. Dat is het geval bij onderzoek naar 'effectieve scholen' waarbij scholen in competitieve relaties tot elkaar worden gezet, zoal niet door onderzoekers, dan wel door de overheden die dat onderwijs financieren. Hier dreigt de ontwikkeling zich te herhalen zoals die zich eerder op het niveau van examens heeft voorgedaan: een zekere trivialisering van de doelen van het onderwijs zoals geoperationaliseerd in de examenvragen, respectievelijk de toetsen waarmee men meent de effectiviteit van scholen te kunnen bepalen. Een recent protest tegen deze manier waarop effectiviteit van scholen wordt bepaald is van Proudford & Baker (1995). Competitie zoals die dagelijks in de klas voorkomt is het onderwerp van een stroom van onderzoeken en experimenten naar samen leren als alternatief voor de meer traditionele schooldidactiek. Experimenten op kleine schaal leveren in een cultuur die zo is doordrenkt van het competitieve gemengde resultaten op, maar wanneer twee leerjaren met alle hoofdvakken daarin, na training van de leraren, op de manier van 'samen leren' worden ingericht, blijken de resultaten positief uit te vallen, voor gewone leerlingen zowel als voor leerlingen die anders extra ondersteuning nodig hebben of extra taken zouden moeten krijgen (Stevens & Slavin, 1995). In de onderwijseconomie is de sorteerhypothese de belichaming van de gedachte dat het onderwijs vooral selecteert, en niet zozeer inhoudelijk toerust. De sorteerhypothese wordt vaak gezet tegenover de theorie van het menselijk kapitaal, de stelling dat het onderwijs vooral kennis en vaardigheden bijbrengt die later tot inkomsten leiden die de onderwijsinvesteringen meer dan compenseren, zowel voor het betreffende individu, als voor de samenleving. Dat de tegenstelling tussen 'sorteren' en 'menselijk kapitaal' een kunstmatige is, en dat competitie juist een drijfveer is achter de groeiende procentuele deelname aan hoger onderwijs, beschrijven Wilbrink & Dronkers (1993).

In de geaccepteerde theorie over toetsen ontbreekt het idee van competitie, hoewel het in het belendende veld van de personeelsselectie wel prominent aanwezig is. De methoden en technieken voor het construeren, afnemen en analyseren van toetsen berusten op het idee dat verschillen tussen leerlingen in kennis en vaardigheden kunnen worden gemeten. Dat idee is op zich correct, maar gaat voorbij aan het feit dat leerlingen zich op toetsen voorbereiden, dat de ene leerling daarbij een andere strategie volgt dan de andere, en dat de keuze voor deze of gene voorbereidingsstrategie zowel afhangt van de manier waarop er wordt getoetst, als met welke concurrenten de toets moet worden afgelegd. In de geaccepteerde theorie is als gevolg van deze aangeduide eenzijdigheid de invloed van competitie een onbekende, hoewel ongetwijfeld aanwezig. Er doemen nu twee hoofdvragen op. De eerste is of er een alternatieve methodologie voor toetsen is te ontwikkelen waarin het competitieve element expliciet is buitengesloten, en de tweede is hoe de competitie bij toetsen en examens onderzoekbaar is te maken. De eerste vraag zal in deel twee bevestigend worden beantwoord, door een algemeen model voor toetsen te ontwikkelen dat geldt voor een enkele leerling, en waarin het investeren in de voorbereiding op toetsen een centrale plaats krijgt. Dit model is een meer algemene variant van het besliskundige tentamenmodel van Van Naerssen (1970) waarmee hij een aanzet beoogde te geven tot het ontwikkelen van een didakometrie die beter dan de psychometrie in staat is om het beoordelen in het onderwijs te structureren. Zo'n model dat geldt voor één enkele student kent per definitie geen competitie, terwijl het toch ook op meerdere studenten tegelijk is toe te passen. De tweede vraag zal in deel drie worden beantwoord door te laten zien hoe de theorie van sociale systemen van Coleman (1990) kan beschrijven hoe studenten in competitie met elkaar investeren in tentamens, en bovendien hoe docenten in competitie met elkaar strijden om die investeringen die studenten doen; het geheel is dan te beschrijven als een onderhandelingssituatie tussen de collectieven van studenten en docenten. De 'wetmatigheid van Posthumus,' het verrassend constante percentage 'onvoldoende' beoordelingen in vele onderwijssituaties, is met deze theoretische benadering te verklaren als de uitkomst van een 'dodelijke omarming' waarin leraren en leerlingen elkaar vasthouden.




Referenties


Ackstaller, J. (1933). Das Helfersystem in der Mittelalterlichen Schulerziehung. Dissertation, Munich.

Adshead, S. A. M. (19952). China in world history. London: Macmillan.

Ahsmann, M. (1990). Collegia en colleges. Juridisch onderwijs aan de Leidse universiteit 1575-1630 in het bijzonder het disputeren. Groningen: Wolters-Noordhoff / Egbert Forsten.

American Psychological Association. (1994). Publication manual of the American Psychological Association (4th ed.). Washington, DC: American Psychological Association

Astin, A. W. (1985). Achieving educational excellence. San Francisco: Jossey-Bass.

Aquinas, Th. (1993). Selected philosophical writings. Selected and translated by T. McDermott. Oxford: Oxford University Press.

Ariès, Ph. (1960). L' enfant et la vie familiale sous l'ancien régime. Paris: Plon.

Ball, W. W. R. (19212). Cambridge notes, chiefly concerning Trinity College and the University. Cambridge: Heffer & Sons.

Bannenberg, G. P. J. (1953). Organisatie en bestuur van de middeleeuwse universiteit. Nijmegen, Katholieke Universiteit

Bartels, A. (1963). Een eeuw middelbaar onderwijs 1863-1963. Groningen: Wolters.

Bazan, B. C. (1982). La 'quaestio disputata', in Les genres littéraires dans les sources théologiques et philosophiques médiévales. Louvain-la-Neuve. 31-50.

Berkey, J. (1992). The transmission of knowledge in medieval Cairo. A social history of Islamic education. Princeton: Princeton University Press.

Berlak, H., Newman, F. M., Adams, E., Archbald, D. A., Burgess, T., Raven, J., & Romberg, T. A. (1992). Toward a new science of educational testing and assessment. Albany, NY: SUNY.

Bishop, T. J. H. (1967). Winchester and the public school elite. A statistical analysis. London: Faber and Faber.

Blenkin, G. M., & Kelly, A. V. (1992). Assessment in early childhood education. London: Paul Chapman.

Blom, N. van der (1978). Grepen uit de geschiedenis van het Erasmiaans Gymnasium 1328-1978. Rotterdam: Backhuys.

Blom, S. (1995). Intellectuele vorming in Nederland en Frankrijk. Een vergelijkend onderzoek naar deelname aan intellectuele vorming in het Franse en het Nederlandse voortgezet onderwijs. Groningen: Wolters-Noordhoff.

Bloom, B. S., et al. (1956). Taxonomy of educational objectives. The classification of educational goals. New York.

Borst, A. (1993). The ordering of time. From the ancient computus to the modern computer. Cambridge: Polity Press.

Bot, p. N. M. (1955). Humanisme en onderwijs in Nederland. Utrecht/Antwerpen.

Bowen, J. (1972). A history of western education. Volume One. The ancient world: orient and mediterranean 2000 B.C. - A.D. 1054. London: Methuen.

Bowman, M. J., with Ikeda, H., & Tomoda, Y. (1981). Educational choice and labor markets in Japan. Chicago: The University of Chicago Press.

Broadfoot, p. (ed.), Profiles and records of achievement. London: Cassell education, 1989.

Broadfoot, p. , Murphy, R., & Torrance, H. (eds) (1990). Changing educational assessment: international perspectives and trends. London: Routledge.

Brokaw, C. J. (1991). The ledgers of merit and demerit. Social change and moral order in late imperial China. Princeton, New Jersey: Princeton University Press.

Bryant, M. E. (1986). The London experience of secondary education. London: The Athlone Press.

Buchinger, H. Zur Geschichte von Zensuren und Zeugnissen in der bayerischen Realschule. In Prinz von Hohenzollern, J. G. & Liedke, M. (1991). Schülerbeurteilungen und Schulzeugnisse. Historische und systematische aspekte. Bad Heilbrunn: Julius Klinkhardt. 95-110.

Bullough, V. L. (1978). Achievement, professionalization, and the university. In J. IJsewijn, & J. Paquet (Eds.) The universities in the late middle ages. Leuven, at the University Press. 497-510.

Carruthers, M. (1990/92). The book of memory. A study of memory in medieval culture. Cambridge: Cambridge UP.

Clark, B. R. (ed.) (1985). The school and the university. An international perspective. London: University of California Press

Chapman, R. A. (1984). Leadership in the British civil service. A study of Sir Percival Waterfield and the creation of the civil service selection board. London: Croom Helm.

Code of professional responsibilities in educational measurement. Prepared by the NCME Ad Hoc Committee on the Development of a Code of Ethics: C. B. Schmeiser (chair), K. F. Geisinger, S. Johnson-Lewis, E. D. Roeber, & W. D. Schafer. 1995, National Council on Measurement in Education. Opgenomen als catern in Educational Measurement; Issues and Practice, 1995, Fall.

Codina Mir, G. (1968). Aux sources de la pédagogie des Jésuites; le 'Modus Parisiensis.' Roma: Institutum Historicum S.I.

Cohen, H. F. (1994). The scientific revolution. Historiographical inquiry. Chicago: Chicago University Press.

Cohen, M. J. (1981). Studierechten in het wetenschappelijk onderwijs. Zwolle: Tjeenk Willink.

Coleman, J. S. (1990). Foundations of social theory. London: The Belknap Press of Harvard University Press.

Coleman, J. (1992). Ancient and medieval memories. Studies in the reconstruction of the past. Cambridge: Cambridge University Press.

Compère, M-M. (1985). Du collège au lycée (1500-1850). Généalogie de l'enseignement secondaire français. Parijs: Gallimard/Julliard.

Crossland, M. (1995). Studies in the culture of science in France and Britain since the enlightenment. Aldershot: Variorum.

Deutsch, M. (1979). Education and distributive justice: some reflections on grading systems. American Psychologist, 34, 379-401.

Dodge, B. (1962). Muslim education in medieval times. Washington, DC.: The Middle East Institute.

Dronkers, J., & Hillige, S. (1995). De besturen van studentencorpora en de toegang tot de Nederlandse elites. Amsterdams Sociologisch Tijdschrift, 21(4), 37-64.

DuBois, p. H. (1965). A test-dominated society: China 1115 B.C. - 1905 A.D. Proceedings of the 1964 Invitational Conference on Testing Problems. Princeton: Educational Testing Service.

Eckstein, M. A., & Noah, H. J. (eds) (1992). Examinations: comparative and international studies. Oxford: Pergamon Press.

Eckstein, M. A., & Noah, H. J. (1993). Secondary school examinations. International perspectives on policies and practice. New Haven: Yale University Press.

Edgeworth, F. V. (1888) The statistics of examinations. Journal of the Royal Statistical Society, 51, 599-635 JSTOR read online free, also 'The element of chance in competitive examinations', ibid, vol. LIII (1890), pp. 460-75 JSTOR read online free, 644-63 JSTOR read online free

Eldersveld, S. J., Kooiman, J., & van der Tak, Th. (1981). Elite images of Dutch politics. Accommodation and conflict. Den Haag: Nijhoff.

Engel, A. (1974). Emerging concepts of the academic profession at Oxford 1800-1854. In Stone, L. The university in society. Vol I Oxford and Cambridge from the 14th to the early 19th century. Princeton University Press. p. 305-351.

Epstein, S. A. (1991). Wage labor and guilds in medieval Europe. Chapel Hill, NC.: University of North Carolina Press.

Fasseur, C. (1993). De indologen. Ambtenaren voor de Oost 1825-1950. Amsterdam: Bert Bakker.

Ferruolo, S. C. (1988). Parisius-Paradisus: The city, its schools and the origins of the university of Paris. In Bender, T.: The university and the city, from medieval origins to the present. Oxford: Oxford University Press. 22-46

Fischer, W., & Lundgreen, p. (1975). The recruitment of administrative personnel. In Tilly, C. (ed.). The formation of national states in western Europe. Princeton: Princeton University Press. 456-561

Foden, F. (1989). The examiner. James Booth and the origins of common examinations. Leeds: School of Continuing Education.

Fortgens, H. W. (1956). Meesters, scholieren en grammatica uit het middeleeuwse schoolleven. Zwolle: Tjeenk Willink.

Fortgens, H. W. (1958). Schola latina. Uit het verleden van ons voorbereidend hoger onderwijs. Zwolle: Tjeenk Willink.

Frederiks, J. (1960). Ontstaan en ontwikkeling van het Zwolse schoolwezen tot omstreeks 1700. Een historische studie. Proefschrift VU. Zwolle: Tijl.

Freudenthal-Lutter, S. J. C. (1964). Algehele doorlichting. Anderhalve eeuw kritisch denken over de klassikale school. Een bloemlezing uit de pedagogische pers 1796-1964. Voor de werkgroep Jena-plan van de w.v.o. uitgegeven door J. Muusses nv Purmerend.

Freudenthal-Lutter, S. J. C. (1975). Naar de basisschool van morgen. Alphen aan den Rijn: Samsom.

Frijhoff, W. (1981). La société néerlandaise et ses gradués, 1575-1814. Amsterdam: APA Holland University Press.

Frijhoff, W. T. M. (1990). Latijnse school en gymnasium als schooltype tot in de negentiende eeuw. In Frijhoff, W. T. M. et al.: Tempel van hovaardij; zes eeuwen Stedelijk Gymnasium Haarlem. Haarlem; De Vrieseborch. 7-24.

Frijhoff, W. (1992a). The Netherlands. In Clark, B. R., & Neave, G. R. (Eds.). The encyclopedia of higher education. Oxford: Pergamon Press. I, 491-504

Frijhoff, W. (1992b). Universities: 1500-1900. In Clark, B. R., & Neave, G. R. (Eds.). The encyclopedia of higher education. Oxford: Pergamon Press. II 1251-1259.

Geisinger, K. F. (1982). Marking systems. In Mitzel, H. E. (Ed.). Encyclopaedia of educational research. New York: The Free Press, 1139-1149.

Genres littéraires dans les sources théologiques et philosophiques médiévales (1982). Louvain-la-Neuve.

Gifford, B. R., & O'Connor, M. C. (Eds.) (1992). Changing assessments. Alternative views of aptitude, achievement and instruction. Dordrecht: Kluwer.

Goodlad, J. I., & Anderson, R. H. (1963/1973). The nongraded elementary school. New York: Harcourt, Brace, Jovanovich.

Groot, A. D. de (1966). Vijven en zessen. Groningen: Wolters-Noordhoff.

Groot, A. D. de (1972). Selectie voor en in het hoger onderwijs. Een probleemanalyse. Deel 1. 's-Gravenhage: Staatsuitgeverij.

Groot, A. D. de, & van Naerssen, R. F. (redactie) (1969). Studietoetsen: construeren, afnemen, analyseren. Den Haag: Mouton.

Guy, B. (1963) The Chinese examination system and France, 1569-1847. In vol. 25 of Besterman, T. Studies on Voltaire and the eighteenth century, vol. 25, 741-778. Geneva: Institut et Musée Voltaire.

Haas, M. de (1926). Bossche scholen van 1629 tot 1795. Proefschrift Universiteit van Amsterdam.

Hadot, p. (1982). La préhistoire des genres littéraires philosophiques médiévaux dans l'Antiquité. in Les genres littéraires dans les sources théologiques et philosophiques médiévales. Louvain-la-Neuve. 1-10.

Hall, G. (1989). Records of Achievement. Issues and practice. London: Kogan Page.

Hanson, F. A. (1993). Testing testing. Social consequences of the examined life. Berkeley: University of California Press. online

Harris, N. (1990). The law relating to schools. London: Fourmat.

Harrison, C. (1995). Youth and White paper: The politics of literacy assessment in the United Kingdom. English Journal, feb 1995, 115-119.

Heyneman, S., & Ransom, A. W. (1990): Using examinations and testing to improve educational quality. Educational Policy, 4, 177-192. Reprinted in Eckstein, M. A., & Noah, H. J. (1992). Examinations: comparative and international studies. Oxford: Pergamon Press. 105-120

Herbst, p. A. (1988). Examine the honest, praise the able. Canberra: Australian National University, Faculty of Asian Studies.

Herwerden, p. J. van (1947). Gedenkboek van het Stedelijk Gymnasium te Groningen. Groningen: Wolters.

Ho, p. T. (1962). The ladder of success in imperial China. Aspects of social mobility, 1368-1911. New York: Columbia University Press.

Hoof, J. J. van, & Dronkers, J. (1980). Onderwijs en arbeidsmarkt. Deventer: Van Loghum Slaterus.

Holleman, J. W. (1993). Over studielast en studeerbaarheid. Proefschrift Rijksuniversiteit Utrecht.

Hoskins, K. (1979). The examination, disciplinary power and rational schooling. History of Education, 8, 135-146.

Hu, C. T. (1984). The historical background: examinations and control in pre-modern China. Comparative Education, 20, 7-26.

Hudson, B. (1987). Justice through punishment. A critique of the 'justice' model of corrections. Macmillan Education.

Humphries, S. (1981). Hooligans or rebels? An oral history of working-class chldhood and youth 1889-1939. Oxford: Blackwell.

Hyman, I. A. 1990). Reading, writing, and the hickory stick. The appalling story of physical and psychological abuse in American schools. Lexington, Massachusetts: Lexington Books.

IJsselmuiden, p. G. van (1988). Binnenlandse zaken en het ontstaan van de moderne bureaucratie in Nederland 1813-1940. Kampen: Kok.

Ingenkamp, K. (1972). Zur Problematik der Jahrgangsklasse. Weinheim: Beltz

Jaeger, C. S. (1994). The envy of angels. Cathedral schools and social ideals in Medieval Europe, 950-1200. University of Pennsylvania Press.

Jessup, G. (1991). Outcomes. NVQs and the emerging model of education and training. London: Falmer.

Julia, D. (1990). Gaspard Monge, examinateur. Histoire de l'éducation, no. 46, 111-133.

Kantorowicz, H. (1939). The quaestiones disputatae of the glossators. Tijdschrift voor rechtsgeschiedenis, 16, 1-67.

Kellner, p. , & Lord Crowther-Hunt (1980). The civil servants. An inquiry into Britain's ruling class. London: Macdonald & Janes.

Kingston, p. W., & Lewis, L. (eds) (1990). The high-status track. Studies of elite schools and stratification. New York: State University of New York Press.

Kliebard, H. M. (1995). Why history of education? Journal of Educational Research, 88, 194-199. preview

Kretzmann, N., Kenny, A., & Pinborg, J. (Eds.) (1982). The Cambridge Later Medieval Philosophy. Cambridge: Cambridge University Press.

Kretzmann, N., & Stump, E. (Eds.) (1988). The Cambridge translations of medieval philosophical texts. Volume one: logic and the philosophy of language. Cambridge university Press.

Kubota, A. (1969). Higher civil servants in postwar Japan. Their social origins, educational backgrounds, and career patterns. Princeton: Princeton University Press.

Kula, W. (1986). Measures and men. Princeton, New Jersey: Princeton University Press.

Lansink, H. G. J. (1967). Studie en onderwijs in de nederduitse provincie van de Karmelieten gedurende de middeleeuwen. Proefschrift Katholieke Universiteit Nijmegen.

Laudan, L. (1977). Progress and its problems. Towards a theory of scientific growth. Berkeley: University of California Press.

Lawn, B. (1993). The rise & decline of the scholastic 'quaestio disputata' with special emphasis on its use in the teaching of medicine and science. Leiden: Brill.

Lebra, T. S. (1993). Above the clouds. Status culture of the modern Japanese nobility. Berkeley: University of California Press.

Lee, T. H. C. (1985). Government education and examinations in Sung China. Hong Kong: The Chinese University Press.

Legge, J. (1892). The Chinese Classics. Oxford: Oxford University Press.

Lewry, O. (1982). Thirteenth-century examination compendia from the faculty of arts. In Les genres littéraires dans les sources théologiques et philosophiques médiévales. Louvain-la-Neuve. 101-116.

Lienert, G. A. (1987). Schulnotenevaluation. Frankfurt a.M.: Athenäum.

Lim, R. (1995). Public disputation, power, and social order in late antiquity.

Lindroth, S. (1976). A history of Uppsala University 1477-1977. Uppsala: Uppsala University (Stockholm: Almqvist & Wiksell).

Linn, R. K. (Ed.) (1989). Educational measurement. New York: American Council on Education • Macmillan.

Lowe, E. A. (1926). Handwriting. In Crump, C. G., & Jacob, E. F. (eds) (1926). The legacy of the middle ages. Oxford university Press. 197-226

Macdonald, K. (1995). The sociology of the professions. London: SAGE.

Madigan, R., Johnson, S., & Linton, p. (1995). The language of psychology: APA style as epistemology. American Psychologist, 50, 428-436.

Makdisi, G. (1974). The scholastic method in medieval education: an inquiry into its origins in law and theology. Speculum, 49, 640-661.

Makdisi, G. (1981). The rise of colleges: institutions of learning in Islam and the west. Edinburgh University Press.

Marrou, H-I. (1948/1975). Histoire de l'éducation dans l'antiquité. Paris: Éditions du Seuil.

McClelland, C. E. (1980). State, society, and universities in Germany 1700-1914. Cambridge: Cambridge University Press.

McClelland, C. E. (1991). The German experience of professionalization. Modern learned professions and their organizations from the early nineteenth century to the Hitler era. Cambridge: Cambridge University Press.

McDaniel, M. A., & Pressley, M. (Eds) (1987). Imagery and related mnemonic process. Theories, individual differences, and applications. New York: Springer

McKitterick, R. (1989). The Carolingians and the written word. Cambridge: Cambridge University Press.

Messick, S. (1995). Validity of psychological assessment: validation of inferences from persons' responses and performances as scientific inquiry into score meaning. American Psychologist, 50, 741-749.

Miyazaki, I. (1976). China's examination hell. New York: Weatherhill.

Mostert, M (1995). Kennisoverdracht in het klooster: over de plaats van lezen en schrijven in de vroegmiddeleeuwse monastieke opvoeding. In Stuip, R. E. V., & Vellekoop, C. (red.). Scholing in de middeleeuwen. Hilversum: Verloren.

Naerssen, R. F. van (1970). Over optimaal studeren en tentamens combineren. Openbare les. Amsterdam: Swets & Zeitlinger. html

Needham, J. (1954). Science and civilisation in China. Volume I, Introductory orientations. Cambridge: at the University Press.

Needham, J. (1980). Science and civilisation in China. Volume V part IV: Spagyrical discovery and invention: apparatus, theories and gifts. Cambridge: at the University Press.

Needham, J. (1970). China and the origin of qualifying examinations in medicine. In Needham, J., Clerks and craftsmen in China and the West. Cambridge: Cambridge University Press. 379-395

O'Malley, J. W. (1993). The first Jesuits. Cambridge, Massachusetts: Harvard University Press.

Palmer, R. R. (1985). The improvement of humanity. Education and the French revolution. Princeton: Princeton University Press.

Paterson, F. M. S. (1987). Out of place: public policy and the emergence of truancy. Philadelphia: Falmer Press.

Paulsen, F. (1919/19213). Geschichte des gelehrten Unterrichts auf den deutschen Schulen und Universitäten vom Ausgang des Mittelalters bis zur Gegenwart. Erster/Zweiter Band. Leipzig: Von Veit. Nachdruck 1960, Berlin: De Gruyter.

Perreiah, A. R. (1984). Logic examinations in Padua circa 1400. History of Education, 13, 85-103.

Post, R. R. (1954). Scholen en onderwijs in Nederland gedurende de middeleeuwen. Utrecht: Het Spectrum.

Posthumus, K. (1940). Middelbaar onderwijs en schifting. De Gids, 104 deel 2, 24-42.

Prahl, H. W. (1974). Abschlussprüfungen und Graden. Sozialhistorische und ideologiekritische untersuchungen zur akademischen Initiationskultur. Dissertation Kiel.

Proudford, C. & Baker, R. (1995). Schools that make a difference. British Journal of Sociology of Education, 16(3) 277-292.

Reezigt, G. J., Guldemond, H., & Ros, A. A. (1994). Zittenblijven in de eerste fase van het voortgezet onderwijs. Groningen: GION.

Resnick, D. P., and Resnick, L. B. (1985). Standards, curriculum, and performance: a historical and comparative perspective. The Educational Researcher, 14(4), 5-20.

Riché, p. (1962/1995). Éducation et culture dans l'Occident barbare VIe-VIIIe siècle. Paris: Seuil.

Riché, p. (1989). Écoles et enseignement dans le Haut Moyen Age. Fin du Ve siècle - milieu du XIe siècle. Paris: Picard.

Ringer, F. (1969). The decline of the German mandarins. Cambridge, MA: Harvard University Press.

Ringer, F. (1979). Education and society in modern Europe. Bloomington: Indiana University Press.

Roach, J. (1971). Public examinations in England 1850-1900. Cambridge: Cambridge University Press.

Rogoff, B., & Chavajay, p. (1995). What's become of research on the cultural basis of development? American Psychologist, 50, 859-877.

Rohlen, T. P. (1983). Japan's high schools. Berkeley: University of California Press.

Rothblatt, S. (1982). Failure in early nineteenth century Oxford and Cambridge. History of Education, 11 (1), 1-21.

Rothblatt, S. (1993). The limbs of Osiris: liberal education in the English-speaking world. In Rothblatt, S., & Wittrock, B. The European and American university since 1800. Historical and sociological essays. Cambridge: Cambridge University Press. 19-73.

Rotours, R. des (1932). Le traité des examens, traduit de la Nouvelle Histoire des T'ang (Chap. XLIV, XLV). Paris, Librairie Ernest Leroux. Bibliothèque de l'Institut des Hautes Études Chinoises, volume II.

Rudolph, F. (1977). Curriculum. A history of the American undergraduate course of study since 1636. San Francisco: Jossey-Bass.

Rijk, L. M. de (1977). Middeleeuwse wijsbegeerte. Traditie en vernieuwing. Assen: Van Gorcum. In French translation: La philosophie en Moyen Age. Brill: Leiden.

Schoengen, M. (1898). Die Schule von Zwolle von ihren Anfängen bis zur Einführung der Reformation (1582). I. Von der den Anfängen bis zu dem Auftreten des Humanismus. Freiburg (Schweiz).

Schoengen, M. (1911). Geschiedenis van het onderwijs in Nederland. Amsterdam.

Schotel, G. D. J. (1875). De academie te Leiden in de 16e, 17e en 18e eeuw. Haarlem: Kruseman & Tjeenk Willink.

Schwinges, R. C. (1986). Deutsche Universitätsbesucher im 14. und 15. Jahrhundert: Studien zur Sozialgeschichte des alten Reiches. Stuttgart: Steiner.

Schwinges, R. C. (1992). Student education, student life. In de Ridder-Symoens, H. A history of the university of Europe. Volume I, Universities in the middle ages. Cambridge: Cambridge University Press. 195-243

Shepard, L. A., & Wilson, M. (Eds.) (1989). Flunking grades: research and policies on retention. London: Falmer

Slavin, R. E. (1977). Classroom reward structure: an analytical and practical review. Review of Educational Research, 47, 633-650.

Smallwood, M. L. (1935). An historical study of examinations and grading systems in early American universities. Cambridge: Harvard University Press.

Sollicitant. Een sollicitant is ook een mens. Eindrapport Commissie Selectieprocedure, W. Hessel voorzitter. 's-Gravenhage: Sociale Zaken (Verslagen en rapporten jaargang 1977-5).

Soffer, R. N. (1994). Discipline and power. The university, history, & the making of an English elite 1870-1930. Stanford, California: Stanford University Press.

Spaulding, R. M. (1967). Imperial Japan's higher civil service examinations. Princeton: Princeton University Press.

Spence, J. D. (1984). The memory palace of Matteo Ricci. New York: Viking Penguin.

Spoelder, J. (1978). Over prijzen en promotie op de Latijnsche Erasmiaansche Schole. In N. van der Blom, Grepen uit de geschiedenis van het Erasmiaans Gymnasium 1328-1978. Rotterdam: Backhuys. 106-128.

Stehr, N. (1994). Knowledge societies. London: SAGE.

Stern, W. (1920). Die Intelligenz der Kinder und Jugendlichen und die Methoden ihrer Untersuchung. Leipzig: Barth.

Sternberg, R. J., Wagner, R. K., Williams, W. M., & Horvath, J. A. (1995). Testing common sense. American Psychologist, 50, 912-927.

Stevens, J., & Slavin, R. E. (1995). The cooperative elementary school: effects on students' achievement, attitudes, and social rlations. American Educational Research Journal, 32, 321-351.

Stokes, Rev. H. P. (1927). Ceremonies of the university of Cambridge. Cambridge, at the University Press.

Suleiman, E. N. (1978). Elites in French society. The politics of survival. Princeton: Princeton University Press.

Sutherland, G. (1984). Ability, merit and measurement, mental testing and English education, 1880-1940. Oxford: Clarendon Press.

Takeuchi, Y. (1991). Myth and reality in the Japanese educational selection system. Comparative Education, 27, 101-112.

Têng S. (1943). Chinese influence on the western examination system. Harvard Journal of Asiatic Studies, 7, 267-312. Reprinted in Bishop, J. L. (1968). Studies of governmental institutions in Chinese history, 197-242.

Thorbecke, W. (Red.) (1876). Over de regeling van het hooger onderwijs door mr. J. R. Thorbecke, uit zijne redevoeringen en aanteekeningen bijeenverzameld door mr. W. Thorbecke. 's-Gravenhage: Martinus Nijhoff.

Verger, J. (1992a). Patterns. In H. de Ridder-Symoens. A history of the university of Europe. Volume I, Universities in the middle ages. Cambridge: Cambridge University Press. 35-74

Verger, J. (1992b). Teachers. In H. de Ridder-Symoens. A history of the university of Europe. Volume I, Universities in the middle ages. Cambridge: Cambridge University Press. 144-169.

Viola, C. (1982). Manières personnelles et impersonnelles d'aborder un problème: saint Augustin et le XIIe siècle. Contribution à l'histoire de la 'quaestio', in Les genres littéraires dans les sources théologiques et philosophiques médiévales. Louvain-la-Neuve.

Wachelder, J. C. M. (1992). Universiteit tussen vorming en opleiding. De modernisering van de Nederlandse universiteiten in de negentiende eeuw. Hilversum: Verloren.

Wald, A. (red.) (1985). Een jaartje overdoen. Verslag van het SVO-symposium over zittenblijven in het voortgezet onderwijs. Den Haag: SVO.

Waley, A. (1949). The life and times of Po Chü-I, 772-846 A. D. London: Allen & Unwin.

Webber, C. (1989). The mandarin mentality: civil service and university admissions testing in Europe and Asia. In Gifford, R.: Test policy and the politics if opportunity allocation: the workplace and the law. Dordrecht: Kluwer. 33-60

Weber, M. Der Literatenstand. Hoofdstuk 5 uit Konfuzianismus und Taoismus, in Gesammelte Aufsaetze zur Religionssoziologie, vol. 1, pp. 395-430. The Chinese literati, in Gerth, H. H., & Wright Mills, C. (eds) (1947). From Max Weber: Essays in sociology. London: Kegan Paul, Trench, Trubner & Co. 416-444, notes 462-467.

Weiner, B. (1994). Ability versus effort revisited: the moral determinants of achievement evaluation and achievement as a moral system. Educational Psychologist, 29, 163-172.

Weijers, O. (1987). Terminologie des Universités au XIIIe siècle. Edizione dell' Ateneo, Roma.

Westrhenen, J. van (1977). De toetsing van onderwijsdoelen. Een empirische studie naar de functie van begrippen en begrippenstructuren in het onderwijsleerproces. Groningen: Wolters-Noordhoff.

Wiggins, G. P. (1993). Assessing student performance. Exploring the purpose and limits of testing. San Francisco: Jossey-Bass.

Wilbrink, B. (1983). Toetsvragen schrijven. Utrecht: Het Spectrum. 1.4 Mb pdf , of herziening onderweg: hfdst 1 e.v.

Wilbrink, B. (1986). Toetsen en testen in het onderwijs. In S.V.O. Jaarverslag / Jaarboek 1985. Den Haag: S.V.O., 275-288. html

Wilbrink, B. (1989). Economie en arbeidsmarkt. Amsterdam: SCO-Kohnstamm Instituut. pdf

Wilbrink, B., & Dronkers, J. (1993). Dilemma's bij groeiende deelname aan hoger onderwijs. Zoetermeer: Ministerie van Onderwijs en Wetenschappen. html

Wilbrink, B., Van Hoorn, W., van der Kamp, L.J.Th., & Algera, J. (1990). Selectie voor politie-officier. De toelating tot de Nederlandse Politie Academie. Amsterdam: SCO-Kohnstamm Instituut. html

Wilkinson, R. (1964). The prefects. British leadership and the public school tradition. London: Oxford University Press.

Wolferen, K. van (1989). The enigma of Japanese power. Knopf.

Wolferen, K. van (1995). De Japanse verlamming. Waarschuwing tot de toekomstige bureaucratische elite aan de Todai-universiteit. NRC Handelsblad, 1 juli, p. 5.

Wuthnow, R. (1989). Communities of discourse. Ideology and social structure in the reformation, the enlightenment, and European socialism. Cambridge, Mass.: Harvard University Press

Yates, F. A. (1966). The art of memory. London: Routledge & Kegan Paul.

Young, M. (1958). The rise of the meritocracy, 1870-2033: An essay on education and equality. London: Thames and Hudson.

Zeng, K. (1995). Japan's dragon gate: the effects of university entrance examinations on the educational system and students. Compare, 25, 59-84.

Zijl, Th. P. van (1963). Gerard Groote, ascetic and reformer (1340-1384). A dissertation. Washington, D.C.: The Catholic University of America Press.






Zie ook


Wilbrink, B. (1995). What its historical roots tell us about assessment in higher education today. 6th European Conference for Research on Learning and Instruction, Nijmegen. Paper: auteur. html

Wilbrink, B. (1995). Leren waarderen: de geschiedenis. Versie met uitvoerig notenapparaat. (SVO project 94707) html

Wilbrink, B. (1997). Assessment in historical perspective. Studies in Educational Evaluation, 23, 31-48. html




"De historische studie sluit af met een overzicht, en een verbinding met het algemene toetsmodel zoals dat in deel twee is te ontwikkelen, en met de empirische studie van het beoordelen als een onderhandelingsproces tussen docenten en studenten in deel drie." Dat is mooi opgeschreven, maar hoe staat het met die beloften? Dat algemene toetsmodel is anno 2009 in hoofdlijnen beschikbaar, ook in de vorm van instrumenten die online beschikbaar zijn: SPA. Voor de verdere uitwerking van het onderhandelingsmodel heeft de tijd ontbroken: dit werk is niet verder gekomen dan de publicaties in 1992: examination as negotiation — ECER en modelling grade retention as system rigidity — ECER



27 september 2015 \ contact ben apenstaartje benwilbrink.nl

Valid HTML 4.01!   www.benwilbrink.nl/publicaties/95LerenWaarderenSVO.htm