Onderzoek van Onderwijs, 1984, 13, 52-55

Docentbeoordeling

Mogelijkheden en randvoorwaarden

B. Wilbrink en W. K. B. Hofstee

COWO, Universiteit van Amsterdam., resp.
Instituut voor Persoonlijkheidspsychologie, Rijksuniversiteit Groningen.

Het wetenschappelijk onderwijs is in heftige beroering: bezuinigingen en andere ingrepen raken een ieder, zijn ook voor studenten voelbaar, en werken door in voorstellen die her en der voor docentbeoordeling worden gedaan. Reorganisaties volgen uit bezuinigingen, de nieuwe Wet op het WO, en straks teruglopende aantallen studenten. Daarbij zullen gedwongen ontslagen vallen. Over de volgorde van ontslag mag geen misverstand bestaan: die wordt bepaald door het toepasselijke ambtenarenreglement, waarbij voor enig oordeel over persoonlijk (dis)functioneren geen plaats is. Onduidelijk echter is de situatie waarin (formeel) ontslagen personeelsleden in aanmerking komen voor open plaatsen elders.

Bestuurders zullen in die situatie wellicht proberen daarbij het sollicitatiemodel te hanteren. Uit universiteitsbladen komt het beeld naar voren dat vooral studentenfracties docentbeoordeling willen gebruiken bij dergelijke personeelsbeslissingen. De reden is altijd: de kwaliteit van het onderwijs bewaren. Dan zijn er instellingsgewijs beoordelingsregelingen in de maak waarin naast de beoordeling van het onderzoek ook die van het onderwijs is betrokken. Het gaat dan om periodieke beoordeling, uitmondend in voorstellen tot vaste aanstelling of bevordering.
Docenten staan al met al onder grote druk. De aandacht wordt getrokken naar het onderzoek, omdat dat bepalend is voor de verdere loopbaan, terwijl de onderwijstaken juist verzwaard worden, o.a. door de invoering van de tweefasenstructuur. Studenten eisen goed onderwijs, en zullen dat kracht bijzetten wanneer de kwaliteit merkbaar terugloopt. Ziedaar de entourage voor de vormgeving aan docentbeoordeling.

In dit artikel ligt de nadruk op docentbeoordeling die gevolgen kan hebben in de rechtspositionele sfeer (aanstelling, bevordering, ontslag), i.t.t. beoordeling met een meer begeleidend of evaluatief karakter. Mogelijkheden en randvoorwaarden bij deze docentbeoordeling worden bezien vanuit verschillende gezichtshoeken, kort te kenmerken als: het recht, de organisatie (waarbinnen docenten werken), het onderwijs (dat verzorgd wordt), en (de methodiek van) het beoordelen. Telkens weer zal blijken dat deze docentbeoordeling terughoudend moet worden ingevuld, zo men er al meer dan lippendienst aan wil bewijzen. Allereerst moet echter het waarom van deze beoordeling duidelijk zijn.

Het waarom

"Je kunt heel goed onder leiding van een afdeling onderwijsresearch een enquête opzetten die onder alle studenten wordt gehouden, waarbij ze een oordeel geven over het onderwijs in hun verschillende vakken. (...) als je zo'n enquête zou hebben en daar duidelijke uitslagen uit kunt halen, niet een paar vage klachten maar systematisch terugkerende duidelijke uitslagen, dan heb je ook grond onder de voeten voor ontslag. Wij gaan daar niet over adviseren hoor, maar ik geef u dit als mijn mening zodat duidelijk is waar ik sta." Interview met de voorzitter van de cie. voor de bestuurshervorming, Folia Civitatis 13-9-1980.

Zou het zo simpel kunnen zijn? Kan zo'n uit de VS overgewaaid instrument als de studentenvragenlijst op deze wijze worden gebruikt? Wanneer zijn uitkomsten van docentbeoordeling 'duidelijk' genoeg om er zoiets ingrijpends als ontslag mee te kunnen motiveren?

Deze vragen zijn slechts dan zinvol te beantwoorden wanneer men zich realiseert dat docentbeoordeling een instrument is om gewenste doelen dichterbij te brengen, nimmer doel op zich. De kwaliteit van het onderwijs kan het doel zijn. Men kan er prijs op stellen als vorm van afleggen van rekening en verantwoording. Verder kan docentbeoordeling het belang van het onderwijs benadrukken; daarvoor is alle reden nu als gevolg van het overheidsbeleid alle energie in onderzoek wordt gestoken. Dergelijke beleidsdoelen moeten expliciet zijn, zodat kan worden nagegaan of er nog andere instrumenten zijn om die doelen te realiseren, instrumenten die misschien beter of goedkoper zijn, sneller effect sorteren. We zijn hiermee ver verwijderd van de vraag of studentenvragenlijsten gebruikt kunnen worden (op die vraag komen we nog wel terug).

Er zijn meer redenen om duidelijk te zijn over de doelen waar men docentbeoordeling voor wil gebruiken. Uit die doelen moet immers afgeleid worden welke criteria bij het beoordelen zullen worden aangelegd en tot welke beslissingen beoordeling kan leiden. Of beoordeling functioneel is, hangt af van het bereiken van de gestelde doelen (zonder onvoorziene en ongewenste neveneffecten elders).

Recht

Het recht stelt grenzen aan wat er bij docentbeoordeling mogelijk is. Een juiste procedure moet de spil van de beoordeling zijn. Daartoe behoort dat docenten geruime tijd tevoren weten op welke criteria er beoordeeld zal worden. Zonder duidelijke criteria zouden beoordelaars al te persoonlijke en daardoor willekeurige inzichten als leidraad nemen. Docenten, die worden verondersteld het voldoen aan deze criteria binnen de eigen macht te hebben, dienen in de gelegenheid te zijn naar deze criteria toe te werken. Wanneer aan de gestelde criteria niet wordt voldaan, moet de docent gelegenheid worden geboden daar verbetering in aan te brengen. Daar wordt bij voorkeur deskundige ondersteuning, training, of collegiale hulp bij geboden. Treft de docent in een dergelijk geval passende maatregelen, d.w.z. dat er veranderingen in het onderwijs worden aangebracht, dat ondersteuning wordt geaccepteerd of verdere professionalisering gezocht, dan is er geen grond voor negatieve beoordeling ook al zou dan nog niet aan de gestelde criteria voldaan zijn. De laatste opvatting stoelt op het oordeel dat docenten een inspanningsverplichting hebben, zoals ook voor artsen geldt, en geen resultaatsverplichting, waaraan bijv. aannemers gehouden zijn (zie ook Cohen, 1981). Zouden beoordelaars de getroffen maatregelen inhoudelijk niet adequaat vinden, dan doet dat geheel niet ter zake. De beoordeling behoort in dit opzicht marginaal te blijven. Uitzondering hierop :de docent heeft zich wel ingespannen, maar onverantwoordelijke maatregelen genomen. De jurist spreekt dan van kunstfouten; denk aan beroepsmatige blunders van artsen (zie ook Mendel 1976).

In deze context is het boek 'Studierechten' van Cohen (o.c.) van belang. De student kan recht doen gelden op kwalitatief behoorlijk onderwijs, welk begrip Cohen uitwerkt naar analogie met algemene beginselen van behoorlijk bestuur (die o.a. bij docentbeoordeling rechtskracht hebben). Het zal de student niet licht vallen die kwaliteit in rechte af te dwingen:

"Niet alleen zijn er vele manieren om goed onderwijs te geven, bovendien speelt hier de vrijheid van onderwijs terecht een belangrijke rol. Klachten die de inrichting van het onderwijs raken, behoren dan ook slechts marginaal getoetst te worden: zij worden slechts toegewezen wanneer de betrokkene niet in redelijkheid tot de aanbieding van dit onderwijs heeft kunnen komen."(Cohen, o.c., p. 3)

Het begrip 'redelijkheid' , zoals door rechters gehanteerd, laat zich niet in een definitie vangen; het begrip kan worden uiteengelegd in al genoemde algemene beginselen van behoorlijk bestuur (vooral in het administratieve recht gehanteerd, zie bijv. Duk, Loeb en Nicolaï, 1981, of Cohen, o.c.).

Een ander materieel recht is dat op inspanning van de docent:

"Vragen wij ons af, aan welke eisen de inspanningsverplichting van de docent moet voldoen, dan luidt het antwoord op die vraag, dat in beginsel voldaan moet worden aan dezelfde eisen als in het algemeen gesteld worden aan beroepsbeoefenaren die zich tot inspanningsverplichtingen verbonden hebben. Jurisprudentie en rechtsgeleerde literatuur hebben daartoe het volgende criterium ontwikkeld: de inspanning moet van een zodanige kwaliteit zijn als van een normale deskundige op dat terrein verwacht mag worden." (Cohen, o.c., p. 33)

Dit algemene criterium is rijkelijk vaag, en mede daarom kan pas van tekortschieten van de docent worden gesproken wanneer de gepleegde inspanning duidelijk onder dit criterium uitkomt. In voorkomende gevallen is het niet nodig uitvoerig empirisch materiaal te produceren waaruit blijkt wat de inspanning van 'een normale docent op dit terrein' is. We wijken hierin af van Cohen, die dicht komt bij de suggestie als zou ieder aantoonbaar verschil hier voldoende bewijs van tekortkomen zijn. Wie bij docentbeoordeling stringenter te werk wil gaan dan wat in rechte door (individuele) studenten afdwingbaar is, zal dat ons inziens moeten beargumenteren. Een reden zou bijv. kunnen zijn dat docenten zijn gehouden aan facultair onderwijsbeleid.

Bij beslissingen over personen is het soms voldoende dat de beslisgrond een bepaalde mate van waarschijnlijkheid inhoudt. Denk aan personeelsselectie met redelijk geldige tests, waarbij die sollicitant aangenomen wordt van wie de waarschijnlijke opbrengst voor de instelling relatief het gunstigst is.

Doorgaans wordt in rechtszaken met waarschijnlijkheden echter geen genoegen genomen (zie Zeisel, 1978, voor een overzicht). De gronden voor ontslag bijv. moeten zeker zijn; men kan zich beroepen op het beginsel van concrete belangenafweging (Duk, Loeb & Nicolaï, o.c.): ieder te beslissen geval dient afzonderlijk onderzocht en beoordeeld te worden. Dit betekent dat de uitkomsten van studentenvragenlijsten, maar ook studieresultaten, nimmer zonder meer als ontslaggrond kunnen worden aangevoerd. Het is immers niet bekend in hoeverre de docent iets te verwijten valt, omdat tal van andere omstandigheden tot deze uitkomsten kunnen hebben geleid.

Beoordeelden hebben er recht op dat de instrumenten die bij deze beoordeling gebruikt worden, verantwoord zijn. Er ligt hier een analogie met de rechten van studenten bij examens; zie wederom Cohen die daar een gedetailleerde uitwerking van heeft gegeven. In Amerikaanse jurisprudentie (Lerner, 1978) blijkt de rechter zich op dit punt steeds meer te oriënteren op de 'Standards' (Richtlijnen) voor de kwaliteit van tests en toetsen en hun toepassing. Deze Richtlijnen (in Nederlandse bewerking: NIP, 1978) zijn alleen bindend voor psychologen, maar dat betekent geenszins dat anderen die zich met beoordelen bezighouden deze rustig naast zich neer kunnen leggen. Ook bij docentbeoordeling zijn deze Richtlijnen toepasselijk. Wie studentenvragenlijsten ontwerpt, afneemt, en bij docentbeoordeling gebruikt, heeft verantwoording af te leggen over de geldigheid van de vragenlijst voor deze toepassing (Messick, 1980; London & Bray, 1980).

"It is apparent from the litigation in this area that appraisal systems are considered 'tests' if in any way they serve as bases for personnel decisions." (Zedeck & Cascio, 1984, p. 495). (litigation = jurisprudentie).

Aan de bedenkingen op dit juridisch vlak kan nog worden toegevoegd de vraag of de beoordelingsbevoegdheid aan studenten kan worden gedelegeerd. De conclusie luidt in ieder geval dat studentenvragenlijsten nimmer op zichzelf grond kunnen zijn voor personele beslissingen. Het is zelfs twijfelachtig of ze daarin enige rol kunnen spelen.

Organisatie

Docentbeoordeling raakt het functioneren van docenten binnen de organisatie (onderwijsinstelling), en daarmee tevens het functioneren van die organisatie zelf. Darling-Hammond, Wise & Pease (1983) geven een overzicht van de relevante literatuur. De eis dat de organisatie behoorlijk moet blijven functioneren, stelt evenzeer grenzen aan docentbeoordeling; deze grenzen mogen minder hard lijken dan de juridische die we juist ontmoet hebben, ze zijn echter zeker zo onverbiddelijk. Men doet er verstandig aan naar de ervaringen in de sfeer van overheid en bedrijfsleven te kijken, alvorens mogelijk schadelijke regelingen te ontwerpen (zie ook Dunnette & Fleishman, 1982; Landy, Zedeck & Cleveland, 1983).

Een belangrijke overweging is hier dat begeleiding en beoordeling elkaar slecht verdragen. Overal waar een 'sterke' beoordeling (met het oog op rechtspositionele gevolgen) wordt opgezet, gaat dat ten koste van de mogelijkheden om de kwaliteit van het onderwijs te verbeteren via begeleiding, training en deskundige ondersteuning (voor het belang daarvan zie ook Hunter & Schmidt, 1983). Beoordeling introduceert een zeker antagonisme tussen beoordeelden en degenen die beoordelen (namens wie er beoordeeld wordt). Men moet oppassen met het invoeren van docentbeoordeling de verantwoordelijkheid voor goed onderwijs te leggen bij individuele docenten, die vaak niet zullen weten hoe zij na negatieve beoordeling tot verbeteringen kunnen komen.

De organisatie zal de directe en indirecte kosten voor docentbeoordeling moeten dragen. Hoe drastischer de beslissingen die men op grond van docentbeoordeling wil nemen, des te zorgvuldiger zal die beoordeling moeten gebeuren, en des te kostbaarder wordt het geheel. Denk daarbij aan de tijd van beoordelaars en beoordeelden. Door sterke nadruk op algemeen geldende en zo objectief mogelijke criteria zullen deze criteria vooral worden gezocht in de sfeer van het eenvoudig constateerbare: aanwezigheid, tijdbesteding, bijhouden van een dossier, gebruik van bepaalde (populaire) onderwijsmethoden,: zuinig omgaan met beschikbare middelen, etc. Dergelijke criteria laten soms niet al te veel ruimte voor handelen naar eigen professioneel inzicht. En dergelijke criteria hebben weinig of geen relatie tot de kwaliteit van het onderwijs. Aldus kan een stringente beoordeling negatieve effecten hebben op de onderwijskwaliteit, terwijl de mogelijkheden voor constructieve begeleiding van docenten verloren gaan.

Onderwijs

Docentbeoordeling wordt, afgezien van andere doeleinden, tenminste uitgevoerd met het oog op de onderwijskwaliteit. Dat is een simpele constatering, waar echter enkele problemen in liggen besloten. Er zijn bestuurders die menen te weten wat onderwijskwaliteit is, en hoe die kwaliteit kan worden georganiseerd: schrijf de onderwijsdoelen tot in detail uit, schrijf het gebruik van bepaalde onderwijsmethoden voor, en evalueer het onderwijs door de resultaten te vergelijken met de gestelde doelen. In deze visie wordt de relatie tussen het handelen van docenten en de onderwijsresultaten, bekend verondersteld. Blijken doelen niet gehaald te worden, dan weten docenten vanzelfsprekend wat daaraan gedaan moet worden. Het is bij uitstek deze zienswijze die de docent verantwoordelijk houdt voor de onderwijsresultaten, en dat kan leiden tot contractonderwijs en outputfinanciering. Alsof de omgeving waarin, en het materiaal en de studenten waarmee de docent moet werken van geen belang zijn. De man/vrouw die op niet mis te verstane wijze is te beoordelen naar de kwantiteit en de kwaliteit van de geleverde producten.

De onderwijskunde moet iets te melden hebben over de relatie tussen het doen en laten van docenten en de onderwijsresultaten. En dat doet ze, al is de boodschap teleurstellend: er zijn in de verste verte geen gedragsregels die gegarandeerd succes opleveren (zie bijv. Waxman & Walberg, 1982). Dat is een belangrijke constatering: er is geen wetenschappelijke basis om de docent te houden aan 'bewezen' methoden en technieken. Voor docentbeoordeling kunnen hier geen bruikbare criteria worden gevonden. Het is overigens ook niet redelijk om van de onderwijskunde dit soort sterke richtlijnen voor het handelen van docenten te verwachten. Onderwijskundige inzichten zijn voor de docent onmisbaar omdat ze in staat stellen tot scherper articuleren wat er zich in de onderwijssituatie afspeelt, en welke mogelijkheden er zijn om daarin passend in te grijpen. Blind toepasbare technieken zijn niet voorhanden.

Wie samen met anderen probeert onderwijsdoelen te formuleren, bijv. om daaraan criteria voor docentbeoordeling te ontlenen, ontdekt spoedig dat de visies hier zeer uiteen kunnen lopen. Een enigszins neutrale, maar dan ook minimale visie, is dat het allereerst gaat om studieresultaten zoals die blijken uit het slagen voor studieonderdelen of de cijfers voor examens. Immers, die hebben feitelijke werking voor de studenten. Allerlei andere doelen zijn daarnaast denkbaar, en worden door velen ook nagestreefd, maar die zijn niet 'hard' te maken zoals dat met studieresultaten wel kan, en consensus erover is lastiger te bereiken.

In de visie waarin resultaten centraal staan, en in het bijzonder studieresultaten, is het niet als zodanig van belang of studenten hun docenten wel aardig en boeiend vinden. Dit impliceert niet dat de docent wordt gezien als cijfersmid: doceren behoort noch een ambacht te zijn, noch een kunst, doch een professie. De persoon van de docent speelt een ondergeschikte rol in het onderwijsgebeuren: veel hangt af van de capaciteiten en inspanning van studenten, van de beschikbare middelen, de organisatie en de maatschappelijke context waarin gewerkt wordt, etc. Omdat andere factoren zoveel meer invloed hebben op de onderwijsresultaten, mag de persoon van de docent echter niet worden weggecijferd. Docenten staan altijd bloot aan het kritische oordeel van hun studenten. Dat is normaliter voldoende reden voor een behoorlijke inspanning, los van andere vormen van beloning of straf die de organisatie voor hen in petto heeft. Docenten ervaren in het voortdurend contact met studenten hoe deze groeien in de beheersing van het onderrichte vak. In de vormgeving aan het onderwijs komt hun persoonlijke taakopvatting en visie op de onderwijsdoelen tot uiting. Dat zij zich hechten aan werkwijzen die naar eigen ervaring doeltreffend zijn, is daar een onvermijdelijk gevolg van. Als vreemd ervaren invloeden van buitenaf, zoals docentbeoordeling die wordt opgelegd, kunnen bedreigend zijn voor het gevoel van eigenwaarde dat men in de eigen taakuitoefening beleeft, en bedreigen daarmee ook de kwaliteit van het werk. De laatste jaren is er een toenemende belangstelling voor de wijze waarop dergelijke moeilijk grijpbare factoren de kwaliteit van de taakuitoefening beïnvloeden (zie bijv. Bandura, 1982).

Beoordelen

Bij aanstelling, bevordering of ontslag is altijd de vraag aan de orde: wat mag van deze persoon worden verwacht als bijdrage aan de doelen van de organisatie, in dit geval de onderwijsdoelen? Iedere personeelsbeslissing houdt een voorspelling in, waarvan de geldigheid aannemelijk moet kunnen worden gemaakt (NIP, 1978). We gaan ervan uit dat studieresultaten de belangrijkste onderwijsdoelen vormen. Hier zit nog veel ruimte in, zowel in inhoudelijk opzicht (aard van de stofbeheersing), als ten aanzien van de maat die men kiest (cijfers, rendement, studieduur). Hoe men dat ook nader uitwerkt, van de docent wordt verwacht dat hij of zij bijdraagt aan het realiseren van behoorlijke studieresultaten. Dan ligt hier ook het criterium waar het bij docentbeoordeling om gaat: mag worden verwacht dat de docent in de toekomst hiertoe in redelijke mate zal bijdragen?

Er doemen nu twee problemen op: in hoeverre zijn studieresultaten ook een praktisch hanteerbaar criterium, en is zo'n criterium wel bruikbaar bij een beoordeling die hier en nu plaats moet vinden (is het voorspelbaar)?

Er wordt vaak gezegd dat studieresultaten afhangen van de studenten, en zeker niet in de eerste plaats van de docent. Dat is juist, maar daar volgt geenszins uit dat studieresultaten niet het (enig) juiste criterium voor de beoordeling van het onderwijs en van individuele docenten zouden kunnen zijn. Het is een misvatting een voorgesteld criterium af te wijzen met het argument dat het niet alleen van het handelen van de docent afhangt. Dit bezwaar zou mutatis mutandis gelden voor alle criteria (zie bijv. Roe, 1983, hoofdstuk 2). Voor 'storende' factoren moet worden gecorrigeerd, en dat geldt naast de capaciteiten van de studenten ook de aard van het gedoceerde vak, de plaatsing in het rooster, of het vak verplicht danwel een keuzevak is, etc. De aanwezigheid van dergelijke factoren maakt het criterium niet onjuist, maar vraagt om de nodige zorgvuldigheid bij het hanteren ervan. Dat laatste geldt overigens voor ieder denkbaar criterium. Voor de bruikbaarheid van studentenvragenlijsten vormen deze storende factoren al evenzeer een struikelblok (Blom & Langerak, 1979).

Om dit criterium ook metterdaad aan te leggen, moet eerst aannemelijk worden gemaakt dat studieresultaten zoals die mede onder de verantwoordelijkheid van deze docent de afgelopen jaren tot stand zijn gekomen, voorspellende waarde hebben voor de resultaten (bij andere groepen studenten, bij veranderde programma's) in de toekomst. Ook al is die voorspellende waarde aannemelijk, dan heeft men toch te rekenen met de feilbaarheid van individuele voorspellingen. Men ziet hier de wijsheid van procedures waarin de beoordeelde alle gelegenheid krijgt om met steun van anderen de resultaten te verbeteren.

Docentbeoordeling zal altijd subjectief zijn, omdat in de administratie aanwezige studieresultaten geprojecteerd moeten worden in de toekomst, rekening houdend met specifieke omstandigheden. Ook de inspanning van de docent om tot verbeteringen te komen moet op redelijkheid worden beoordeeld. Het zou niet juist zijn in het streven naar objectivering van de beoordeling kwantitatief onwrikbare criteria (slaagpercentages bijv.) vast te stellen. Dat is in strijd met de zorgvuldigheid die ten aanzien van personen in acht is te nemen, en het zou bepaald tot ongewenste gevolgen voor het onderwijs leiden.

Zijn er nog andere directe criteria? Zeker, dat zijn de gangbare criteria voor een behoorlijke taakvervulling die niet specifiek zijn voor docenten. Maar er is ook nog een scala van criteria die wel docent-specifiek zijn, bijv. kennis en vaardigheden zowel wat didactiek als het te doceren vak betreft, en inzetbaarheid voor diverse onderwijstaken. Het zijn criteria van ondergeschikt belang, die desondanks soms doorslaggevend kunnen zijn (bijv. bij sollicitanten zonder relevante onderwijservaring).
Docentbeoordeling aan de hand van studentenvragenlijsten valt juridisch door de mand. Bovendien heeft onderzoek niet duidelijk kunnen maken wat de relatie is van de mening van studenten tot de onderwijsresultaten, voorzover de docent daar directe invloed op heeft en dus verantwoordelijkheid voor draagt. Gegevens van studentenvragenlijsten zijn mogelijk bruikbaar bij het interpreteren van bijv. studieresultaten, en bij het zoeken naar wegen om verbeteringen in het onderwijs aan te brengen (maar zie Rotem en Glasman, 1979, die laten zien dat docenten met de uitkomsten van deze vragenlijsten weinig zinnigs weten aan te vangen). In deze zin zijn de meningen van studenten zeker van belang, maar nimmer in een (bij)rol bij docentbeoordeling.

Conclusie

Vanuit de beschouwde invalshoeken convergeert de conclusie: als docentbeoordeling al kosteneffectief is, en voor betrokkenen aanvaardbaar, laat ze dan slechts een terughoudend karakter hebben. Wanneer daar ook garanties voor gegeven worden, is de weg misschien vrij om de beoordeling te gebruiken als stimulans voor alle betrokkenen om voortdurend de kwaliteit van het onderwijs in de gaten te houden en waar mogelijk te verbeteren.

Meer stringente beoordeling leidt tot juridische en andere rechtvaardigheidsproblemen, is kostbaar, laat docenten niet in hun waarde bij de uitoefening van hun professie, en stuit op het criteriumprobleem. Het criterium in de vorm van onderwijsresultaten is lastig te hanteren omdat het van nog zoveel andere, invloedrijker factoren afhangt.

De studentenvragenlijst biedt geen alternatief. Het is niet onze bedoeling geweest uitgebreid op het fenomeen studentenvragenlijst in te gaan. Op enigszins andere wijze hebben wij tegendruk geboden aan de eenzijdige aandacht voor dit instrument: door docentbeoordeling in de bredere context te plaatsen waarin ze allereerst gezien hoort te worden.

Als uitstekende overzichten van de literatuur over docentbeoordeling zijn Millman (1981), elders in dit nummer besproken, en Darling-Hammond e.a. (1983) onmisbaar. Voor speciale onderwerpen is, als ingang tot de relevante literatuur, naar de meest recente publikatie verwezen.

Literatuur

Bandura, A. (1982). Self-efficacy mechanism in human agency. American Psychologist, 37, 122-147.

Blom, S. J. M., & W. F. Langerak (1979). Beoordelen van docenten door studenten. Pedagogische Studiën, 56, 308-318.

Cohen, M. J. (1981). Studierechten in het wetenschappelijk onderwijs. Zwolle: Tjeenk Willink.

Darling-Hammond, L., E. A. Wise, & S. R. Pease. (1983). Teacher evaluation in the organizational context: a review of the literature. Review of Educational Research, 53, 285-328.

Duk, W., R. W. L. Loeb, & P. Nicolaï (1981). Bestuursrecht. Amsterdam: Scheltema, Holkema, Vermeulen.

Dunnette, M. D., & E. A. Fleishman (Eds) (1962). Human performance and productivity: human capability assessment. Hillsdale, N.J.: Lawrence Erlbaum.

Hunter, J. E., & F. L. Schmidt (1983). Quantifying the effects of psychological interventions on employee performance and work-force productivity. American Psychologist, 38, 473-478.

Landy, F., S. Zedeck, & J. Cleveland (Eds) (1983). Performance measurement and theory. Hillsdale, N.].: Lawrence Erlbaum.

Lerner, B. (1978). The Supreme Court and the APA, AERA, NCME Test Standards: past references and future possibilities. American Psychologist, 33, 915-919.

London, M., & D. W. Bray (1980). Ethical issues in testing and evaluation for personnel decisions. American Psychologist, 35, 890-901.

McNeil, J. D., & W. J. Popham (1973). The assessment of teacher competence. In R. M. W. Travers (Ed.), Second handbook of research on teaching. Chicago: Rand McNally.

Mendel, M. M. (1976). De beroepsaansprakelijkheid van de selectiepsycholoog volgens het Nederlands recht. In P. J. van Strien (Red.), Personeelsselectie in discussie. Meppel: Boom.

Messick, S. (1980). Test validity and the ethics of assessment. American Psychologist,35, 10I2-1027.

Millman, J. (Ed.) (1981). Handbook of teacher evaluation. National Council on Measurement in Education. London: Sage.

NIP (1978). Richtlijnen voor ontwikkeling en gebruik van psychologische tests en studietoetsen. Amsterdam: Nederlands Instituut voor Psychologen.

Roe, R. A. (1983). Grondslagen der personeelsselektie. Assen: Van Gorcum.

Rotem, A., & N.S. Glasman (1979). On the effectiveness of students' evaluative feedback to university instructors. Review of Educational Research, 49, 497-511.

Waxman, H, C, & H. J, Walberg(1982). The relation of teaching and learning: a review of reviews of process-product research. Contemporary Education Review, 1 ,103-120.

Zedeck, J., & W. F. Cascio (1984). Psychological issues in personnel decisions. Annual Review of Psychology, 35, 461-518.

Zeisel, H. (1978). Statistics as legal evidence. In Kruskal, W. H., & J. M. Tanur (Eds) (1978). International encyclopedia of statistics. London: Collier Macmillan.

Voor de bespreking van het evaluatieboek van Millman, in ditzelfde nummer zie Evaluatie Docentbeoordeling.

Deze aflevering van Onderzoek van Onderwijs is in zijn geheel gewijd aan docentbeoordeling. Voor andere analyses van deze thematiek zie de bijdragen van de andere auteurs.

Voor briefwisseling met OCenW; jurisprudentie uit 1997; meer recente literatuur zie hierbeneden

Stukken bij Wilbrink en Hofstee Docentbeoordeling, in Onderzoek van Onderwijs december 1984 , 52-55

Stukken bij Wilbrink en Hofstee (1984) Docentbeoordeling

INHOUD

- Brief aan departement OCenW 14-12-1989

- Antwoord van departement OCenW

- Antwoord van departement OCenW

- Uitspraak Rechtbank Leeuwarden 16 december 1997, Tijdschrift voor Ambtenarenrecht 1998, 48.

- Ander werk op dit thema

Dr. ir. J.M.M. Ritzen

Ministerie van Onderwijs en Wetenschappen

Zoetermeer

onderwerp: docentbeoordeling

datum: 14 december 1989

Zeer geachte Ritzen,

Docententbeoordeling is een actueel thema in de media geworden. In de discussie wordt niet altijd loepzuiver onderscheiden tussen beoordeling gericht op kwaliteitsverbetering, en beoordeling met consequenties in de rechtspositionele sfeer. Wanneer bovendien de beoordelende partij bestaat uit anoniem blijvende studenten of leerlingen, is er reden om de zorgvuldigheid van dergelijke docentbeoordeling kritisch te bezien.

Bij de invoering van de twee-fasenstructuur ontstond brede belangstelling voor docentbeoordeling. Wim Hofstee en ondergetekende hebben destijds docentbeoordeling besproken vanuit verschillende invalshoeken: het recht, de organisatie, het onderwijs, en de technische mogelijkheden voor beoordelen, zie het bijgesloten themanummer van Onderzoek van Onderwijs, 1984, #4: 52 - 55. De belangrijkste punten zijn de volgende.

- Maak onderscheid tussen begeleiden (evalueren) en beoordelen van docenten, ongeveer langs de lijn waarin onderscheid tussen functionerings- en beoordelingsgesprekken wordt gemaakt.

- Er zit spanning tussen tegelijk willen begeleiden en beoordelen, waarbij een nadruk op het beoordelen kan leiden tot het verloren gaan van goede mogelijkheden om via begeleiding van docenten tot kwaliteitsverbetering te komen.

- Studenten zijn inderdaad de belangrijkste consumenten van onderwijs, daar volgt echter niet uit dat zij de kwaliteit van dat onderwijs kunnen beoordelen: bij de beoordeling van commerciële diensten en producten gaan consumentenorganisaties evenmin af op enquêteresultaten, maar laten zij deskundigen tests uitvoeren. Hoe het onderwijs op studenten overkomt is zeker van belang, maar er is geen rechlijnig verband te construeren met de aanstelling van de betreffende docent.

Zie voor de onderbouwing van deze uitspraken, en voor relevante literatuur, het bijgevoegde artikel.

Mede namens Wim Hofstee, met vriendelijke groet,

Ben Wilbrink.

Ministerie van

Onderwijs en Wetenschappen

Stichting Centrum voor Onderwijsonderzoek
Grote Bickersstraat 72
1013 KS AMSTERDAM

Uw brief van
14-12-1989
Onderwerp
Docentbeoordeling
Ons kenmerk DI/VZ-89037771
Postadres Ministerie van Onderwijs en Wetenschappen
Europaweg 4<
Postbus 25000
2700 LZ Zoetermeer
Telefoon (079)531911
Telefax (079)5126 51
Zoetermeer

30 januari 1990

Doorkiesnummer
079-53.2352

-Met belangstelling heb ik kennis genomen van uw bijdrage aan de discussie over docentbeoordeling die u mij toezond met uw brief van 14 december 1989. Daaruit blijkt dat de door u aangedragen kernthema's nog steeds actueel zijn, maar ook dat over de wijze van uitvoering in de praktijk het laatste woord nog niet is gezegd. Ik onderschrijf met u het belang van eert goed onderscheiden van begeleiden en beoordelen. Daar waar deze zaken aan de orde zijn (o.a. in Europees verband), wordt deze opvatting ook uitgedragen. De mate waarin en de wijze waarop de diverse participanten die bij docentbeoordeling een rol spelen bij dat proces betrokken zijn of worden zal in de verdere discussie een belangrijk aandachtspunt zijn. Dat hierover de meningen uiteenlopen geeft u zelf al aan via de kritische bijdrage van M. Daniëls op o.a. uw eigen artikel. Hoewel de artikelen in "Onderzoek van Onderwijs" zich beperken tot de docentbeoordeling aan universiteiten, acht ik de gehanteerde criteria en de aangedragen argumenten toch zo algemeen geldend dat zij ook van toepassing kunnen zijn op docentbeoordeling in andere sectoren van het onderwijs. In dat opzicht stel ik uw reactie op de lopende discussie extra op prijs.

De minister,

namens deze,

(drs. W.J.J. van Velzen)

Bron: Rechtbank Leeuwarden 16 december 1997, Tijdschrift voor Ambtenarenrecht 1998, 48.

JURISPRUDENTIE

Onderwerp

Gebruik studentenevaluatie bij de beoordeling van universitair docent

Bij de beoordeling van een universitair docent mag zeker waarde worden gehecht aan het oordeel van studenten die de colleges van deze docent hebben bijgewoond. Maar een beoordeling kan niet uitsluitend worden gebaseerd op evaluaties door studenten. Tot dit oordeel komt de rechtbank Leeuwarden naar aanleiding van het beroep van een universitair docent bij de Rijksuniversiteit Groningen (RuG) tegen de over hem vastgestelde beoordelingen.

De feiten

Een universitair docent werkt al sinds 1975 bij de RUG. Zijn functioneren is twee keer achter elkaar slecht beoordeeld. Tegen die twee beoordelingen heeft hij bezwaren ingebracht, die vervolgens door de RUG ongegrond worden verklaard. Hij legt zich daar niet bij neer en gaat in beroep.

De eerste beoordeling is gebaseerd op een verslag van werkzaamheden, die de universitair docent zelf heeft opgesteld, een verslag van een functioneringsgesprek en een studentenevaluatie.

De tweede beoordeling is gebaseerd op een verslag van werkzaamheden, een (algemene) studentenevaluatie en een panelevaluatie.

Standpunt docent

De docent vindt dat de beslissing op zijn bezwaren niet voldoende gemotiveerd is en niet op zorgvuldige wijze tot stand is gekomen. De RuG heeft gebruik gemaakt van een studentenevaluatie, die is bedoeld om tot een betere wisselwerking tussen studenten en docenten te komen op het punt van de inhoud en de vorm van het onderwijs. Zo'n evaluatie is volgens hem minder geschikt als beoordelingsinstrument, aangezien volstrekt ondoorzichtig is hoe de evaluatie tot stond komt, wordt geïnterpreteerd en wordt uitgewerkt.

Standpunt RUG

De RUG voert aan dat het oordeel van de beoordelaars is gebaseerd op voor de docent kenbare stukken en dat hij in de gelegenheid is gesteld zijn mening naar voren te brengen, zowel in de procedure bij de beoordelingsautoriteit als in de bezwarenprocedure. Een studentenevaluatie is volgens de RUG bij uitstek geschikt om de kwaliteit van het gegeven onderwijs en de didactische kwaliteiten van de docent te meten. Verder is de wijze van totstandkomen van de evaluatie bij de docenten bekend. Aan de docent is ook van tevoren kenbaar gemaakt, dat zijn colleges weer door middel van een studentenevaluatie zouden worden beoordeeld. De RUG hecht veel waarde aan de panelevaluatie. Deze bevat heldere, ondubbelzinnige uitspraken die in een groepsgesprek tussen enkele studenten zijn gedaan.

De rechtbank

l. Concrete kritiek op functioneren

Uit het verslag van het met de docent gevoerde functioneringsgesprek kan de rechtbank niet opmaken, dat hem duidelijk te kennen is gegeven dat zijn werkzaamheden niet voldoen aan de gestelde eisen. In dat gesprek is alleen geconstateerd "dat de dissertatie er niet van gekomen is". Het verslag vermeldt vervolgens: "op grond hiervan lijkt het redelijk af te stappen van de promotieverplichting, zodat taken gedefinieerd kunnen worden op het terrein van onderwijs en maatschappelijke dienstverlening". Hierin kan volgens de rechtbank geen kritiek op het functioneren of de werkzaamheden van de docent worden gelezen. Het verslag geeft ook geen concreet commentaar. De negatieve beoordeling kan naar de mening van de rechtbank dan ook niet (mede) worden gebaseerd op (het verslag van) dit functioneringsgesprek.

2. De studentenevaluatie

De rechtbank vindt dat de RUG de studentenevaluatie slechts met grote terughoudendheid en alleen in aanvulling op andere gegevens bij de beoordeling had mogen betrekken. Zo blijkt uit de stukken niet of het evaluatieformulier door alle studenten is ingevuld, of degenen die het evaluatieformulier hebben ingevuld alle colleges hebben bijgewoond. of zij zijn geslaagd voor het betreffende tentamen en of zij zich realiseren welke waarde de RUG aan de resultaten zou toekennen. In het dossier ontbreken ook gegevens over studentenevaluaties met betrekking tot andere docenten.

3. De panelevaluatie

Deze bezwaren tegen de algemene studentenevaluatie gelden ook onverkort voor de panelevaluatie, aldus de rechtbank. De gang van zaken bij de panelevaluatie is als volgt. Vier studenten worden als panelleden aangewezen. De RUG gaat ervan uit dat zij hun medestudenten raadplegen. Eén van deze studenten rapporteert aan de opleidingscommissie. Van deze gesprekken wordt geen verslag opgemaakt. De evaluatie wordt vervolgens besproken in de opleidingscommissie. Het concept- verslag van de opleidingscommissie geeft echter niet aan wat over de evaluatie van de colleges van de docent is gezegd. De voorzitter van de opleidingscommissie is als informant gehoord bij de beoordeling van de docent. Ook dit gesprek is niet op schrift gesteld.

Deze gang van zaken kan volgens de rechtbank niet door de beugel. Op geen enkele wijze kan namelijk worden gecontroleerd welke studenten deel hebben uitgemaakt van het panel, of zij zich hebben aangemeld dan wel zijn aangewezen, door wie zij eventueel zijn aangewezen, welke opdracht zij hebben gekregen, wat zij hebben besproken, of zij overleg hebben gevoerd met hun medestudenten en wat precies is gerapporteerd aan de opleidingscommissie.

4. Uitspraak rechtbank

Op grond van deze overwegingen komt de rechtbank tot het oordeel, dat de bestreden besluiten op onjuiste gronden zijn genomen, onzorgvuldig voorbereid en onvoldoende gemotiveerd zijn. De rechtbank bepaalt verder dat de RUG met inachtneming van deze uitspraak een nieuw besluit op de bezwaren van de docent zal moeten nemen.

Let op

1 . Tegen deze uitspraak heeft de RUG inmiddels hoger beroep ingesteld bij de Centrale Raad van Beroep (CRvB). Het lijkt mij niet waarschijnlijk dat de CRvB in deze zaak tot een ander oordeel zal komen. Ik kom hier op terug als de CRvB uitspraak heeft gedaan.

2. Voor de (C)OR is de uitspraak van de rechtbank om de volgende reden belangrijk. Wil de universiteit of faculteit bij de beoordeling van universitair (hoofd)docenten in de toekomst ook gebruik maken van evaluaties door studenten, dan heeft een dergelijk voorgenomen besluit betrekking op een wijziging in de regeling van de personeelsbeoordeling in de zin van artikel 27, lid 1 , onder g, van de WOR. Dit brengt met zich mee, dat daarover de instemming van de (C)OR moet worden gevraagd.

In dat kader is het zaak dat de (C)OR dan zorgvuldig kijkt naar de voorgestelde gang van zaken van de studentenevaluatie en aandacht schenkt aan de kritische opmerkingen die de rechtbank daarover in deze zaak heeft gemaakt.

Bron:

Rechtbank Leeuwarden 16 december 1997, Tijdschrift voor Ambtenarenrecht 1998, 48.

Ander werk op dit thema

W. K. B. Hofstee (1974). Psychologische uitspraken over personen: beoordeling, voorspelling, advies, test. Deventer: Van Loghum Slaterus, 1974.

Een eerder rapport over docentbeoordeling is het door Ben Wilbrink opgestelde rapport 'Beoordeling van onderwijsactiviteiten', dat als COWO-advies in januari 1981 op diens verzoek is uitgebracht aan het College van Bestuur van de Universiteit van Amsterdam. html

Ben Wilbrink (1981). Beoordelen van onderwijsactiviteiten. Bijdrage aan studiedag CRWO 16 december te Rotterdam.

Daniel L. Stufflebeam (Chair). (1988). The personnel evaluation standards. How to assess systems for evaluating educators. The Joint Committee on Standards for Educational Evaluation. London: Sage.

W. K. B. Hofstee (1996). Beoordeel liever überhaupt niet (tenzij). Commentaar op W. A. Wagenaar. De Psycholoog, 31, 410-411. [Wagenaar, W. A. (1996). Beoordeel psychologen niet naar hun successen. De Psycholoog, 31, 407-410.]

W. K. B. Hofstee (1996). Actief hoger onderwijsbeleid. Bedreiging voor de kwaliteit. Onderzoek van Onderwijs, februari 1996, 21-22. [harde kritiek op het idee 'de student als consument', op een vouchersysteem voor het hoger onderwijs]

Het tweede voorbeeld betreft de sterk opkomende mode van docentbeoordelingen door studenten. Zulke opinies zijn er natuurlijk altijd geweest, en het uiten ervan voorziet in een behoefte. De docent die er niet tegen kan, moet niet met adolescenten werken. Het gebruik echter van dergelijke opinies als instrument van personeelsbeleid is van een perversie die zijn weerga niet kent. In de eerste plaats is de student niet bevoegd als beoordelaar. Bevoegdheid vindt zijn wortels in het zelf afleggen van verantwoording, en men kan studenten nu eenmaal niet ter verantwoording roepen. De eerste docent die op grond van zulke 'beoordelingen' wordt benadeeld en een proces aanspant, kan dan ook rekenen op mijn financiële steun. Colleges van bestuur zullen zich verdedigen met de volgende slimmigheid: wij beoordelen, alleen baseren wij ons (deels) op opinies van studenten. De colleges zijn bij dezen alvast gewaarschuwd: de dienstdoende rechter zal die praktijk van tafel vegen als een vorm van rechtsdelegatie aan onbevoegden, en derhalve ontoelaatbaar en nietig. Het college wordt veroordeeld tot betalen van de kosten van het geding, en ik krijg mijn geld terug. In de tweede plaats zijn studenten materieel gesproken niet geschikt als beoordelaar. Het voornaamste instrument ter stimulering van het leerproces is het tentamen en de norm die daarbij wordt gesteld. Het leren moet de student zelf doen. De kwaliteit van het onderwijs valt alleen zinvol te definiëren aan de hoogte van de gestelde norm. Hoe beter dus het onderwijs, des te meer heeft de student zich zelf moeten inspannen. De doorsnee student stelt dat niet op prijs, en brengt zulks tot uitdrukking. Tussen onderwijskwaliteit en studentoordeel bestaat dan ook een structureel negatief verband. Het consumenten-paradigma gaat hand in hand met het rechtszekerheidparadigma, waarin de student wordt opgevat als aangeklaagde wiens rechten moeten worden beschermd. Zo komt het voor dat studenten worden 'vrijgesproken' van een onvoldoende als de examinator een vormfout heeft gemaakt. Onderwijskundig slaat dit al evenzeer als een tang op een varken; het gaat erom dat mensen iets leren. Er is maar een geldig paradigma: een student is een student. Onderwijs is mensen iets leren dat ze uit zichzelf niet zouden leren (want dan zou je niet hoeven te onderwijzen), de sanctie waarmee dat wordt bewerkstelligd is het tentamen. Iedere docent weet dat. Beleidmakers die de kwaliteit van het onderwijs willen verbeteren, hebben dan ook een heel makkelijke taak. Ze moeten gewoon hun handen thuis houden en de docent niet voor de voeten lopen. Het best kunnen ze zich laten omscholen, bijvoorbeeld tot docent.

W. K. B. Hofstee (1999). Principes van beoordeling: Methodiek en ethiek van selectie, examinering en evaluatie. Lisse: Swets & Zeitlinger.

Wim Hofstee (1999). Beoordelen. Studiedag Centrale Ondernemingsraad Universiteit van Amsterdam, Vakbondsmuseum, Amsterdam.

Janny Eekman en Frans Weeber (2003). Beoordelen in het voortgezet onderwijs: van cocon tot vlinder. Amersfoort: CPS. pdf

J. Willems, W. Gijselaers en D. de Bie (1992). Kwaliteitszorg door studenten. Gids voor onderwijsevaluatie. Groningen: Wolters-Noordhoff.

Het blijkt dus niet zo te zijn dat latere auteurs, met een zonnige kijk op docentbeoordeling, van Wilbrink en Hofstee gebruik maken, zich er tegen afzetten, or whatever. Komt me bekend voor.

Janny Eekman en Frans Weeber (2003). Beoordelen in het voortgezet onderwijs. Van cocon tot vlinder CPS. pdf

"In 2002 heeft een aantal scholen onder begeleiding van CPS een pilottraject doorlopen. Het ging om het beoordelen van zittende medewerkers. Gestart is met het ontwikkelen van een visie op beoordelen. Vervolgens is een bij die visie passende beoordelingssystematiek ontworpen.
In deze publicatie wordt een beschrijving gegeven van de pilot en de resultaten. Dit wordt gedaan aan de hand van een stappenplan. De ervaringen van de pilot-scholen kunt u vinden in vier schoolportretten. Bij het lezen wordt duidelijk dat voor het invoeren van beoordelingsmanagement geen standaardformule bestaat. Een school maakt haar eigen keuzes passend bij de cultuur en ontwikkelingsfase waarin ze zich bevindt."

Voor het artikel over docentbeoordeling, in ditzelfde nummer zie Wilbrink en Hofstee: Docentbeoordeling html.

Voor de bespreking van het evaluatieboek van Millman, in ditzelfde nummer zie Evaluatie Docentbeoordeling html.

Eva L. Baker, Paul E. Barton, Linda Darling-Hammond, Edward Haertel, Helen F. Ladd, Robert L. Linn, Diane Ravitch, Richard Rothstein, Richard J. Shavelson, and Lorrie A. Shepard. 2010. “Problems with the Use of Student Test Scores to Evaluate Teachers.” Economic Policy Institute Briefing Paper #278. pdf

Clark Glymour (draft 2003). Why the University Should Abolish Faculty Course Evaluations. pdf

[first paragraph] In company with several other University bodies, the Faculty Senate has recently approved a new Faculty Course Evaluation instrument, to be filled out on-line. Both for students and for faculty the decision is unfortunate, and quite possibly for some faculty, sometime, it will be very unfortunate. What the Faculty Senate ought to have done was to recommend investigation of a more serious process for estimating the quality of instruction, leading towards the end of University sponsorship of Faculty Course Evaluation forms. Students should be entirely free to organize and publicize their own on-line evaluations of courses and faculty, but the results should not have the imprimateur of the University itself. I will start my argument with some anecdotes.
Glymour is hier vooral ervaringsdeskundige, hij maakt er geen filosofisch hoogstandje van.

Paul Ginns, Herbert W. Marsh, Masud Behnia, Jacqueline H. S. Cheng & L. Francesca Scalas (2009). Using postgraduate students’ evaluations of research experience to benchmark departments and faculties: Issues and challenges. British Journal of Educational Psychology, 79, 577-598. abstract

Themanummer: Beoordeling van docenten. Pedagogische Studiën, 85, 219-308.

Beijaard, D. & Brekelmans, M. (2008). Beoordeling van docenten: inleiding op het themanummer, 219-221.
Schaaf, M. van der, Stokking, K. en Verloop, N. (2008). De validiteit van het beoordelen van docentcognities en docentgedrag in docentportfoliobeoordelingen, 222-239.
Bakker, M.E.J., Sanders, P., Beijaard, D., Roelofs, E., Tigelaar, D. en Verloop, N. (2008). De betrouwbaarheid en generaliseerbaarheid van competentiebeoordelingen op basis van een videodossier, 240-260.
Nijveldt, M., Brekelmans, M., Beijaard, D., Wubbels, Th. en Verloop, N. (2008). Validiteit in paarsgewijze beoordelingen van docentcompetenties, 261-279.
Roelofs, E. (2008). Op weg naar congruentie tussen opleiden en beoordelen van docenten: een raamwerk voor competent handelen, 280-293.
Tillema, H. (2008). Wat is er mis met beoordelen?, 294-304.
Bosker, R.J. (2008). Discussie ‘Tripliek: een onnodig gecompliceerde voorstelling van zaken’, 305-308.

Valerie Straus (January 1 2011). Teacher evaluation: going from bad to worse? The Washington Post &;squo;answer sheet’ website. blog

Paul Kirschner (december 2016). Leraar briljant, lerares bazig! Didactief. blog

Michael Strong, John Gargani & Özge Hacifazlioglu (2011). Do We Know a Successful Teacher When We See One? Experiments in the Identification of Effective Teachers. Journal of Teacher Education, 62, 367-382. pdf

This study reports on three experiments in which judges viewed teachers giving lessons and then categorized teachers as either high or low performing, defined in all cases by the achievement gains of their classes on standardized tests. Our purpose was to examine whether, under increasingly more favorable conditions, judges agreed with one another and were accurate. In every case, judges achieved relatively high levels of agreement but were absolutely inaccurate, leading us to question whether educators can identify effective teachers when they see them.
from the Conclusion

Paul A. Kirschner & Mirjam Neelen (February 7, 2017). Many schools involve their students in teacher ratings. The question is if that's a good idea. blog

Meta-analysis of faculty's teaching effectiveness: Student evaluation of teaching ratings and student learning are not related . Bob Uttl, Carmela A. White & Daniela Wong Gonzalez (2017). Studies in Educational Evaluation, 54, 22-42. abstract

Iris Breetvelt (2021). Studentevaluaties basis voor docentbeoordeling en onderwijsverbetering? pdf

juli 2021 \ contact ben apenstaartje benwilbrink.nl

http://www.benwilbrink.nl/publicaties/84DocentbeoordelingOvO.htm http://goo.gl/gqcX8