Introductie kwaliteitscheck op ontworpen toetsvragen

Ben Wilbrink


30 oktober 2009 Van Nelle-fabriek


“(...) leerlingen die een opgave goed hebben en dan toch komen klagen, zou ik goed in de gaten houden. Dat zijn slimmeriken, maar wel irritante slimmeriken.”

Wiskundemeisjes, 24 oktober 2009, De Volkskrant.

In de gaten houden? Sterker nog: luister goed naar ze. Irritante slimmeriken? Kijk, zoiets getuigt van een houding, of op zijn minst van enige zelfoverschatting, die de ontwerper van toetsvragen niet past. Geef de slimmeriken al op het toetsformulier ruimte voor hun beklag, in de vorm van een toelichting op hun antwoord.


Mijn achtergrond in het kort is de volgende. Ik ben van huis uit experimenteel psycholoog en pas dat toe als onderwijsonderzoeker. Ik heb altijd belangstelling gehad voor selectieprocessen, en kijk ook op die manier naar hoe onderwijs en examens functioneren. Door onderzoek naar aansluitingen tussen hoger onderwijs en arbeidsmarkt ben ik gevoelig voor de uiteindelijke relevantie van toetsvragen: niet alleen hier en nu, maar wat voegt deze inhoud toe aan de bagage waarmee studenten straks verder de wereld in trekken? Het ontwerpen van toetsvragen had mijn intense belangstelling rond 1980, resulterend in een Aula in de Hoger Onderwijs Reeks pdf, en is sinds een aantal jaren weer terug op mijn agenda: hier.


Op het middagprogramma staat een oefening in intervisie, waar het erom gaat dat u ervaart wat uw eigen kracht is in het vinden van sterke en zwakke plekken in toetsvragen die door anderen zijn ontworpen, en wat de grote bijdrage kan zijn van dezelfde analyse die anderen loslaten op toetsvragen die u zelf hebt ontworpen. Deze intervisie kunt u eenvoudig ook op uw eigen werkplek organiseren, waarmee een grote stap is te zetten in kwaliteitsverbetering van uw toetsvragen. Allerlei detailkwesties kunt u wel opzoeken in de makkelijk toegankelijke literatuur. Of mij e-mailen.


Wat ik nu met u wil doen, is aantal bijzondere gevallen bespreken. Het zijn toetsvragen die niets met uw eigen onderwerp te maken hebben, dat zou maar afleiden. Toch snijd ik er kwesties mee aan die voor iedere ontwerper van belang zijn. U hoeft dit niet allemaal te onthouden, het gaat meer om het krijgen van de vrijheid om op verschillende manieren te kijken naar het ontwerp van toetsvragen. Als het de tongen losmaakt voor de middagsessie, dan is dat prachtig. Even snel een oefening met de 7-puntslijst:


de 7-puntslijst voor intervisie


‘Wat wil de ontwerper weten over wat Piet weet?’ is een vraag die in de 7-puntslijst valt onder welk nummer?

  1. #1: de eerste indruk
  2. #2: de bedoeling
  3. #3: de inhoud
  4. #6: de sturende werking

Graag een reactie van de deelnemers: eerste indruk (#1 uit de zevenpuntslijst)


Wat denkt u dat de ontwerper van deze vraag wil weten? (#2 uit de zevenpuntslijst)


Wat vindt u van de inhoud van deze vraag? (#3 uit de zevenpuntslijst)


Wat is het effect van vragen zoals deze op de manier van omgaan met de cursustof? (#6 uit de zevenpuntslijst)


Goed, dan hebben we dat gehad. Vragen die direct uit de lesstof zijn afgeleid moet ik toch even genoemd hebben, ik ben er geen fan van. De 7-puntslijst komt in het volgende nog meer van pas.


Terugvragen van informatie uit de de opgegeven stof levert geen inhoudelijk adequate toetsvragen op, tenzij het tegendeel aannemelijk valt te maken. Het gaat er immers om dat kandidaten deze kennis kunnen gebruiken, dwarsverbanden kunnen leggen, kortom: werkelijk beheersen. Inhoudelijk adequate toetsvragen gaan dus over die onderlinge verbondenheid van kennis, over nieuwe toepassingen, en dergelijke. Als kandidaten hun antwoorden motiveren, is meteen duidelijk of onjuiste antwoorden berusten op gebrek aan kennis van de stof, of op een onhandig gebruik van kennis die er op zich wel is. Alleen vragen naar informatie uit de stof, geeft geen antwoord op wat de ontwerper zou moeten willen weten: kan de kandidaat die informatie op wendbare manieren gebruiken?


de leeftijd van de kapitein


Er zijn 26 schapen en 10 geiten aan boord van een schip. Hoe oud is de kapitein?

Wat is uw eerste indruk (#1)


Hint: wat denkt u dat de ontwerper van deze vraag wil weten, van wie, en waarom? (#2)
Wie is de ontwerper, een leerkracht, wiskundige, literair auteur, onderwijsonderzoeker?


Leveren de antwoorden de verwachte informatie op? (#5)


Is de vorm van de vraag adequaat? (#4). In het bijzonder: zou een keuzevraag dezelfde informatie opleveren?


Dan een variant op #6 uit de 7-puntslijst: ik vraag niet of het stellen van vragen van het type ‘de leeftijd van de kapitein’ effect zou hebben op het onderwijs (dat zou het zeker hebben). Nee, de vraag is of ‘gewone’ redactiesommen, gezien de resultaten op ‘de leeftijd van de kapitein,’ wel functioneren zoals leerkrachten en anderen verwachten?


Wat is die dubbelslag, welke twee dingen vraagt een redactiesom?


Terug naar ‘Wat is de leeftijd van de kapitein?’: er valt geen rekenkundig model te maken bij deze opgave. Hebben leerlingen dat door? Wat denkt u van 10-jarige leerlingen? Hoeveel slimmeriken zijn er onder de tienjarigen?


Vraag: ziet u een analogie met specifieke typen toetsvragen in vakken in bijvoorbeeld het hoger onderwijs, of in uw eigen vakgebied?


Er is altijd spanning tussen de doelen van onderwijs en de toetsing op die doelen. ‘De leeftijd van de kapitein’ demonstreert dat het perfect mogelijk is dat we denken met een bepaald type opgaven goed bezig te zijn, terwijl er in werkelijkheid iets anders gebeurt.


Redactiesommen doen twee dingen tegelijk, en beide gaan op deze manier niet goed (#3 van de 7-puntslijst): 1. een gegeven situatie vertalen naar een rekenmodel, 2. de berekening maken op basis van het model. Een goede didactiek zou dit op kunnen vangen, maar beter is om toetsvragen geen dubbel werk te laten doen, tenzij (een goed ontwerp dat mogelijk maakt). Haal 1) en 2) dus uit elkaar.


Dit gaat toevallig over redactiesommen, omdat daar goed onderzoek over beschikbaar is, maar hetzelfde probleem is herkenbaar in veel andere vakgebieden. Op academisch niveau: nieuwelingen zijn geneigd om problemen op te lossen door onmiddellijk met formules te gaan stoeien en rekenen, zonder eerst na te denken. ‘De leeftijd van de kapitein.’


Tenslotte een voorbeeld van goed ontwerp: het vignet met een medisch-diagnostische opgave, waarin onvoldoende gegevens om een diagnose te kunnen stellen, maar waar de kandidaat dat moet onderkennen en aangeven welke extra informatie nodig is.


hoeveel fouten?


Een kandidaat scoort 38 punten op een toets met 50 vierkeuzevragen. Wat valt er te zeggen over het aantal vragen dat zij goed heeft geraden, in plaats van geweten?

Het zou best aardig zijn om de kwaliteiten van deze vraag te analyseren aan de hand van de 7-puntslijst, maar anders dan bij de overige gevallen, gaat het mij in dit geval om het beantwoorden van de vraag zelf.


Wat is uw eerste indruk hier? (#1)


De hamvraag is dan: hoe kunnen we weten op hoeveel vragen deze kandidaat heeft geraden?


Dat is erger dan het lijkt, hebt u enig idee waarom dat kan zijn?


Denkt u dat deze formules die ‘corrigeren voor raden’ juist zijn, ook binnen de nadrukkelijke vooronderstellingen die ze maken? Als u ‘nee’ zegt, rechtvaardig dan dat antwoord.


Wat is een conclusie uit deze verkenning?


De keuzevraag hoeft niet gekunsteld te zijn, zoals ‘Op welk eiland ligt Nes?’ Hier zijn geen lastige interpretaties nodig.

Gekunstelde keuzevraag of niet, het zou prettig zijn te weten of een aangestreept onjuist alternatief een fout antwoord is, en niet een gok. Daar zijn verschillende mogelijkheden voor, waarvan de beste is om voor het open laten van een keuzevraag een bonus te geven. De gelegenheid geven om antwoorden toe te lichten is een andere. Verplichte onderbouwing van het antwoord is er ook een (iedereen doet dat altijd al met open vragen waar anders een eenvoudig ‘ja’ of ‘nee’ een goed antwoord zou zijn).

Kandidaten proberen te misleiden met alternatieven die fout zijn, maar voor iemand zonder kennis juist aantrekkelijk, is ronduit immoreel. Onjuiste alternatieven ‘afleiders’ noemen, zoals in de literatuur gebruikelijk, zet ontwerpers op het immorele been, gebruik dus nooit meer de term ‘afleider.’ Het vakgebied van studietoetsen is in bepaalde opzichten nog steeds niet volwassen, ga verstandig om met deze literatuur die u soms voor de vraag kan stellen ‘Wat is de leeftijd van de kapitein?’ [Bijvoorbeeld: ‘Hoe betrouwbaar is uw toets?’ Dit is een echte ‘de leeftijd van de kapitein’! E-mail mij voor een toelichting. ]


fout weten


Een bus heeft 36 zitplaatsen voor passagiers. Als 1128 leerlingen een excursie gaan maken, hoeveel bussen zijn dan nodig?

Alan H. Schoenfeld (2007). What Is Mathematical Proficiency and How Can It Be Assessed? In Alan H. Schoenfeld (Ed.) (2007). Assessing mathematical proficiency (59-73). Cambridge University Press. p. 69-70. http://www.msri.org/communications/books/Book53/files/05schoen.pdf gezien 8-2009

Eerste indruk? (#1)


Deze vraag is gesteld in een landelijke toets in de VS, voor 45.000 leerlingen. Laten we eerst eens kijken welke antwoorden er mogelijk zijn, goed, of fout. Ziet u ze? (#2 en 5)


Dan vraag ik u een schatting te geven van de percentages gescoord op deze antwoordalternatieven. (#5: concreet aangeven welke antwoorden te verwachten zijn, altijd goed om dat later met de werkelijke cijfers te vergelijken)


Ook is deze vraag een variant op die van ‘de leeftijd van de kapitein’, ziet u hoe?


Het geven van foute antwoorden is bepaald geen zeldzaamheid is. Dus ook niet bij keuzevragen. Fout weten is altijd nog een graadje erger dan alleen maar fout raden. Dat is een waarschuwing voor de ontwerper: in veel gevallen zal waarschijnlijk blijken dat kandidaten uw vragen veel minder goed maken dan u van ze verwachtte (#6). Speel ermee. Leg uw verwachting tevoren vast. Denk er bij de interpretatie van scores op meerkeuzevragen aan: mogelijk zijn de meeste foute antwoorden gegeven op basis van fout weten, niet fout raden.


Evenals bij ‘de leeftijd van de kapitein’ zijn er veel te veel leerlingen die alleen maar rekenen, zonder zich af te vragen wat het rekenmodel is dat bij deze vraag past. Wiskunde is allereerst een passend model opstellen voor het gegeven probleem. In dit verband is ook de volgende vraag opmerkelijk.


is dit wiskunde?


Wat is de volgende term in de reeks 3, 8, 15, 24, .... .

Milgram, R. J. (2007). What is mathematical proficiency? In A. H. Schoenfeld: Assessing mathematical proficiency (31-58). Cambridge University Press. p. 31-58. http://www.msri.org/communications/books/Book53/files/04milgram.pdf gezien 10-2009


Eerste indruk? (#1)


Wat wil de ontwerper van deze vraag weten? (#2)


Is de formulering van de vraag in orde? (#4)


Wat denkt u, is dit een incidentele misser in een wiskundetoets, of komt dit type gebrek van niet-wiskundige vragen op enige schaal voor, en hoe vaak dan wel (volgens de auteur waaraan ik refereer)? (#6, de ernst van dit type ontwerpprobleem)


‘De leeftijd van de kapitein’?


Bij dit casus gaat het mij om de vakinhoudelijke misser, de mate waarin vakinhoudelijke missers bij toetsvragen voorkomen, en de achtergrond daarvan (de ontwerpers zijn geen inhoudelijke experts, althans niet expert genoeg, of laten zich op sleeptouw nemen door misplaatste ideeën over wat het is om toetsvragen te stellen.

Het hier gesignaleerde probleem met dit type vragen over reeksen, komt in de VS veel voor. Maar het is natuurlijk een algemeen gebrek van wiskundeopgaven waarbij de tekst zelf van de vraagstelling van een slordigheid is die niet bij de wiskunde past. Of bij welk ander vak dan ook, moet ik er onmiddellijk bij zeggen.

Een direct verwant en in belang groeiend probleem dat Milgram signaleert is het volgende. Probleemoplossen is in de wiskunde enorm belangrijk. Er is een buitengewoon goed boek voor studenten en docenten over dat probleemoplossen: van George Polya, en het heet How to solve it. Er is ook een Nederlandse vertaling van. Wat gebeurt er nu in de wereld van de wiskunde: waar Polya het probleemoplossen behandelt als iets dat je moet doen met de kennis die je al hebt, komen steeds meer commissies en didactici op het idee dat probleemoplossen zelf, geabstraheerd van inhouden, een doel van wiskundeonderwijs zou zijn. U herkent hierin ongetwijfeld de problematiek van de ‘competenties’, in zijn slechtste vorm zijn dat van kennis losgezongen vaardigheden. De ontwerper van wiskundeopgaven, of opgaven voor welk ander vak dan ook, die uitgaat van een competentie probleemoplossen, in plaats van wiskundige inhoud, treedt buiten het vakgbied van de wiskunde. Dergelijke opgaven zijn geen wiskundeopgaven meer.


het stapelen van tegels


Bouw een toren van vierkante stoeptegels die zo ver mogelijk naar een kant overhelt. De tegels mogen alleen op elkaar gelegd worden, niet naast elkaar. Hoe ver helt hij maximaal over?

  1. Precies twee tegels.
  2. Ongeveer anderhalve tegel.
  3. Oneindig ver.

Nationale Wetenschapsquiz 2005 www.nwo.nl/quiz. Mogelijk ontleend aan: Eric W. Weisstein (2005?). Book Stacking problem mathworld, met literatuurlijst waarin de cantilevered books zijn behandeld, de oudste is 1953, maar het zal in de 18e eeuw ook al wel zijn bestudeerd. De oplosing van Wolfram, 0,5 Hn, waar Hn de harmonische reeks is, is niet de maximale, volgens Mike Paterson & Uri Zwick (2006), een publicayie veschenen na de NQQ: http://portal.acm.org/citation.cfm?id=1109584

Eerste indruk? (#1)


Wat wil de ontwerper weten? (#2)


Is het een inhoudelijk interessante vraag? (#3)


Is de vormgeving van de vraag gelukt? Is de stam van de vraag volledig? Zijn de gekozen alternatieven geslaagd? (#4)


Wat doen dit soort opgaven met de belangstelling van kandidaten voor het vak wiskunde? (#6)


Bij dit casus gaat het mij een een veelvoorkomende misser van juist vakexperts die toetsvragen ontwerpen. In zekere zin het omgekeerde van het voorgaande casus.

Vakexperts kunnen zo met hun vak bezig zijn, dat ze niet zien dat er iets helemaal fout loopt in het ontwerp van een toetsvraag. In dit geval is er sprake van een oneindig ver overstekende stapel stenen, en dat is echt iets dat in ons heelal niet mogelijk en zelfs niet denkbaar is.

In dit geval heb ik van gedachten gewisseld met de indiener van de vraag voor de Nationale Wetenschapsquiz. Hij vertelt mij dat de redactie buiten zijn medeweten de formulering van de vraag heeft veranderd. Kijk, dat is inderdaad een manier waarop er gemankeerde toetsvragen kunnen ontstaan. Het doet denken aan de aanbeveling gegeven door Lans en Mellenbergh in 1969 (in De Groot en vVan Naerssen): geef uw ontworpen vragen een harde behandeling in intervisie en dubbelchecks, maar wijzig dan ook niet meer het kleinste detail aan de vragen die dit kruisvuur hebben doorstaan.

Overigens had de indiener van deze vraag niet echt moeite met de slordige redactie, want het is een wiskundige vraag, dan abstraheer je van de werkelijkheid van betonnen tegels, stel je een goed model op, en evalueer je dat voor een abstracte stapel die oneindig hoog groeit (ik vat het samen in mijn eigen woorden). Volgens deze redenering is het antwoord ‘36’ op de vraag naar de leeftijd van de kapitein een correct antwoord, want in een optelmodel is de som van 24 en 12 gelijk aan 36. O ja, het ging over tegels, eh, sorry, de leeftijd van de kapitein, inderdaad, dat is toch iets anders.




bronnen:

de 7-puntslijst voor intervisie Ben Wilbrink. Voor de lijst zelf zie hier, een ingekorte versie is onderaan deze pagina geplaatst.

de leeftijd van de kapitein
Lieven Verschaffel, Brian Greer and Erik de Corte (2000). Making sense of word problems. Lisse: Swets & Zeitlinger. p. 4. Hoofdstuk 2 behandelt een reeks onderzoeken met dit type vragen.

fout raden Ben Wilbrink. Een toets is voor Jan of Marie een steekproef uit hun kennis. Daar zitten dus toevalligheden in. Een applet dat deze toevalligheden zichtbaar maakt, en bovendien de mogelijkheid biedt om te werken met een bonus voor opengelaten ragen, geef ik hier.

fout weten
Alan H. Schoenfeld (2007). What Is Mathematical Proficiency and How Can It Be Assessed? In Alan H. Schoenfeld (Ed.) (2007). Assessing mathematical proficiency (59-73). Cambridge University Press. p. 69-70. http://www.msri.org/communications/books/Book53/files/05schoen.pdf gezien 8-2009

is dit wiskunde?
Milgram, R. J. (2007). What is mathematical proficiency? In A. H. Schoenfeld: Assessing mathematical proficiency (31-58). Cambridge University Press. p. 31-58. http://www.msri.org/communications/books/Book53/files/04milgram.pdf gezien 10-2009

het stapelen van tegels:
Nationale Wetenschapsquiz 2005 www.nwo.nl/quiz. Mogelijk ontleend aan: Eric W. Weisstein (2005?). Book Stacking problem mathworld, met literatuurlijst waarin de cantilevered books zijn behandeld, de oudste is 1953, maar het zal in de 18e eeuw ook al wel zijn bestudeerd.




de leeftijd van de kapitein: meer voorbeelden

Hoe oud is de herder?


Een kudde telt 125 schapen en 5 honden. Hoe oud is de herder?
Ik heb 4 lollies in mijn rechterzak en 9 snoepjes in mijn lnkerzak. Hoe oud is mijn vader?

Verschaffel e.a. p. 4, uit onderzoek van IREM

Een toets bestaande uit vragen van dit type werd individueel schriftelijk afgenomen, met bij iedere opgave de vraag: “Wat denk je van dit probleem?” Van de 9- tot 11-jarigen gaf 62% aan dat ze deze vragen niet behoorlijk konden beantwoorden. De overigen twijfelden niet, en rekenden antwoorden uit.


Alcuin’s ‘de merel en de slak’


Een slak werd door een zwaluw te eten gevraagd. Het nest van de zwaluw lag ongeveer een mijl verderop. De slak kon per dag niet meer dan het twaalfde deel van een voet afleggen. Zeg nu hoeveel dagen het duurde voor de slak op het diner verscheen.

Ademar van Chavannes (Chabannes) (manuscript appr. 1050). Liber manualis, met aan Alcuin toegeschreven redactiesommen. Vertaling van deze opgave: W. P. Gerritsen (2007). Europa's leerschool: de zeven vrije kunsten in de Middeleeuwen. Een rondgang langs Leidse handschriften. Leiden: Primavera Pers. Afscheidscollege. p. 25.

Alcuin, de meester die door Karel de Grote naar zijn hof was gehaald om onderwijs van de grond te tillen. De ‘verkeerde’ redactiesommen zijn het West-Europese onderwijs dus van meet af aan meegegeven. Met de beste bedoelingen natuurlijk, om leerlingen scherp te leren rekenen. Dat een slak binnen zijn lifetime niet bij de zwaluw zou komen, dat was en kleinigheid waar leerlingen zich maar beter niet als ‘irritante slimmerik’ op konden manifesteren. Zie Gerritsen.


Waterink


In 1630 moest Prins Frederik Hendrik met 1500 man aftrekken. Hoeveel bleven er over?


Een boer verkoopt een vette gans voor 50 cent het pond. De gans weegt tien pond plus de helft van zijn gewicht. Hoeveel krijgt de boer voor die gans?


Jan is geboren in 1905. Piet is drie jaar ouder dan Jan. Anna is tien jaar jonger dan Piet. Mina is twee jaar ouder dan Anna en Kees is twaalf jaar jonger dan Mina.


Een trein vertrekt van Amsterdam om precies tien uur. Deze trein rijdt 60 km. per uur en rijdt in de richting Rotterdam zonder te stoppen. Een andere trein rijdt van Rotterdam naar Amsterdam met een snelheid van 40 km. per uur, ook zonder te stoppen. De afstand Rotterdam-Amsterdam bedraagt 86 km.

Als nu de treinen elkaar passeren, welke trein is dan het verste van Amsterdam verwijderd?


Uit een proef van Waterink, zoals vermeld in A. Leen (1961). De ontwikkeling van het rekenonderwijs op de lagere school in de 19e en het begin van de 20ste eeuw. Wolters. p. 132-133.

De leeftijden: 90% van de studenten en onderwijzers begonnen eraan te rekenen, maar is er is geen vraag gesteld! Ook de treinen-opgaaf brengt 'een groot aantal mensen' aan het rekenen (hebt u het juiste antwoord gezien?). De prijs voor de gans bleek 'tientallen mensen, die jarenlang les hebben gegeven' te machtig: ze konden er niet mee uit de voeten (dus zonder op te meken dat de vraag zo niet is te beantwoorden), of kwamen na lang nadenken toch met een oplossing.


De volgorde: eerste een rekenkundig model opstellen, en dan pas gaan rekenen, is niet dwingend. Het omgekeerde kan namelijk ook Bijvoorbeeld: bewijs de stelling van Pythagoras met een natuurkundige proef. Zie Mark Levi (2009). Dit idee is natuurlijk niet nieuw, Levi verwijst onder andere naar werk van George Polya.

Mark Levi (2009). The mathematical mechanic. Using physical reasoning to solve problems. Princeton University Press.




hoeveel fouten: meer voorbeelden


Gevestigde ideeën over keuzevragen stammen uit de zestiger jaren: de oprichting van het Cito, een stevig boek voor docenten onder redactie van Adriaan de Groot en Robert van Naerssen (1969). Uit dit boek spreekt een groot optimisme over de verdiensten van de meerkeuzetoets, destijds consequent ‘studietoets’ genoemd, boven de bekende proefwerken, tentamens, en examens. Het ligt dus voor de hand om dit boek te raadplegen over fout gemaakte in plaats van fout geraden vragen. Hoofdstuk 18 gaat in het bijzonder over wat te doen met raden. Keer op keer kan de lezer daar vinden dat aangestreepte foute alternatieven zijn aangestreept omdat de kandidaat daar heeft geraden. Geen woord over de mogelijkheid dat kandidaten vragen gewoon fout kunnen weten. Dit is geen onschuldig verzuim van Van Naerssen, die hier overigens de internationale literatuur volgt. Op deze stilzwijgende veronderstelling dat kandidaten nooit iets verkeerd weten, berust een uitvoerig betoog over de optimale strategie van kandidaten, over scoringsformules, en over de wenselijkheid dat kandidaten de niet geweten vragen raden in plaats van open laten. Er is een kleine uitzondering: deze literatuur signaleert wel dat kandidaten die een vraag niet weten, een verkeerd alternatief aantrekkelijk zouden kunnen vinden bij het raden op die vraag. Maar zelfs dat gaat voorbij aan de overvloedigheid waarmee foute antwoorden voorkomen bij de klassieken korte open vragen.


Over niet beantwoorde keuzevragen zijn De Groot en Van Naerssen (1969) een tikje dubbelhartig. De Groot stelt (p. 17) onomwonden dat kandidaten die keuzevragen openlaten, daarvoor niet gestraft mogen worden maar een bonus toegekend moeten krijgen, per vraag gelijk aan 1 gedeeld door het aantal keuzealternatieven. Dat is krenterig, maar het principe is royaal. Van Naerssen hamert in hoofdstuk 18 voortdurend op het de kandidaten verplichten om altijd te raden op niet geweten keuzevragen. Dat betekent dat hij per ongeluk of systematisch niet beantwoorde vragen fout laat rekenen. Is dat laatste een ramp? Hetzelfde gebeurt ook bij korte open vragen: ‘geen antwoord’ en een ‘fout antwoord’ leveren beide meestal geen punt op. En vergeet niet de mogelijkheid bij opstelvragen om uitvoerig op te schrijven wat je allemaal wèl weet, om te versluieren dat het gevraagde antwoord schuldig moet blijven.

A. D. de Groot en R. F. van Naerssen (Red.) (1969). Studietoetsen, construeren, afnemen, analyseren. Mouton.




fout weten: meer voorbeelden

Staartdelen of niet staartdelen.


De uitwerkingen van de deelopgaven zijn bekeken en gecodeerd om de door de leerling gebruikte oplossingsstrategie bij elke opgave vast te leggen. In totaal zijn er 5704 deelopgaven aan de leerlingen voorgelegd waarvan:

C. M. van Putten (2005, p. 125-131). pdf

Natuurlijk, deze landelijke toetsen zijn zo ontworpen dat de vragen een behoorlijke moeilijkheidsgraad hebben, dus dat er veel fouten worden gemaakt hoeft niet te verbazen. Wel is het opmerkelijk dat er zo vaak uit het hoofd wordt gerekend, met jammerlijke gevolgen. Overigens zijn er bij dit onterechte uit het hoofd rekenen enorme verschillen tussen zakke en sterke rekenaars: de sterke rekenaars doen het uit het hoofd nog niet eens zo slecht. Zie verder Van Putten voor de gedetailleerde studie van de rekenresultaten in Nederland. Voor de meest recente artikelen in de woordenstrijd over realistisch rekenen, zie ook enkele artikelen in Psychometrika, 2009 (

http://www.springerlink.com/content/j66j04535373562t/fulltext.pdf

http://www.fi.uu.nl/publicaties/literatuur/7129.pdf

http://www.springerlink.com/content/u2nk351678n1214g/fulltext.pdf).




het stapelen van tegels: meer voorbeelden

Hoeveel ruimte tussen aardbol en touw?


Er zit een touw strak om de aarde, zoals een ring om een vinger. Het is een heel lang touw van meer dan 40 duizend kilometer. Nu knip je het touw door en doe je er 1 meter extra touw tussen. Dan til je het touw overal een beetje op, zodat het op elke plek even ver van het aardoppervlak is. Hoeveel ruimte is er nu tussen het touw en de aarde? Ongever zoveel als een elektron? Een bacterie? Een krant? Een kat? Een olifant?

Ionica Smeets (24 oktober 2009). Wiskundemeisjes. De Volkskrant, Kennis, p. 5

Bovenstaande vraag is van een idiotie die bij wiskundige problemen wel vaker is te zien. Het idiote is dat hier een 'leuke context' is bedacht bij een wiskundig model. De omgekeerde wereld dus. Nu was de bedoeling van Ionica Smeets om haar gehoor vrolijke opgaven te laten maken, daar is niets mis mee. Maar met wiskunde heeft deze opgave dus niets te maken. Een dame in haar gehoor vond het ook nogal dom, hoewel ze de goede oplossing had: deze dame werd afgeserveerd: “Klagen over een stomme som die ze goed hebben: dat zijn irritante slimmeriken.” Er zijn ongetwijfeld reële situaties waarin dit probleem kan spelen, gebruik dan ook een reële situatie. Hebt u het antwoord al bedacht? Laat u niet afleiden door die aardbol, maar neem in plaats daarvan een muntstukje (of een aardbol-puntenslijper). Voor dat muntstukje is het antwoord meteen duidelijk, ook zonder formules te kennen (leg er een touw van 1 meter omheen): de kat past er in. Nu nog bedenken dat bij een verkeersrotonde het nog steeds de kat is die tussen touw en rotonde gaat passen. Dus ook bij die (echte) aardbol, maar daar heb je wel een heel bijzonder soort fantasie bij nodig (om maar eens iets te noemen: die bol is niet glad als een biljartbal). Ionica Smeets sleept er vervolgens, volkomen overbodig, de formule voor de straal van een cirkel bij, suggererend dat kennis van die formule het gestelde probleem beantwoordt.

Een variant op deze vraag is in een recente wetenschapsquiz (2008) gesteld, ook hier is weer een geflipte context bedacht bij een wiskundig modelletje. Ik kon deze vraag niet beantwoorden, ik begreep niet wat de ontwerper van de vraag bedoelde of wilde weten, ook al geven de alternatieven een hint in de bedoelde richting.

Hoeveel ruimte tussen duim en middelvinger?


Je hand past precies om een ronde trapleuning, zodat dat duim en middelvinger elkaar kunnen raken. Wat gebeurt er als je een handschoen aantrekt en je hand om de leuning legt?

  1. Er ontstaat een gat tussen duim en middelvinger.
  2. Het past nog steeds precies.
  3. De duim en de middelvinger overlappen elkaar een beetje.

Nationale Wetenschapsquiz 2008, p. 5, zie ook hier.



29 oktober 2009 \ contact ben apenstaartje benwilbrink.nl

Valid HTML 4.01!   W3 checklink   http://www.benwilbrink.nl/projecten/toetsvragen_casus_intro.htm







bespreekitems

Ben Wilbrink, 30-10-2009


“(...) leerlingen die een opgave goed hebben en dan toch komen klagen, zou ik goed in de gaten houden. Dat zijn slimmeriken, maar wel irritante slimmeriken.”

Wiskundemeisjes, 24 oktober 2009, De Volkskrant


de 7-puntslijst voor intervisie


‘Wat wil de ontwerper weten over wat Piet weet?’ is een vraag die in de 7-puntslijst valt onder welk nummer?

  1. #1: de eerste indruk
  2. #2: de bedoeling
  3. #3: de inhoud
  4. #6: de sturende werking

de leeftijd van de kapitein


Er zijn 26 schapen en 10 geiten aan boord van een schip. Hoe oud is de kapitein?

hoeveel fouten?


Een kandidaat scoort 38 punten op een toets met 50 vierkeuzevragen. Wat valt er te zeggen over het aantal vragen dat zij goed heeft geraden, in plaats van geweten?

fout weten


Een bus heeft 36 zitplaatsen voor passagiers. Als 1128 leerlingen een excursie gaan maken, hoeveel bussen zijn dan nodig?

is dit wiskunde?


Wat is de volgende term in de reeks 3, 8, 15, 24, .... .

het stapelen van tegels


Bouw een toren van vierkante stoeptegels die zo ver mogelijk naar een kant overhelt. De tegels mogen alleen op elkaar gelegd worden, niet naast elkaar. Hoe ver helt hij maximaal over?

  1. Precies twee tegels.
  2. Ongeveer anderhalve tegel.
  3. Oneindig ver.







Voor de volledige versie, met beknopte theorie toegevoegd, zie deze pagina.

Intervisie op vraagontwerp: 7 aandachtspunten.


Er ligt een concrete toetsvraag voor, zoals hij in een toets zou kunnen staan. Dus zonder het ontwerpidee, een modelantwoord, of statistische gegevens uit een eerdere afname.

Opmerkingen die bij eerder behandelde vragen al zijn gemaakt, hoeven niet telkens herhaald. Is dit de eerste te bespreken vraag, let dan meer op inhoud en vorm in algemene zin. Is het de derde of vierde vraag, dan kan alles korter, en let scherper op wat specifiek is bij de te bespreken vraag.


1. Eerste indruk van de vraag

2. Wat wil de ontwerper weten over de kennis van de kandidaat?

Natuurlijk, aan de vraag is niet altijd te zien wat de ontwerper wil weten; geef aan wat je denkt dat de ontwerper mogelijk wil weten, en neem dat dan ook mee bij de volgende aandachtspunten.

3. Is de vraag inhoudelijk adequaat? Kan het anders, beter? (Motiveer)

Het kan zijn dat de vraag beroerd is geformuleerd, of de verkeerde vorm heeft, maar dat is hier niet het punt. Is dit inhoud die ertoe doet, die specifiek is voor het gegeven onderwijs? Gaat het om begrip, onderlinge verbanden leggen, kennis motiveren, weten waarom je weet wat je weet?

4. Is de vorm van de vraag adequaat? Kan het anders, beter? (Motiveer)

Bekijk wat een ideale vorm voor deze vraag zou zijn.

Past de inhoud goed bij de vorm van de keuzevraag, is de inhoud ideaal om een open vraag over te stellen. En waarom is dat dan? Leidt dit tot een wijzigingsvoorstel voor de vorm van deze vraag?

5. Krijgt de ontwerper de bedoelde informatie? Kan het dan anders, beter? (Motiveer)

Zelfs bij simpele vragen zijn er vaak tal van mogelijkheden waarop kandidaten komen tot de verschillende antwoorden die ze geven. Wat daarbij voor de ontwerper van belang is, zou uit de antwoorden moeten blijken. Lukt dat bij dit ontwerp van de vraag? Wat zou dat kunnen verbeteren, en waarom?

6. Is het OK wanneer kandidaten zich gericht op vragen zoals deze gaan voorbereiden?

Een toets mag wel eens mosterd na de maaltijd zijn, maar studenten uit de volgende lichting zullen eruit afleiden hoe zij zich er het best op kunnen voorbereiden, misschien met zo weinig mogelijk inspanning. Gaat dat goed, als deze vraag typisch is voor de meeste vragen in de toets? Denk ook aan onbedoelde effecten: als rekenopgaven altijd een antwoord hebben, leren scholieren dat verwachten, alsof de wereld altijd kant-en-klare opgaven zal stellen; een artsexamen met veel keuzevragen geeft bepaald een verkeerd beeld van wat het is om medische kennis te gebruiken.

7. Overige punten van kwaliteit (zoals taal)

Dubbelzinnige tekst, moeilijke woorden, fouten in het Nederlands of de interpunctie, onbedoelde hints: het zijn allemaal kleinigheden die belangrijk kunnen zijn.