Oorspronkelijke uitgave 'Toetsvragen schrijven' 1983 Utrecht: Het Spectrum, Aula 809, Onderwijskundige Reeks voor het Hoger Onderwijs ISBN 90-274-6674-0, nu in publiek domein, auteursrechten B. Wilbrink. Onderstaande tekst is een sinds 2006 in bewerking zijnde versie. Voor de oorspronkelijke 1983 tekst zie www.benwilbrink.nl/publicaties/83ToetsvragenAula.pdf.

Toetsvragen ontwerpen

Handreiking bij het maken van toetsvragen over de leerstof

5. Toetsvragen over relaties tussen begrippen

Ben Wilbrink





Leerstof is altijd meer dan een opsomming van begrippen, het gaat immers vooral om wat al die dingen en verschijnselen onderling verbindt, om hun relaties. Allerlei soorten relaties hebben met elkaar een familiegelijkenis, ze delen wel gelijke kenmerken, maar dat zijn telkens weer andere. De ene relatie is de andere niet. Sommige relaties zijn belangrijk genoeg om als fenomeen een eigen naam te dragen. Andere relaties missen die eigen naam, maar zijn daarom niet minder belangrijk. Die 'anonieme' relaties zijn wat schimmig, omdat ze een eigen benaming missen komen ze meestal niet in de index van het boek voor, en in de bladspiegel van tekst vallen ze niet op zoals vaktermen dat juist wel doen. Daarom is het schematiseren van leerstof zo'n belangrijk hulpmiddel, voor de student, evenals voor de ontwerper van toetsvragen. Een inhoudsoverzicht is ook een schema, zie Figuur 1.

gif/06dToetsvragen4.1.1.jpg

Figuur 1. Variëteit van relaties.


Belangrijke relaties komen in een groot aantal wetten terug, of het zijn de relaties tussen de centrale begrippen van het vak. De ene relatie is daarom belangrijker dan de andere bij het oplossen van opgaven. Ieder vak kent wel een cluster van formules, wetten of kernbetrekkingen, waarmee de meeste problemen zijn aan te pakken. Andere relaties zijn af te leiden uit deze kernbetrekkingen, of vormen basaal materiaal dat nu juist in de kernbetrekkingen is samengevat.

Relaties zijn doorgaans een stap abstracter dan de verbonden begrippen zelf. Voor eenvoudige rekenkundige bewerkingen—relaties—is de eenheid waarin wordt gerekend zo'n verbonden en in dit geval ook funderend begrip (Sophian, 2008). Bij het ontwerpen van toetsvragen is dan ook aandacht nodig voor het niveau van abstractie van de toetsvraag (zie paragraaf 2.6). Hoe abstract sommige relaties ook zijn, meestal is het mogelijk om toetsvragen op een redelijk concreet niveau te stellen. Let bij wetmatigheden in algebraïsche vorm, zoals E = mc2 of F = ma, op dat de toetsvragen niet louter de algebra betreffen; algebra is een ander vak, een hulpvak. De onderwijskundige reden voor deze aanbeveling is nog steeds dat beheersen van abstracties op zichzelf, los van hun banden met de wereld, niet zinvol is. Abstracte hulpvakken als wiskunde zijn ook een intellectuele uitdaging op zichzelf, maar moeten aan het eind van de dag toch verschil maken in het omgaan met de wereld. Terwijl de pragmatische kant van deze aanbeveling weer is dat een meer concreet niveau van vraagstelling het mogelijk maakt rond een enkel onderwerp meerdere vraagvormen te ontwerpen die ieder een groot aantal nieuwe vragen mogelijk maken.

Sommige relaties vormen samen een bepaalde structuur. Toetsvragen over de structuur zijn niet wezenlijk anders dan vragen over welk ander onderwerp ook. Afhankelijk van wat van belang is om over de structuur te vragen, is het materiaal uit hoofdstuk 4 of 5, maar vooral ook uit hoofdstuk 6 (tekst) of 7 (aanpakken van problemen) aan de orde. Het is mij niet gebleken dat vragen over structuren zo bijzonder zijn dat ze afzonderlijke behandeling vragen. Dat geldt ook voor de speciale structuren als de classificatie, taxonomie of typologie, waar wel een afzonderlijke paragraaf (5.3) aan is gewijd, maar waar geen specifieke ontwerpmogelijkheden bij horen.

Dezelfde ontwerpmogelijkheden uit hoofdstuk 4 voor afzonderlijke begrippen, zijn ook toepasbaar voor relaties. Voor toetsvragen op basis van concrete voorbeelden maakt het geen wezenlijk verschil of het voorbeelden van een begrip of van een relatie zijn. Gebruik voor ontwerpmogelijkheden bij relaties ook hoofdstuk 4.


5.1 Vertalen en afbeelden


Deze paragraaf behandelt de grammaticale en idiomatische relaties, de logische en wiskundige relaties, en vertalingen van afbeeldingen (representaties) van de ene in de andere vorm. Het gaat hier om vertalen, in eigen woorden weergeven, samenvatten, kaartenmaken, kaartlezen, schematiseren, etcetera, allemaal varianten van het op een andere manier weergeven van dezelfde stand van zaken.

dictee
Een mooie grondvorm voor deze groep van toetsvragen is het dictee: een mondeling gegeven tekst op schrift zetten. Meestal gaat het dan om de juiste spelling. Maar dat kan ook anders zijn, zoals bij een Franse dictee de juiste woorden schrijven, in plaats van de woorden juist schrijven.

De antiheld deed alles op zijn elfendertigst en leverde de op z'n jan-boerenfluitjes in elkaar geflanste genreschilderijen steevast te elfder ure voor de subsidiëring af bij de mecenassen.

De site van Het Groot Dictee der Nederlandse Taal, daar ook alle oude dictees vanaf 1990.

Grondvorm of niet, zodra het helpt om spellingsregels goed toe te passen, wat bij het Groot Dictee onveranderlijk het geval is, valt het dictee ook onder het regime van paragraaf 5.4 over de regels en methoden.

Het aardige van het dictee als toetsontwerp is dat het alles in de hand houdt. Juiste woorden en juiste spelling zijn ook met andere opdrachten te toetsen, zoals een schriftelijk gegeven tekst in eigen woorden omzetten. Die vrije opdracht introduceert veel ruis als het erom gaat woordgebruik en spelling te toetsen, en is dus een stevige afrader. Als dat zo is, dan is dat ook een argument tegen het in de beoordeling van werkstukken meenemen van oordelen over spelling en woordgebruik.

Het gaat hier om een belangrijke vaardigheid die in tal van selectieve situaties een rol speelt, zoals toelating tot het vo, examens in het ho, en in sollicitatiebrieven. Een normatieve vraag is of correct taalgebruik altijd meetelt bij toetsen, alleen voor het gebruik van vaktermen, of helemaal niet (hoofdstuk 8 over normatieve kwesties). Empirisch onderzoek laat zien dat oordelen meebuigen op de kwaliteit van de presentatie, ook waar die presentatie zelf nadrukkelijk niet ter beoordeling staat. Waar het echt spannend is, kan werk worden overgetikt in correcte spelling. Voor de keizerlijke examens in China werd ieder werk standaard overgeschreven, spelling speelde daar uiteraard geen rol.

grammaticale relaties
Bij grammaticale relaties gaat het om de betekenis van uitspraken of zinnen, zoals bepaald door de onderlinge rangschikking en de vervoeging van de woorden.

She has [to bear] twelve children and the youngest was born yesterday.

Answer: borne

Naast deze concrete vragen komen ook abstractere vragen in aanmerking, zoals waar het van belang is dat de student kan aangeven waarom een bepaalde zin grammaticaal (on)juist is, of dat hij kan aangeven welke regel in een bepaald geval is toegepast en dergelijke. Voor een lerarenopleiding zijn deze vragen dan ook concreet. De concrete voorbeelden zijn grammaticaal mogelijk onjuiste zinnen, waarbij de student de geschonden grammaticale regel noemt.

Het vragen van nieuwe voorbeelden bij een bepaalde grammaticale regel past niet in een toets op grammaticaal correct taalgebruik. Dat is anders wanneer een actieve beheersing van de grammatica als systeem het doel van het onderwijs is. Bijvoorbeeld wanneer grammatica zelf het onderwerp van studie is, of wanneer de student grammaticale taalvaardigheid moet leren onderwijzen.

De mogelijkheden voor het gebruik van keuzevragen zijn beperkt. Ze zijn wel te ontwerpen, en de Verenigde Staten gebruikt ze op grote schaal, maar het probleem is dat de verantwoording voor het gebruik van onzinnige afleiders achterwege blijft.

AFRADER

I don't know as I occur with your decision to try and run for office.

  1. that I concur in your decision to try to
  2. as I concur in your decision to try and
  3. that I concur with your decision to try to
  4. as I concur with your decision to try to
  5. no change

Dit is een vraag over idioom, de student moet het idiomatisch beste alternatief aankruisen of alternatief 5. De meeste studenten die de test afleggen zullen alle alternatieven bestuderen. Het probleem is dat het herkennen van niet-idiomatische zinsdelen misschien niet eens tot de onderwijsdoelen hoort, en hoogstwaarschijnlijk niet de vaardigheid is die deze vraag bedoelt te toetsen. Vragen als deze komen voor in de Amerikaanse New High School Equivalency Examination, een grote landelijke toets.


onderstaande tekst van dit hoofdstuk is nog niet volledig herzien


logische en wiskundige relaties
Logische en wiskundige relaties zijn onderling nauw verwant. Wanneer er al vakken zijn waarin wiskundige hulpmiddelen geen plaats hebben, dan spelen logische relaties er zeker nog een rol in, al zou dat slechts zijn in de vorm van een argumentatiekunde.

Het accent ligt op het vertalen van gegeven tekst in symbolen en/of in symbolische relaties, en niet zozeer op het volgens de regels kunnen werken met formules of strings van symbolen (zie daarvoor o.a. 5.4).

Waar gaat het nu om bij het vertalen in logische of wiskundige relaties? Het brengt de beschreven situatie of gebeurtenis op een abstracte vorm. Dat is een eerste stap bij het maken van opgaven of het oplossen van problemen. Het abstraheert van alle specifieke, concrete bijzonderheden. Let, al naar de aard van de beschrijving, op:


afbeelden, modellen bouwen
Afbeelden van de ene representatie in een andere, in het bijzonder het afbeelden van relaties in een nieuwe representatie. Een prototype van deze wijze van vertalen is het omzetten van algebraïsche relaties in meetkundige. Een ander bekend voorbeeld is het gebruik van het Venn-diagram bij de verzamelingenleer en de waarheidstabel in de logica. De behandelde vertaling van concrete situaties in abstracte, wiskundige symbolen en relaties is ook een voorbeeld. Het bouwen van modellen is er eveneens onder te begrijpen; dat kunnen dan zowel wiskundige modellen als schaalmodellen zijn.

kaarten, grafieken, statistieken
Kaarten zijn afbeeldingen van een bepaald landschap vanuit een specifieke interesse (verkeer, grondstoffen) bekeken. Grafieken en tabellen zijn afbeeldingen van bestanden van gegevens, gericht op het met meer gemak kunnen aflezen van gewenste gegevens, samenhangen enz.

samenvatten, abstraheren, concretiseren, hypothesen stellen
Relaties hoeven niet uitsluitend één op één te zijn. In het voorgaande hoofdstuk zijn in feite abstraherende of concretiserende relaties aan de orde. Trek dat nu breder: een belangrijk type relatie is wat bepaalde gebeurtenissen of dingen met elkaar gemeen hebben. Dat gemeenschappelijke kunnen oppervlakkig waar te nemen kenmerken zijn, maar even goed abstractere zaken zoals gemeenschappelijke oorzaken, toepassingen, en wat niet al.

Of gemeenschappelijke kenmerken werkelijk bestaan of niet, dat is vaak de hamvraag. Voor het stellen van diagnoses is een eerste fase immers het opperen van een of meer mogelijke gemeenschappelijke verklaringen voor een gegeven aantal geconstateerde symptomen. De term 'diagnose' suggereert hier teveel een geneeskundige situatie, in feite gaat het om het opperen van veronderstellingen, het stellen van hypothesen, die in nader onderzoek op hun juistheid zijn te toetsen.

Ieder vak kent wel eigen specifieke afbeeldingsvormen, met daarnaast het gebruik van meer algemene, zoals de algebraïsche en meetkundige. Het doel van dergelijke afbeeldingen is in het algemeen het verkrijgen van een beter overzicht (bijna ergonomisch), en het daardoor gemakkelijker aan kunnen pakken van problemen. Niet zelden is het maken van een bepaalde afbeelding een onmisbare stap bij het oplossen van problemen. Soms is het maken van een schets niet beslist noodzakelijk, maar kan dit het vinden van oplossingen wel enorm vergemakkelijken (thermodynamica, Mettes en Pilot).

5.2 Onderscheiden


Een veel voorkomende relatie tussen begrippen is wat hen van elkaar onderscheidt. Bij onderscheidingen-zonder-meer, het onderwerp van deze paragraaf, gaat het om verschillen die niet op enigerlei wijze gesystematiseerd zijn (zoals een taxonomie of classificatie, zie 5.3). Dergelijke onderscheidingen zijn er in twee soorten: het onderscheiden van gemakkelijk te verwarren begrippen en de juiste keuze van instrumenten, technieken en dergelijke. Makkelijk onderling te verwarren begrippen zijn als zodanig meestal al aangeduid: de student krijgt de waarschuwing voor de dreigende misvatting. Bij de juiste keuze gaat het om het volgende probleem: een aantal verschillende technieken zijn ieder afzonderlijk behandeld en geoefend en de student die iedere techniek afzonderlijk beheerst, kiest bij een gestelde opgave uit deze beschikbare technieken de juiste. Let op de ingrijpende omkering die hier aan de orde is. In het onderwijs oefent de student het correct toepassen van een gegeven techniek, terwijl zij later opgaven krijgt waarbij het allereerst van belang is de juiste techniek te kiezen. Een voorbeeld hiervan is statistische hypothesetoetsing: het onderwijs laat de serie verschillende technieken oefenen op geschikte problemen, maar bij de afsluitende toets krijgt de student problemen voorgeschoteld waarbij zij allereerst de juiste techniek moet kiezen, waarop niet of onvoldoende is geoefend. De impliciete context is veranderd, is een andere manier om dit probleem te kenschesen.

Docent Jensen geeft een college over de mate waarin verschillen in intelligentie erfelijk, dan wel milieubepaald zijn.
Voorafgaand vullen studenten de enquêtevraag in of zij denken dat erfelijkheid, dan wel milieu de grootste bijdrage heeft. In zijn college wijst Jensen erop dat bij rigide sociale structuren, slecht onderwijs, en slechte gezondheidszorg, een sterke milieubijdrage is te verwachten; verbeteren deze omstandigheden, dan zullen nog overblijvende verschillen in intelligentie relatief in hogere mate erfelijk bepaald zijn. Na dit college krijgen de toehoorders dezelfde enquêtevraag weer te beantwoorden. Jensen wil nagaan of zijn betoog de meningen heeft beïnvloed. Welke statistische toets (eventueel meerdere) kan hij op zijn gegevens gebruiken?
1. Fischers exacte-waarschijnlijkheidstoets ja / nee
2. tekentoets ja / nee
3. Cochran-Q toets ja / nee
4. McNemar toets voor significantie van veranderingenja / nee
5. chi-kwadraattoets voor een enkele steekproef ja / nee
(Alternatieven 3 en 4 zijn goed.)

Voor een doorzichtige toetsing is het een eerste vereiste dat de student met dit type toetsvraag al tijdens het onderwijs vertrouwd is geraakt. Hij moet kennis hebben gemaakt met aanwijzingen of criteria voor de keuze van de passende techniek. In het gegeven voorbeeld is het voor de keuze van de juiste techniek van belang te weten wat het meetniveau van de verzamelde gegevens is (ordinaal, nominaal, interval), hoe groot het aantal steekproeven is (een, twee, of meerdere) en of deze steekproeven onafhankelijk van elkaar zijn. Door deze criteria langs te lopen, is de juiste techniek te vinden. Dat kan gebeuren aan de hand van een tabel, of misschien moet de student de betreffende beslissingsstappen zo goed beheersen dat de keuze zonder een dergelijke tabel is te maken. Om achteraf enig inzicht te verkrijgen in de overwegingen van de student, vraag dan naar deze gegevens, zonder met deze vraag de student extra aanwijzingen te geven.

Het meetniveau van de enquêteresultaten is

  1. Nominaal
  2. Ordinaal
  3. Interval

Het aantal steekproeven bedraagt

  1. Een
  2. Twee

Zijn er twee steekproeven, zijn deze dan

  1. Afhankelijk van elkaar?
  2. Onafhankelijk van elkaar?

Deze vraagmogelijkheid is in veel vakken te gebruiken. Ik geef een paar voorbeelden, in algemene termen geformuleerd:



De vraagmogelijkheden bij dit soort keuzeproblemen bieden een aantal interessante varianten. Het eerder gegeven voorbeeld is opmerkelijk op deze punten:

  1. Het gegeven probleem is concreet, heeft een hoge werkelijkheidswaarde, ook al is het verbaal beschreven.
  2. De keuze-alternatieven zijn expliciet aangegeven.
  3. Alleen de keuze is gevraagd, niet de verdere berekening.


Bij dit soort vraagstelling is de verleiding aanwezig problemen op te geven in abstracte vorm.

AFRADER

Wanneer nominale data van twee afhankelijke steekproeven beschikbaar zijn, zijn voor toetsing van de nulhypothese dat de gemiddelden niet van elkaar verschillen te gebruiken:
1. Fischers exacte-waarschijnlijkheidstoets ja / nee
2. de tekentoets ja / nee
3. Cochran-Q-toets ja / nee
4. McNemar-toets voor significantie van veranderingen ja / nee

Merk op dat de abstracte vorm precies die informatie weggeeft die nodig is om de juiste keuze te kunnen maken. Zo'n vraag kan op het gepaste moment didactisch nuttig zijn (leren omgaan met een gegeven tabel), maar heeft weinig of niets te maken met het vermogen van de student om bij een bepaalde set gegevens uit een gegeven onderzoek de geschikte statische toets te vinden.

Alleen de keuze is gevraagd, en dat ligt soms niet al te zeer voor de hand, vooral niet wanneer het grootste deel van de onderwijstijd juist is gestoken in de rekenkundige bewerkingen die voor het uitvoeren van een gegeven statistische toets nodig zijn. Maar wanneer het belangrijker is dat de student de juiste toets weet te kiezen, is het wenselijk daar ook in de toetsvragen (en in het onderwijs) de nadruk op te leggen. Het is immers mogelijk om alleen de keuze te vragen, zonder verdere rekenkundige uitwerking. De omgekeerde mogelijkheid is ook uit te buiten: alleen berekening vragen, geen keuze. Er zijn nog meer mogelijkheden om een deel van de oplossing van een complexe opgave te vragen, en dat is met name van belang voor wie bij voorkeur van aanvul- of keuzevragen gebruik wil maken:


In het algemeen valt te overwegen om uit en bekend oplossingsalgoritme (zie 5.4) afzonderlijke stappen te isoleren voor afzonderlijke toetsvragen die kort en snel te beantwoorden zijn.

Het derde punt: meerkeuze of niet. Vaak zullen meerkeuzevragen goed te gebruiken zijn, omdat het aantal alternatieve antwoordmogelijkheden maar klein is en de student heel goed weet welke die mogelijkheden zijn. Daarmee is tevens bepaald wanneer meerkeuzevragen informatie 'weggeven': wanneer de geboden alternatieven er slechts enkele uit een veel groter in aanmerking komend aantal zijn of wanneer het niet vanzelfsprekend is dat studenten de alternatieve mogelijkheden op zich ook goed kennen. In die gevallen zijn aanvulvragen beter te gebruiken.

De overige vraagmogelijkheden hebben betrekking op wat in hoofdstuk 4 al uitgebreid besproken is:


Voor gemakkelijk te verwarren begrippen liggen de toetsingsmogelijkheden in lijn met die welke gegeven zijn in 4.3, 4.4 en 4.5. Daar valt aan toe te voegen dat bij te verwarren begrippen het gebruik van keuzevragen vaak op vanzelfsprekende wijze mogelijk is, door als alternatieven de begrippen waarmee verward kan worden (respectievelijk de voorbeelden van die begrippen) op te nemen. Het spreekt bijna vanzelf dergelijke opgaven alleen in een toets te gebruiken wanneer het onderscheiden van deze gemakkelijk te verwarren begrippen in het onderwijs is behandeld.

'Bijna' vanzelfsprekend, want een veel voorkomend misbruik van de meerkeuzevraag is nu juist het vragen van onderscheidingen die in het onderwijs niet behandeld zijn en die evenmin in de onderwijsdoelen thuishoren. De moeilijkheid om goede 'afleiders' voor meerkeuzevragen te bedenken, leidt nogal eens tot vondsten die onbedoeld van de vraag een onderscheidingsvraag maken: de student moet het beste of het juiste antwoord vinden door alle geboden alternatieven te bestuderen en uit de onderlinge vergelijking zijn keuze te bepalen. Ook bij vragen waarbij de docent van de 'goede' student verwacht dat deze zonder omwegen het juiste alternatief weet te kiezen, kan zich dit zelfde probleem voordoen omdat maar zelden een alternatief in absolute zin juist of onjuist zal zijn.

De student moet gemakkelijk te verwarren begrippen dus leren onderscheiden. Dat kan soms louter op basis van vergelijkende waarneming: in dat geval zullen toetsopgaven ook waarnemingsopgaven moeten zijn (concrete objecten, foto's, dia's, film, geluid e.d. gebruiken). Het verschil tussen waarneembare begrippen zal doorgaans ook verbaal te beschrijven zijn en zo'n verbale beschrijving kan voor de student betekenis krijgen wanneer deze gekoppeld is aan vergelijkende waarneming. In die gevallen is het mogelijk toetsvragen te baseren op de verbale beschrijving van het onderscheid, maar het risico is daarbij dat zo'n vraag nogal op een abstract niveau zit (geen voorbeelden, maar met die ene verbale beschrijving). Wanneer het onderscheid is aan te geven in termen van kritische kenmerken, tilt dat het onderscheid naar een meer formeel niveau. Toetsvragen zijn dan gemakkelijker te construeren, ook al is het abstracte vragen naar onderscheidende kenmerken niet aan te raden (zie ook 4.6).

Kijk voor gedetailleerde vraagmogelijkheden in 4.3, 4.4 en 4.5 en naar het laatst gegeven rijtje mogelijkheden, voor problemen van juiste keuze van instrumenten. Juist omdat het om een relatie tussen gemakkelijk te verwarren begrippen gaat, is ook de enkelvoudige vraag om een voorbeeld te benoemen impliciet een vraag naar het onderscheiden van verwarbare begrippen; de meerkeuzevraag ligt dan wel voor de hand, maar de gewone aanvulvraag kan het ook prima doen. Hetzelfde geldt voor het vragen van een nieuw voorbeeld bij een van de verwarbare begrippen.

Tot slot twee opmerkingen. Vergeet niet dat er ook begrippen zijn die wezenlijk aanleiding geven tot verwarring, omdat ze niet objectief zuiver van elkaar te onderscheiden zijn. Wie probeert om onderscheidingsregels op te stellen voor dergelijke begrippen is waarschijnlijk op de verkeerde manier met de stof bezig. Veel van de natuurlijke categorieën, die toch bij uitstek het voorwerp van wetenschappelijk onderzoek zijn, hebben geen duidelijk ten opzichte van elkaar afgebakende grenzen, en in die gevallen is het beter de nadruk te leggen op de meer (proto)typische voorbeelden, en hoe die van elkaar te onderscheiden zijn.

De tweede opmerking is in zekere zin het omgekeerde van de opmerking hiervoor: er zijn ook begrippen die in het geheel niet moeilijk van elkaar te onderscheiden zijn. Toch kan het van belang zijn dat de student zich van de verschillen bewust is en het onderscheid ook expliciet (en niet als vanzelfsprekend) kan maken.


5.3 Classificaties


Het gaat hier om determineren en om het stellen van diagnoses, om meteen maar de waarschijnlijk lastigste vaardigheden te noemen. Relevante theorie is bijvoorbeeld te vinden bij Anderson (1996), maar er is veel meer empirisch onderzoek dat bijvoorbeeld direct gericht is op het stellen van diagnoses door artsen en specialisten, en daarbinnen is er ondertussen weer veel werk gedaan over het stellen van diagnoses in beoordelingssituaties. Ik ben niet echt goed thuis in de ACT-theorie van Anderson, en vermoed dat deze theorie ondertussen sterk beïnvloed zal zijn door modellen van parallel distributed learning. De theorie is van belang voor de ontwerper van toetsvragen, omdat de theorie het mogelijk maakt de moeilijkheid van opgaven op dit terrein beter in te schatten. Eenvoudig lijkende opgaven kunnen werkelijk beestachtig moeilijk zijn, de ontwerper moet zichzelf hier maar liever niet voor de malle houden.


Een aparte paragraaf is gewijd aan een apart onderwerp: classificaties. Een classificatie is een ordening van de verschijnselen zoals bestudeerd in een bepaalde tak van wetenschap. Een aantal voorbeelden: Mendelejevs periodiek systeem van scheikundige elementen; de taxonomie voor planten, respectievelijk dieren, in de biologie; typologieën zoals in de persoonlijkheidsleer: min of meer logische indelingen zoals in de rechtsgeleerdheid; en classificaties zoals in de geneeskunde. Een classificatie is meestal een categorische ordening (biologische taxonomieën); de verschillende categorieën overlappen elkaar niet en ieder verschijnsel of object hoort in een en niet meer dan een categorie thuis. Wanneer de categorieën elkaar overlappen, er veel grensgevallen zijn en het lidmaatschap van een categorie bepaald is door het in meerdere of mindere mate hebben van bepaalde eigenschappen, spreekt men in plaats van een classificatie veelal over een typologie.

Ik heb het onderwerp classificaties een 'apart' onderwerp genoemd. De reden is deze: bij classificaties zijn geen toetsvragen te schrijven die specifiek zijn voor classificaties. Omdat classificaties echter een heel geprononceerde plaats in de leerstof kunnen hebben, wil ik er toch een bespreking aan wijden, ongeveer op de wijze waarop in hoofdstuk 3 over definities is gesproken. Deze uiteenzetting moet de docent voldoende inzicht verschaffen in de aard van een classificatie zoals behandeld in de eigen leerstof, om een juiste keuze te kunnen doen met betrekking tot de aard van wat in dit geval op relevante wijze over deze classificatie valt te vragen. Waaruit valt er te kiezen? Een opsomming van de meer voor de hand liggende mogelijkheden is de volgende.

  1. reproduceren van de classificatie (biologie: de taxonomie 'klasse orde familie soort species');
  2. aangeven op welk principe (welke principes) een classificatie is gebaseerd;
  3. aangeven waarin een bepaalde categorie in de classificatie zich onderscheidt van andere categorieën (waarin onderscheiden zoogdieren zich van andere klassen van dieren);
  4. aangeven waarin twee categorieën zich van elkaar onderscheiden, respectievelijk waarin zij overeenkomen;
  5. determineren van verschijnselen of objecten;
  6. aangeven op grond van welke overwegingen een verschijnsel of object is gedetermineerd.


Het is niet zinvol deze vraagmogelijkheden hier tot in detail uit te werken, zie daarvoor andere paragrafen in dit boek. Vraagmogelijkheden 1. en 2. behelzen het terugvragen van informatie (zie hoofdstuk 6, vragen over tekst), 3. en 4. verwijzen naar wat in 5.2 over onderscheiden is gezegd, terwijl 5. en 6. ofwel een vorm van eenvoudig benoemen betreffen (hoofdstuk 4), ofwel een stappenvolgorde of algoritme, en paragraaf 5.4 behandelt dat.

Classificaties zijn er in soorten, en je zou dan ook een classificatie van classificaties kunnen opstellen. Hoewel dat niet noodzakelijk tot een paradox hoeft te leiden, geef ik er de voorkeur aan enkele vormen van classificatie op een meer informele wijze te bespreken. Eenvoudige classificaties zijn gebaseerd op een logische ordening of een stipulatieve ordening (bij afspraak). Voorbeeld: temperaturen boven, respectievelijk bene den nul graden Celsius. Deze temperatuurindeling heeft een zeker aantrekkelijkheid vanwege de eenvoud van het gekozen principe: het vriespunt van een voor de mens zo belangrijke stof als water, maar het blijft een tamelijk willekeurige indeling. In de geneeskunde komen dergelijke classificaties wel voor, bij administratieve of wettelijke normen. In de rechtswetenschap is er een behoefte aan eenduidige normen, ook waar die niet op natuurlijke wijze bij de betreffende verschijnselen of objecten passen; het vak kent dan ook veel indelingen die bij afspraak (bij wet, via jurisprudentie, in de dogmatiek) zijn vastgelegd. De zwakte van classificaties op deze basis, bij afspraak, is dat de classificatie geen of vrijwel geen theoretische betekenis heeft, of met een anglicisme aangeduid: geen systemische betekenis heeft. De classificatie is gericht op en heel direct en praktisch doel en heeft daarbuiten geen nut. In het onderwijs is het dan ook niet raadzaam om aan deze 'kunstmatige' classificaties veel aandacht te besteden. Inleidingen in de rechtswetenschap kenmerken zich nogal eens door een overmaat van juridisch jargon dat op deze wijze is ingedeeld. Bijvoorbeeld: 'Het staats-, administratief en privaatrecht bevatten tal van regels, hoe de mensen zich in de maatschappij horen te gedragen. Deze rechtsnormen kan men onderscheiden in verplichtende en veroorlovende normen; verplichtende normen weer in normen die gebieden iets te doen, en normen die, omgekeerd, een bepaald handelen verbieden. De overgangen zijn 'vloeiend' (Enschedé, 'Strafrecht en strafvordering', in: Bakels, 1971). Of het van belang is dat studenten deze terminologie leren hanteren, zal vooral moeten afhangen van het feit of de terminologie betekenis heeft boven wat zij zelf al uitdrukt.

Classificaties worden pas echt interessant wanneer de variabele of variabelen op grond waarvan de indeling gebeurt, samengaan met andere belangrijke variabelen. Verdeel je de mensheid in vrouwen en mannen op grond van primaire geslachtskenmerken, dan is de mensheid ook op een breed scala van andere kenmerken langs dezelfde lijn verdeeld. Of anders gezegd: de informatie om tot de indeling te komen, maakt ook gevolgtrekkingen mogelijk over kenmerken die niet zijn gegeven, Hempel (1952, blz 53): 'De rationele kern van het onderscheid tussen natuurlijke en kunstmatige classificaties zit in de overweging dat bij de zogenaamde natuurlijke classificaties de bepaalde kenmerken meestal geassocieerd zijn met andere kenmerken waarvan ze overigens logisch onafhankelijk zijn. (...) taxonomische categorieën als soort, species, etc., zoals gebruikt in de biologie, bepalen klassen waarvoor geldt dat organismen diverse biologische kenmerken met elkaar gemeen hebben anders dan die welke de klasse in kwestie definiëren; vaak geven de zo bepaalde groeperingen ook relaties weer die de phylogenetische oorsprong betreffen.' De biologische taxonomie heeft dan ook theoretische of systemische betekenis, gaat veel verder dan het louter op beschrijvende kenmerken indelen van de verschijnselen. In de geneeskunde kunnen we classificaties tegenkomen die gebaseerd zijn op prognose (bijv. leukemie en multiple sclerose), op behandelingsaanpak (bijv. astma, artritis) of op beschrijvende kenmerken (bijvoorbeeld syndromen, vele huidziekten, de meeste hartziekten) (Murphy, 1976, blz. 104). 'Binnen de medische taxonomie is de diagnose het brandpunt van het denken bij de behandeling van de patiënt; terug naar pathogenese en etiologie, voorwaarts naar prognose en behandeling. Zodoende verschaffen diagnostische categorieën de locaties waar clinici de waarnemingen uit hun klinische ervaring opslaan, en bepaalt de diagnostische taxonomie de patronen waarin clinici waarnemen, denken, zich zaken herinneren, en handelen.' (Mezzich & Solomon, 1980, blz. 2).

De rijkste classificaties zijn die welke zijn gebaseerd op essentiële kenmerken. Hecht niet te veel betekenis aan het woordje 'essentieel', dat leidt tot filosofische problemen. Denk aan het periodiek systeem van Mendelejev, dat gebaseerd is op aantallen protonen in de atoomkern en op de daarmee corresponderende aantallen elektronen. In de geneeskunde is te denken aan classificatie gebaseerd op het achterliggende 'mechanisme' van de ziekte (bijv. tuberculose, de bloedziekten). Zo'n classificatie is het brute beschrijvende niveau overstegen en is veeleer gelijk aan een wetenschappelijke theorie of model.

Het ordenend beschrijven van de verschijnselen is veelal een eerste stap op de lange weg naar een werkbare theorie (dat is een vruchtbare theorie). Geen wonder dat een afzonderlijke hulpwetenschap aan het ontstaan is, gericht op methoden en technieken voor het ordenen van verschijnselen (zie de aanbevolen literatuur aan het eind van dit hoofdstuk).
Classificaties hebben in veel disciplines een belangrijke plaats. Desondanks zijn er geen vraagmogelijkheden die specifiek zijn voor classificaties. Dat betekent dat de docent zich moet afvragen op welke wijze de student met een bepaalde classificatie moet weten om te gaan, en dat al naar gelang het daarop gevonden antwoord de vraagmogelijkheden in een ander deel van dit boek te vinden zijn. Voor (medische) diagnostiek bijvoorbeeld zal hoofdstuk 7 (problemen stellen) in zijn geheel van belang zijn.


5.4 Stappenschema's, algoritmen, routines, procedures


Het prototype is hier de methode voor aftrekken, optellen, vermenigvuldigen in het rekenonderwijs in de basisschool. Hoe eenvoudig deze methoden ook lijken voor de wat oudere leraar en hoger opgeleide ouders, ze blijken verdraaid moeilijk te leren, er zijn verschillen van inzicht over de mate waarin kinderen deze methoden in de vingers moeten zien te krijgen, en er is grote maatschappelijke zorg over het succes van het basisonderwijs in het bijbrengen van de nodige vaardigheden. Bij de Periodieke Peiling van het Onderwijs in Nederland PPON 2004 (Janssen, Van der Schoot en Hemker 2005 pdf) blijken Nederlandse basisscholieren deze vaardigheden volstrekt onvoldoende te beheersen, soms tussenvormen van algoritmes te gebruiken (het zogeheten kolomrekenen), of zelfs vaak ten onrechte de opgaven uit hun hoofd te doen en dus meestal fout te beantwoorden (Van Putten, bijdrage p. 125-131 in de vermelde bron pdf). Op een speerpunt van het onderwijs gaan er een paar dingen niet zoals het zou moeten, en omdat het gaat om een vak dat bestaat uit vooral veel opgaven maken, is hier absoluut aan de orde of de rekenopgaven wel goed zijn ontworpen voor moment en doel waarop ze worden ingezet. Omdat zeker na de invoering van de euro alle rekenmethoden op Realistisch Rekenen zijn gebaseerd (Wiskobas is een voorloper), kan de stroom publicaties uit het Freudenthal Instituut duidelijk maken wat de mogelijke knelpunten zijn. Zeker is een knelpunt de opvatting bij voorstanders van Realistisch Rekenen dat basale rekenvaardigheid, vaak geringschattend cijferen genoemd, in deze tijd van rekenmachientjes en internet minder belangrijk is. Dat is een interessant punt, omdat het scherp stelt tot welk niveau van beheersing deze basale rekenvaardigheden zouden moeten gaan, en dat is een belangrijk gegeven voor de ontwerper van toetsvragen (oefenvragen).

Ondertussen is met enige regelmaat in de dagbladen te lezen dat het middelbaar en zelfs het hoger onderwijs eerst de tekorten in basale rekenvaardigheden moeten wegwerken voordat het onderwijs in wiskunde kan beginnen: Nederland heeft een probleem met rekenvaardigheden die kennelijk als ouderwets en overbodig worden ervaren, maar tegelijk wel een voorwaarde zijn voor het kunnen volgen van onderwijs in wiskunde. Het rekenonderwijs staat niet alleen in deze problematiek, het verschijnsel grijpt breed om zich heen in het voortgezet en middelbaar onderwijs dat steeds meer gericht is op competenties waarin het onderscheid vervaagt tussen het opbouwen van inhoudelijke expertise, en handigheid in communicatie. Dat is mogelijk precies het onderscheid tussen het leren beheersen van algoritmen en procedures tot grote hoogten en uiteindelijk goeddeels geautomatiseerd, en het handig leren omgaan met vage eisen die op communicatief niveau worden gesteld en meer tot de persoolijkheidspsychologie dan tot de onderwijsdoelen horen. Hier is niet gezegd dat Realistisch Rekenen op zich de oorzaak van de gesignaleerde problemen in basale rekenvaardigheden is (zie de opmerkingen hierbeneden bij Salvin en lake (2008) gemaakt); het is in beginsel mogelijk om tal van oorzaken tegen te gaan binnen de methode van realistsich rekenen—denk aan tijd besteed aan rekenen, en daarbinnen aan basale vaardigheden—of met op zich eenvoudige aanpassingen zoals minder overdadig zijn met contextsommen. Er is een scala van omstandigheden die een rol spelen, en dus ook voor het ontwerp van opgaven van belang zijn.


Robert E. Slavin and Cynthia Lake (2008). Effective programs in elementary mathematics: A best-evidence synthesis. Review of Eduational Research, 78, 427-515. pdf [retrieved 11-2008]

M. Lampert (1986). Knowing, doing, and teaching multiplication. Cognition and Instruction, 3, 305-399. pdf of report


[19 maart 2007] Procedures, in tal van varianten, komen in alle vakken voor, maar onder deze vakken is er een waar die procedures wel heel gevoelig liggen, en tot op ongekende hoogten van vernuft en perfectie zijn doorontwikkeld: de wiskunde. Casus uit de wiskunde zijn om die reden geknipt om de mogelijkheden en onmogelijkheden van toetsvragen met procedures te onderzoeken. Ik stel mij voor, maar dat is een zaak die zelf juist ook in deze paragraaf aan de orde hoort te zijn, dat de lessen uit wiskundige casuistiek eenvoudig zijn over te dragen naar wat er in andere vakken aan procedures aan de orde is in onderwijs en beoordeling. Vooruitlopend op de grondige herziening van deze paragraaf, volgt hier een korte serie voorbeelden, met korte commentaar, als smaakmaker zeg maar. Probeer een zinnig antwoord te geven, voordat u de commentaar verslindt.


33
  8
__ -
    ?

De procedure voor aftrekken is ingewikkeld, met lenen als dat nodig is. Typische fout bij dit type opgave is dat de leerling de 3 van de 8 aftrekt, want dat is een eerder al geleerde procedure voor aftrekken van getallen onder de tien. Ofwel: verschillende procedures buitelen bij dit eenvoudige voorbeeld dus al vrolijk over elkaar heen. Laat de leerling haar gegeven antwoord uitleggen, zodat de persoonlijke ratio van het gegeven antwoord duidelijk is. Met andere woorden: stop de reflex om '35' als 'fout geantwoord' af te straffen. En zie: meteen staat de zin van toetsen zelf ter discussie: als de toets losraakt van het leren zelf, gaat hier iets wringen, niet?


De veerboot vervoert 33 auto's en 8 chauffeurs. Wat is de leeftijd van de kapitein?

Bovenstaand type vraag is de laatste decennia vaak gebruikt in wetenschappelijk onderzoek in de rekenklas. Steevast blijkt dat veel leerlingen die leeftijd inderdaad weten te berekenen. Waar onderwijs al niet toe in staat is. In dit geval is de les, althans volgens sommige onderzoekers, dat het rekenonderwijs voor een deel van de leerlingen is ontspoord en alleen nog bestaat uit gedachtenloos iets doen met getallen. Een vriendelijker interpretatie is dat leerlingen alleen opgaven kennen die altijd een berekenbaar antwoord hebben, en dan is deze vraag een strikvraag die ze in verwarring brengt, maar ook dan is het onderwijs tekortgeschoten door zijn eenzijdigheid. Voor documentatie zie de pagina matheducation.htm. De aansporing is: zorg ervoor dat geoefende procedures ook zijn begrepen. Voor het ontwerp van oefen- en toetsvragen is de les: ze mogen niet uitnodigen tot gedachtenloos rekenen, en soms zullen ze moeten dwingen tot scherp nadenken om het gevraagde zo te vertalen dat het gevraagde antwoord valt te berekenen.


33 appels
  8 peren
__________ -
    ?

Kijk, hier komt de aap uit de mouw. Wat is dat eigenlijk, '33 min 8'? Op de keeper beschouwd, hoort daar een toelichting bij: ik heb een verzameling van 33 (dingen, etc.), waar ik 8 (dingen, etc) afhaal. Dan zijn '33 appels' en '8 peren' verschillende verzamelingen, die niet van elkaar zijn af te trekken. Met andere woorden: '33 - 8' laat heel veel impliciet, en laat heel veel ruimte voor interpretaties die afwijken van de specifieke interpretatie die de leraar voor ogen stond bij het stellen van de vraag.


33 a
  8
____ -
    ?

Dit lijkt wel algebra, maar hoeft het niet te zijn. Als 'a' een symbool is dat staat voor iets anders, zou dat ook 'a=appel' kunnen zijn? Kennelijk bedoelt de vragensteller dat niet, want wat is 33 appels min 8? Is twaalf meer dan een potlood? Dit is een verwarrende wereld voor de leerling. Leerlingen die het leuk vinden met procedures te stoeien, zullen hier wel goed mee weg komen. Leerlingen die wat filosofischer zijn ingesteld, en vragen hebben waar geen antwoord op komt, zouden wel eens aardig in de knoop kunnen raken. Het risico bestaat dat nogal wat leerlingen aan geen van beide toekomen, in verwarring hun eigen procedurele regels bedenken, en daar zo lang mogelijk aan vast houden.


33 x
  8 y
____ -
    ?

Het gekke is dat bovenstaande opgave, zonder dat u de context kent, van alles kan zijn: degelijke algebra, hoewel niet verder te vereenvoudigen, of een onzinnige appels-en-peren vergelijking, of een zinnige prijs-van-appels-en-peren vergelijking (de peren waren ten onrechte op de kassa aangeslagen, of zoiets).


foto 1
foto 2
______ +
Saddam Hussein beschikt over massavernietigingswapens.

Had Colin Powell zijn wiskunde goed voor elkaar, toen hij zijn verhaal over Saddam's massavernietigingswapens aan de hand van satellietfoto's probeerde te slijten aan de Verenigde Naties? Zien we hier een variant op de 'De leeftijd van de kapitein' vraag? Soms hangt iemands reputatie af van het juiste antwoord op zo'n vraag. En het leven van honderdduizenden anderen. Goed onderwijs, met goede vragen, dat gaat ergens over.


[januari 2007] Dit is een riskante categorie, het risico hangt af van de manier waarop studenten zich het algoritme eigen hebben gemaakt. Is dat zonder begrip gebeurd, dan is het een kunstje dat best heel goed kan zijn geoefend, maar waarin zo'n student dan toch merkwaardige fouten kan maken. Het is natuurlijk de verantwoordelijkheid van de docent om een didactiek te hanteren die dit type bedrijfsongeval voorkomt. Ik zal op dit thema nog enig onderzoek moeten doen, for the time being is enige inspiratie te putten uit Van Hiele's niveautheorie voor het reken/wiskundeonderwijs: een algoritme is als het ware een samenvatting op een hoger niveau van de stof, veronderstelt goede verwerking van de onderliggende stof, en mogelijk ook zoiets als het door de student zelf opnieuw ontdekken van het betreffende algoritme zelf. Voor de genoemde literatuur zie matheducation.htm.


ERGERLIJKE KINDERMISHANDELING

6/11 x 15/16 x 22/25 = ....

3/8 : 5/6

Leen 1961, p. 189, citeert P. Wijdenes in Valcoogh, 15 januari 1953. De opgaven zijn uit een rekenboek voor de lagere school, begin 4e klas. Wijdenes telt in dat boekje 3500 van dit soort opgaven, wat hij ergerlijke kindermishandeling noemt.


Leren werken met breuken is belangrijk in het basisonderwijs. Maar er is een belangrijk onderscheid tussen de vaardigheid op zich, en het foutloos maken van gekunsteld ingewikkelde sommen. De ontwerper kan opgaven over breuken net zo moeilijk maken als hij wil. "Wijdenes wil de leerstof beperken tot het begrip gewone breuk: 1/2, 1/3, 1/4, 1/5, 1/6, 1/10, en verder nog 2/3, 3/4, 4/5. Voorts optellen en aftrekken." En dat was ook de lijn van de inspectie in die dagen. Mechanisch oefenen van bewerkingen met breuken holt voorbij aan de hoogste prioriteit: een goed begrip van wat breuken zijn. Als het onderwijs op dit punt helemaal op orde is, kunnen toetsen het feest bederven door toch nog ergerlijke ingewikkeldheden te vragen. Kijk, dit is dus een heel andere manier om te onderscheiden tussen inzicht en mechanische kennis. Onthoud dit voorbeeld. Voor een briljante uitleg van het punt zie Carroll (1987), ook besproken in hoofdstuk 1.

Dit voorbeeld illustreert een fundamenteel probleem bij het leren - onderwijzen - van nieuwe procedures: leerlingen zullen proberen de nieuwe procedure, in dit geval het vergelijken van decimale getallen, voor zichzelf begrijpelijk te maken door inpassing in al bekende procedures. Zoiets als het leren van een nieuwe procedure op zich, los van alle al aanwezige kennis, bestaat in de werkelijke wereld niet. Nesher (1986) laat zien dat er zodoende twee belangrijke typen misvattingen bij deze opgave zijn. De eerste is dat de leerling het getal met het grootste aantal cijfers na de decimaal kiest, dus zowel 0,234 als 0,675 zijn groter dan 0,4; Nesher vond dat eenderde van de leerlingen nog na afloop van het onderwijs in decimalen die misvatting hanteerde, een percentage dat pas in de loop van jaren afneemt. De tweede mogelijke verkeerde inpassing is de redenering dat duizendsten kleiner zijn dan tienden, en 0,4 dus groter is dan zowel 0,234 als 0,675, ook door ongeveer eenderde van de leerlingen gepleegd. Een of twee jaar later blijkt nog steeds eenvijfde van de leerlingen die tweede misvatting te hanteren.

Wat dit geval zo interessant maakt is dat het eenzelfde fenomeen is als wat zich bij het onderwijs in de natuurkunde voordoet, dat nieuwe wetten behandelt waarvoor de leerling dus niet kan weten hoe zij in begrijpelijke termen zijn te duiden. Over natuurkunde zie vooral de volgende paragraaf. De overweldigende betekenis van het op zo grote schaal voorkomen van dergelijke misvattingen is dat het niet volstaat de leerling voor te doen hoe het moet of hoe het werkt, maar dat de leraar ervoor moet zorgen dat de leerling de nieuwe kennis goed opneemt in al bestaande kennis. En dan komt een en ander natuurlijk bij het ontwerpen van vragen over de stof opnieuw aan de orde. De hoofdvraag is dan: is die niuewe procedurele kennis goed opgenomen in de al bestaande kennis, of zijn er kortsluitingen ontstaan? De vragen moet dan de gelegenheid bieden om belangrijke misvattingen tot uiting te laten komen. Merk op dat de vragen in bovenstaand voorbeeld daartoe makkelijk tekort kunnen schieten, omdat ze om de verkeerde redenen goed kunnen zijn. Reden te meer om ook uitleg te vragen, zeker bij gemaakte fouten.


Ieder vak kent wel een aantal onmisbare technieken, methoden, rekenprocedures en dergelijke. Perfecte beheersing van deze routines maakt dat zij foutloos verlopen ook zonder bewust aan het uitvoeren van de routine te denken. Dat is bijvoorbeeld het geval met de vanzelfsprekende vaardigheid de moedertaal grammaticaal correct te spreken. Deze vaardigheid is niet bewust aangeleerd en slechts weinig mensen die hun grammatica correct hanteren zouden de grammaticale regels ook kunnen verwoorden. Een ander voorbeeld van automatisch aflopende algoritmen zijn de eenvoudige rekenkundige bewerkingen. Deze zijn wel expliciet geoefend en wie ze gebruikt is eveneens in staat uit te leggen wat hij doet en waarom. Dat de werkelijkheid zo simpel niet is, bewijst de analyse die Van Putten (2005) heeft gemaakt van methoden die leerlingen gebruiken voor vermenigvuldigen en delen, in de Periodiek Onderwijspeilingen PPON 1997 en 2004 (zie ook realistisch_ kolomrekenen.htm). Autorijden is eveneens een 'routine' waarbij de ervaren bestuurder geen expliciete aandacht meer hoeft te geven aan de vraag welke handelingen hij wanneer moet verrichten, en hoe hij dat moet doen. Het aanpakken van wetenschappelijke problemen is voor de onderzoeker meestal zo vanzelfsprekend dat het moeilijk valt om alle ondernomen 'denkstappen' aan een ander duidelijk te maken, een verschijnsel dat sterker is waar sommige stappenreeksen in een keer worden gemaakt op basis van ervaring, een ervaring die studenten niet hebben. Naast routines van deze gedetailleerde (denk)-handelingen, zijn er ook stappenschema's met een globaal karakter, die meer een geheugensteuntje zijn bij het uitvoeren van complexe opdrachten zoals het oplossen van problemen, plannen van een scriptie of opzetten en uitvoeren van een onderzoek (zie hoofdstuk 7).


Een vak dat in zekere zin een verzameling van algoritmen is, waar onderzoekers gespitst zijn op het ontwikkelen van steeds betere algoritmen, is de wiskunde. Voorbeelden te over: van het eenvoudige optellen of het maken van een staartdeling tot het ontwerpen van een computerprogramma's, terwijl er ook specialiteiten zijn zoals het leveren van het bewijs dat een bepaalde klasse van problemen geen algoritme kent, dat voor ieder probleem een oplossing oplevert. Een concreet voorbeeld is het oplossen van een vergelijking in een onbekende.

Los op: 8x + 3 = 3x + 18
Beschrijf het gebruikte algoritme.

Antwoord. Gevraagd de waarde van x, of: x = ...

stap 1:

stap 2:

stap 3:

Zo'n algoritme is op verschillende manieren te formuleren of in een schema te zetten. Doorgaans is de stappenvolgorde kritisch, een andere volgorde zou een ander (onjuist) resultaat opleveren. In het gegeven voorbeeld zou het uitvoeren van stap 3 voor stap 2 tot problemen leiden; stap 1 en 2 zijn onderling wel verwisselbaar.

Het gegeven voorbeeld is een eenvoudig algoritme waarin geen logische beslissingen voorkomen, waarin niet aan specifieke voorwaarden voldaan hoeft te zijn om de volgende stap te kunnen uitvoeren (anders dan dat de voorgaande stap is uitgevoerd). De meeste algoritmen of stappenschema's kennen wel van die logische beslispunten of 'tests', met daaruit resulterende 'loops' naar een eerdere stap of short cuts naar een stap verderop in het algoritme. In het volgende voorbeeld is dat geïllustreerd, en dat is tegelijk een voorbeeld van een meer globaal stappenschema, in tegenstelling tot een specifiek algoritme zoals hierboven gegeven.


Voor het oplossen van een juridische casuspositie kan de student het volgende stappenschema hanteren:

stap 1: breng de casus in kaart
stap 2: geef voorlopige juridische vertaling van feiten in casus
stap 3: selecteer op basis van resultaten van 2 relevante rechtsregels
stap 4: bepaal op basis van resultaat van 3 voorwaarden waaronder de vertaling in stap 2 steek houdt
stap 5: is aan voorwaarden uit 4 niet voldaan in 1, dan terug naar stap 2 (een 'test' stap)
stap 6: pas regels uit 3 toe op casus en bepaal gevolg(en)
stap 7: zijn gevolgen niet aanvaardbaar, dan terug naar stap 2 ('test' stap)
stap 8: formuleer uitspraak
[Een heel vrije bewerking van een stappenschema gegeven door Crombag, De Wijkerslooth en Van Tuyll van Serooskerken, 1972].


Naast stappenschema's met een voorgeschreven volgorde zijn er ook handelingsvoorschriften zonder een bepaalde volgorde, maar wel volgens strikte regels. Dat zijn 'technieken.' Een toetsvraag gericht op zo'n techniek is:

Maak een tekening van zes figuren. Plaats ten minste een van de personen op de voorgrond, evenzo ten minste een persoon op de achtergrond, en tenminste een in een tussenpositie. De relatie tussen de figuren moet de regels van het rechtlijnig perspectief weerspiegelen.
[Wilson, in: Bloom, Hastings en Madaus, 1971, blz. 550]


Laten we voor het gemak de term 'algoritme' gebruiken voor het hele scala van handelingsvoorschriften: zowel stappenschema's, technieken en routines, als algoritmen zelf. Het is van enig belang om de vraag te beantwoorden welke rol algoritmen in het onderwijs hebben en speciaal in de eigen discipline. Meestal krijgen algoritmen in het onderwijs een heel duidelijke plaats toegewezen: de studenten krijgen er uitgebreid oefening in. Maar is dat ook voldoende? Aan het gebruik van een algoritme zitten meer kanten dan alleen het kunnen toepassen. Een heel belangrijk punt is wel dat de student in staat moet zijn het algoritme toe te passen wanneer de situatie daar om vraagt. Daarnaast zou het niet zo gek zijn wanneer de student voldoende inzicht zou hebben in de achtergronden van het algoritme om ook in staat te zijn dezelfde principes in ongewone situaties toe te passen (of gewoon in het dagelijks leven, waar ook heel wat problemen op te lossen zijn). Dat vraagt niet alleen een goede routinematige beheersing, maar vooral het bewustzijn van het hoe en waarom van het algoritme.

Daarmee ontstaat een indeling van twee categorieën toetsvragen rond algoritmen: het correct uitvoeren van het algoritme, en bij een opgegeven probleem het juiste algoritme weten te kiezen.

De meest voor de hand liggende vraagmogelijkheden behoeven nauwelijks de verheldering aan de hand van extra voorbeelden:



Omdat algoritmen uiteindelijk bedoeld zijn om bepaalde problemen op het eigen vakgebied tot een oplossing te (helpen) brengen, zullen ze in een eindtoets vaak voorkomen als onderdeel van andere opgaven. Wanneer er bij deze opgaven veel fouten zijn bij de keuze, dan wel de uitvoering van het algoritme, is het efficiënter om uitgebreidere opgaven minder afhankelijk van de kennis van algoritmen te maken, en de laatste afzonderlijk te toetsen.

Stappenschema's spelen vaak een rol bij het gestructureerd aanpakken en oplossen van problemen, zoals ook de bedoeling van het als voorbeeld gegeven stappenschema voor het aanpakken van juridische casus is. Zie verder vooral hoofdstuk 7.


AFRADER

Welke allotrope modificaties kent ge van het element phosphorus? Hoe kunnen deze modificaties direct of indirect in elkaar worden omgezet? In welk opzicht draagt het verschijnsel der allotropie bij het element phosphorus een ander karakter dan bij het element zwavel? [eindexamen 1937 no. A2]
Bij de beantwoording moeten de candidaten zonder twijfel 'inzicht' tonn in dit stukje chemische theorie. Maar de feiten over rhombische en monokline zwavel, gele en rode fosfor, mono- en enantiotropie moeten ze toch 'uit geheugen' opschrijven ... en de theorie eigenlijk óók. Is het wel waar, dat op deze wijze het 'inzicht' van de candidaat getoetst wordt? Als afgerond onderwerp komt 'allortrpie' in de schoolboeken voor en wordt het, na behandeling in de klas, 'geleerd.' [De Miranda, 1955, p. 26]

Het proefschrift van De Miranda (1955) gaat over de worsteling over het onderscheid tussen inzicht en kennis, tussen leren toepassen van wetenschappelijke methoden en het kennen van de vele feiten in het vakgebied, bij de stakeholders van het onderwijs. De feitenkennis wint het overigens vrijwel altijd, op gebrek aan goede gronden. Scheikunde is het vak waaraan hij concrete illustraties ontleent; zijn poging een didactiek te grondvesten is veel breder, en mist nog de kracht die de cognitieve wetenschappen - cognitive science - er een halve eeuw later aan zou hebben geven.


5.5 Wetmatige relaties, modellen of theorieën


De tekst uit 1983 is waarschijnlijk veel te makkelijk, ook wel naief. Deze paragraaf vraagt om een nieuwe onderbouwing, niet in de laatste plaats omdat juist hier zaken van oorzaak en gevolg aan de orde zijn. Dat is begripsmatig en dus ook didactisch lastig, en tegelijk volgens sommigen een hoge prioriteit voor onderwijs (zoals Kuhn, 2005). Een nieuw kader zal ik beginnen op basis van Nancy Cartwright (1983). How the laws of physics lie. Dit is een kennistheoretische analyse van de aard van wetenschappelijke wetten, zowel die op het niveau van de waarneembare verschijnselen, als die op theoretisch niveau. Een belangrijke issue is het onderscheid tussen het louter samengaan van verschijnselen, en dat van oorzakelijke verbanden tussen verschijnselen. Het laat zich raden dat de didactiek van specifieke wetten afhankelijk is van de aard van die wetten, zodat ook het ontwerp van toetsvragen niet om de systematiek van verschillende typen van wetten heen kan. Daar staat tegenover dat er mogelijk veel gemeenschappelijk is aan wetten uit verschillende vakgebieden, verschilllende wetten in hetzelfde vakgebied: Brian Ellis (1965) behandelt de bewegingswetten van Newton buitengewoon grondig, ook als kenmerkend voor de manier waarop dergelijke wetten in wetenschap en toepassing fungeren. Ellis doet dat wetenschapsfilosofisch, niet gericht op didactische problemen, maar daar komen we wel uit. Zijn bijdrage is lastig te vinden, ik zal er de hoofdpunten uit samenvatten voorzover van belang voor de ontwerper van toetsvragen; er is daarnaast naturulijk een zee van wetenschapsfilosofische publicaties over de bewegingswetten van Newton waarin de meeste dooe Ellis behandelde zaken wel terugkomen, ook bij Nancy Cartwright. Overigens is Ronald Giere's (2006) mogelijk een beter passende kapstok voor een ontwerptechnologie van toetsvragen dan die van Nancy Cartwright.


"Thus we have, for example, Watson and Crick's original sheet metal and cardboard model of DNA, Rutherford's solar system model of atoms, the Bohr model of the atom, and the de Sitter model of space-time. There are also equilibrium models in economics and drift models in evolutionary biology. I think it is possible to understand scientific models in a way that usefully encompasses much of this heterogeneity." [mijn nadruk, b.w.]

Giere, 2006, p. 63


Het ontwerpen van toetsvragen rond bijvoorbeeld natuurkundige wetten is niet lastig of problematisch. Het sterk geformaliseerde karakter van deze relaties, het nauwe verband tussen (theoretische) relatie en (concrete) verschijnselen en een lange traditie in het formuleren en gebruiken van vragen dragen daar alle toe bij. Voorbeelden van toetsvragen zijn voor de docenten uit deze vakgebieden zo vanzelfsprekend dat ik ze hier niet nog eens hoef te geven. Ik zal niettemin toch enkele voorbeelden uitwerken, omdat het voor docenten uit in dit opzicht minder bevoorrechte vakgebieden toch aardig is om te zien hoe een wat strakkere formalisering het ontwerpen van toetsvragen makkelijker maakt.

Mag het schrijven van toetsvragen hier dan al min of meer vanzelfsprekend zijn, dan neemt dat toch niet weg dat er wel een risico bestaat dat de vragen die de docent gewoon is te gebruiken een zekere eenzijdigheid hebben, dat bepaalde aspecten van de leerstof onvoldoende of in het geheel niet in de toetsvragen terugkomen. Er zijn ook enkele vraagmogelijkheden, zie 6.3 en 6.4 (analyse en inferentie) en hoofdstuk 7 (bedenken en oplossen van problemen).

Er zitten heel wat aspecten aan een enkele wetmatige relatie (verder wet genoemd). Wetten zijn nogal eens genoemd naar hun 'ontdekker' en/of hebben een speciale benaming zoals 'eerste hoofdwet van de thermodynamica'. De wet is in verbale vorm weer te geven, zoals stellingen in de wiskunde, en in symbolische (meestal een wiskundige) vorm. De meeste wetten betreffen relaties tussen twee of meer theoretische begrippen. De afleiding van de wet is van belang; afleiding uit andere wetten, uit empirische waarnemingen of de historische ontwikkeling. Toepassingen van de wet zijn het meest interessant, ook in het onderwijs, en dat onderwerp vergt een afzonderlijke uitwerking. Dan zijn er de relaties tot andere wetten binnen een en dezelfde theorie en de toepassingen door het combineren met andere wetten. En tenslotte de plaats die de wet binnen de theorie in haar geheel inneemt en hoe zij afhangt van bepaalde veronderstellingen waarop de theorie gebouwd is.

Newton's tweede bewegingswet. De naam geeft de opsteller van de wet de eer die hem toekomt en geeft het karakter van de wet aan. De wet luidt dat de netto kracht die op een lichaam inwerkt proportioneel is aan de massa van het lichaam en aan zijn versnelling, waarbij de richting van de kracht gelijk is aan de richting van de versnelling. De wet relateert aan elkaar: kracht, massa en versnelling (werkend op, resp. van een lichaam), en is zo te verstaan dat de versnelling van het lichaam volgt uit de netto kracht die op het lichaam inwerkt.

De algebraïsche formulering van de wet is

kracht = massa * versnelling, in symbolen: F = ma.

De vergelijking ziet eruit als een algebraïsche, maar dat is niet helemaal correct: verondersteld is dat de grootheden in bij elkaar passende eenheden zijn, bv. de kracht in newtons (N), de massa in kilogrammen (kg), en de versnelling in meters per seconde-kwadraat (m / s2). Bij bewerkingen op de formule F = ma is het verstandig daarbij de eenheden ook 'mee te nemen'.
Voor de afleiding van de wet zie Newton zelf (Principia, volume 1, The motion of bodies) of leid de wet af uit waarnemingen in een laboratoriumexperiment, enz.

Toepassingen komen straks afzonderlijk ter sprake.

Er zijn o.a. verbanden met de eerste en derde bewegingswet, en met Newtons wet van de universele zwaartekracht.

De wet veronderstelt niet dat luchtweerstand te verwaarlozen is, dat is een van de krachten die de netto kracht bepalen. De wet veronderstelt dat het lichaam rechtlijnig beweegt wanneer er geen netto kracht op inwerkt. Newton presenteerde zijn bewegingswetten overigens als 'axiomata of bewegingswetten,' en in het Latijn 'Mutationem motis proportionalem esse vi motrici impressae, et fieri secundum lineam rectam qua vis illa imprimatur.'

Het bovenstaande is geen goede behandeling van natuurkundige wetten. Ik heb in 1983 geen tijd genomen hier meer werk van te maken. Voor de herziening moeten andere naieve natuurkundige opvattingen (of Aristotelische, zie Dijksterhuis 1951) en mental models (Champagne, Gunstone an Klopfer 1985) aan de orde komen, plus het ook door Dijksterhuis aangegeven extreem abstracte karakter van deze wetten. Wat dat laatste betreft gaat zich dan de moeilikheid voordoen dat van deze abstracte hoofdwetten geen concrete experimentele onderzoeken als 'bewijsplaatsen' voorhanden zijn. Op zich klinkt dat misschien verrassend, maar het is in wezen hetzelfde probleem als bij het intelligentie-begrip eerder al oppervlakkig is aangeduid (hoofdstuk 3). Norwood Russell Hanson (1965) brengt chirurgisch nauwkeurig de problemen aan het licht, voor de eerste bewegingswet van Newton, maar daarmee dus ook voor de tweede en derde.


Er zijn talrijke vraagmogelijkheden die betrekking hebben op deze verschillende aspecten, naast de toepassingen; maar dat zijn precies de vraagmogelijkheden in hoofdstuk 4


Met wetmatige relaties zijn verschijnselen te verklaren of te voorspellen. Speciale vormen van voorspellen zijn: het schatten of berekenen van gevraagde onbekende grootheden en het opstellen van hypothesen en/of het ontwerpen van een onderzoek opzet. Een bijzondere vorm van verklaren waar de student nog wel eens mee te maken krijgt: verklaren waarom een onderzoeker een bepaalde onderzoek opzet kiest of een bepaalde handeling verricht. Vat dat niet op als een psychologische vraag over de onderzoeker: bedoeld is dat de student verband legt tussen de acties van de onderzoeker en bekende wetten in dat vak, dat hij kan formuleren wat de werkhypothese van een ander is).

De voor de hand liggende 'toepassingsvragen' zijn nu:

Geef een voorbeeld van toepassing van de tweede bewegingswet van Newton.

Antwoord. Op een lichaam met een massa van 1 kilogram werkt een netto kracht van 1 Newton. De versnelling is dan
a = F / m = 1 N / 1 kg = 1 m / s2.

Het gegeven antwoord is niet meer dan een beschrijving van de wet in haar theoretische termen. Is het de bedoeling dat de student een voorbeeld geeft uit het dagelijks leven in concrete termen, vraag dat dan ook.


Een auto met een massa van 1000 kg verhoogt zijn snelheid in 5 seconden van 15 m/s tot 20 m/s. Welke netto kracht oefent dit uit op de auto?
Hint: Bereken eerst de versnelling, en gebruik dan Newtons tweede bewegingswet.


Het aantal vraagvarianten voor de tweede bewegingswet van Newton is eindeloos, en daar komen dan nog de varianten bij die ontstaan door combinatie met andere wetten (combinaties waarmee de student door uitgebreide oefening ook vertrouwd is geraakt).

Bij deze toetsvragen over wetten is het van belang zicht te houden op de afstemming van het gevraagde op de doelen. Wanneer het uitvoeren van wiskundige bewerkingen in de doelen een ondergeschikte plaats bekleedt, is het zaak de toetsvragen zo te ontwerpen dat wiskundige bewerkingen daarin geen extra moeilijkheidsfactor vormen. Dat heeft ook pragmatische betekenis: wanneer berekeningen tijdrovend zijn en slechts van marginaal belang voor de onderwijsdoelen valt er een hoop toetstijd op betere manier te besteden dan door berekeningen te vragen. Het zijn niet alleen opgaven rond natuurkundige wetten die vatbaar zijn voor rekenkundige 'overkill', dat kan ook maar al te gemakkelijk gebeuren bij de vakken statistiek en methodologie in de sociale wetenschappen. Zoek een goede balans in de toetsvragen en de verschillende al eerder genoemde aspecten: formuleren van het probleem, vertalen van het probleem, keuze van toepasselijke wetten bij het gegeven probleem, wiskundige bewerkingen om de (een) oplossing te verkrijgen. Wanneer het mogelijk is toetsvragen zo te schrijven dat ze op een of twee van deze aspecten zijn toegespitst, dan heeft dat voor de toetsing grote voordelen. Dan komt het niet meer voor dat een grote opgave fout is alleen omdat in de vertaling van het probleem een vergissing is gemaakt.

Varianten op een zelfde opgave ontstaan door in de opgave gegevens op te nemen die niet ter zake zijn, door de probleemformulering concreter dan wel abstracter te maken, waardoor de student meer dan wel minder moeite moet doen om probleem in exacte begrippen te vertalen. Een mogelijkheid tot variëren ligt in het aanbieden van te weinig gegevens, met de opdracht aan de student om zelf te vragen om extra gegevens die nodig zijn (bijv., bij juridische casus, bij medische diagnostiek). Denk ook aan de invloed van impliciete context op de moeilijkheid van de opgaven: tijdens het onderwijs zijn de opgaven nogal direct gekoppeld aan het hoofdstuk, waarmee impliciet gegeven is welke wetten waarschijnlijk toepasbaar zijn. Wanneer in een eindtoets opgaven van hetzelfde soort voorkomen, kunnen die veel moeilijker blijken te zijn omdat die impliciete context dan is weggevallen.

Wat de te gebruiken vraagvormen betreft, zal het duidelijk zijn dat hier bij uitstek open vragen zoals de opstelvraag en de aanvulvraag passen. De meerkeuzevraag is soms bruikbaar, bv. de vraag welke wet toepasbaar is op een gegeven probleemstelling waar de goed geïnformeerde student kiest uit een kleine set van alternatieven. Dan zijn diezelfde alternatieven te gebruiken voor een meerkeuzevraag.
Omdat vragen rond wetten en relaties al snel het karakter van problemen krijgen, is er een soepele overgang van deze paragraaf naar hoofdstuk 7 over het stellen van problemen


5.6 Literatuur


John R. Anderson (1996). ACT: A simple theory of complex cognition. questia American Psychologist, 51, 355-365. (Award address).

H. L. Bakels (Red.). Nederlands recht in kort bestek. Deventer: Kluwer, 1971.

Benjamin S. Bloom, J. Thomas Hastings and George F. Madaus (Eds) (1971). Handbook on formative and summative evaluation of student learning. London: McGraw-Hill.

Nancy Cartwright (1983). How the laws of physics lie. Oxford: Oxford University Press.

Audrey B. Champagne, Richard F. Gunstone and Leopold E. Klopfer (1985). Instructional consequences of students' knowledge about physical phenomena. In Leo H. T. West and A. Leon Lines: Cognitive structure and conceptual change (pp. 61-90). Academic Press.

Hans F. M. Crombag, J. L. de Wijkerslooth en E. H. van Tuyll van Serooskerken (1972). Over het oplossen van casusposities. Groningen: Tjeenk Willink.

Eduard Jan Dijksterhuis (1950). De mechanisering van het wereldbeeld. Amsterdam: Meulenhoff.

Brian Ellis (1965). The Origin and Nature of Newton's Laws of Motion. In R. G. Colodny. Beyond the edge of certainty. Essays in contemporary science and philosophy (pp. 29-68). University Press of America.

Roman Frigg and Stephan Hartmann (2006). Models in science. In Stanford Encyclopedia of Philosophy. html

Ronald N. Giere (2006). Scientific perspectivism. The University of Chicago Press.

Norwood Russell Hanson (1965). Newton's First Law: A Philosopher's Door into Natural Philosophy. In R. G. Colodny. Beyond the edge of certainty. Essays in contemporary science and philosophy (pp.6-28). University Presss of America.

Stephan Hartmann (2005) The World as a Process: Simulations in the Natural and Social Sciences. pdf

Carl G. Hempel (1952/1972). Fundamentals of concept formation in empirical science. London: The University Of Chicago Press, 1972.

Deanna Kuhn (2005). Education for thinking. Harvard University Press.

A. Leen (1961). De ontwikkeling van het rekenonderwijs op de lagere school in de 19e en het begin van de 20ste eeuw. Groningen; Wolters. Proefschrift Vrije Universiteit Amsterdam.

J. E. Mezzick en H. Solomon (1980). Taxonomy and behaviorial science. London, Academic Press.

J. de Miranda (1955). Verkenning van de 'Terra Incognita' tussen practijk en theorie in middelbaar (scheikunde-) onderwijs. Wolters. Proefschrift RU Utrecht.

Marcel J. A. Mirande (1981). Studeren door schematiseren. Utrecht: Het Spectrum, Aula 805.

Margaret Morrison (2002). Models as representational structures. Paper presented in: Nancy Cartwright's Philosophy of Science. An International Workshop, December 16-17, 2002 pdf

E. A. Murphy (1976). The logic of medicine. London: Johns Hopkins University Press.

Catherine Sophian (2007). The origins of mathematical knowledge in childhood. Lawrence Erlbaum.


meer literatuur


Graeme S. Halford and Janie Busby (2007). Acquisition of structured knowledge without instruction: The relational schema induction program. Journal of Experimental Psychology. Learning, memory and Cognition, 33, 586-603.


links


American Translators Association. Translation: Getting it right. pdf



Stuur eens enkele toetsvragen voor commentaar!
Neem vrijblijvend contact op over de mogelijkheden: voor advies en begeleiding bij het ontwerpen van toetsvragen - een kwaliteits-check op uw toetsvragen - voorlichting of een cursus over het ontwerpen van toetsvragen. Vraag waarom het 'toetsen van competenties' een ondeugdelijk concept is.
Deze versie 2006 is in ontwikkeling. Maakt u er gebruik van, dan vraag ik als wederdienst om daar eens iets over terug te melden.


24 april 2012 \ contact ben apenstaartje benwilbrink.nl

Valid HTML 4.01!   http://www.benwilbrink.nl/projecten/06toetsvragen5.htm