Ben Wilbrink. Toetsvragen ontwerpen. 5. Relaties tussen begrippen

Leerstof is altijd meer dan een opsomming van begrippen, het gaat immers vooral om wat al die dingen en verschijnselen onderling verbindt, om hun relaties. Allerlei soorten relaties hebben met elkaar een familiegelijkenis, ze delen wel gelijke kenmerken, maar dat zijn telkens weer andere. De ene relatie is de andere niet. Sommige relaties zijn belangrijk genoeg om als fenomeen een eigen naam te dragen. Andere relaties missen die eigen naam, maar zijn daarom niet minder belangrijk. Die 'anonieme' relaties zijn wat schimmig, omdat ze een eigen benaming missen komen ze meestal niet in de index van het boek voor, en in de bladspiegel van tekst vallen ze niet op zoals vaktermen dat juist wel doen. Daarom is het schematiseren van leerstof zo'n belangrijk hulpmiddel, voor de student, evenals voor de ontwerper van toetsvragen. Een inhoudsoverzicht is ook een schema, zie Figuur 1.

gif/06dToetsvragen4.1.1.jpg

Figuur 1. Variëteit van relaties.

Belangrijke relaties komen in een groot aantal wetten terug, of het zijn de relaties tussen de centrale begrippen van het vak. De ene relatie is daarom belangrijker dan de andere bij het oplossen van opgaven. Ieder vak kent wel een cluster van formules, wetten of kernbetrekkingen, waarmee de meeste problemen zijn aan te pakken. Andere relaties zijn af te leiden uit deze kernbetrekkingen, of vormen basaal materiaal dat nu juist in de kernbetrekkingen is samengevat.

Relaties zijn doorgaans een stap abstracter dan de verbonden begrippen zelf. Voor eenvoudige rekenkundige bewerkingen—relaties—is de eenheid waarin wordt gerekend zo'n verbonden en in dit geval ook funderend begrip (Sophian, 2008). Bij het ontwerpen van toetsvragen is dan ook aandacht nodig voor het niveau van abstractie van de toetsvraag (zie paragraaf 2.6). Hoe abstract sommige relaties ook zijn, meestal is het mogelijk om toetsvragen op een redelijk concreet niveau te stellen. Let bij wetmatigheden in algebraïsche vorm, zoals E = mc² of F = ma, op dat de toetsvragen niet louter de algebra betreffen; algebra is een ander vak, een hulpvak. De onderwijskundige reden voor deze aanbeveling is nog steeds dat beheersen van abstracties op zichzelf, los van hun banden met de wereld, niet zinvol is. Abstracte hulpvakken als wiskunde zijn ook een intellectuele uitdaging op zichzelf, maar moeten aan het eind van de dag toch verschil maken in het omgaan met de wereld. Terwijl de pragmatische kant van deze aanbeveling weer is dat een meer concreet niveau van vraagstelling het mogelijk maakt rond een enkel onderwerp meerdere vraagvormen te ontwerpen die ieder een groot aantal nieuwe vragen mogelijk maken.

Sommige relaties vormen samen een bepaalde structuur. Toetsvragen over de structuur zijn niet wezenlijk anders dan vragen over welk ander onderwerp ook. Afhankelijk van wat van belang is om over de structuur te vragen, is het materiaal uit hoofdstuk 4 of 5, maar vooral ook uit hoofdstuk 6 (tekst) of 7 (aanpakken van problemen) aan de orde. Het is mij niet gebleken dat vragen over structuren zo bijzonder zijn dat ze afzonderlijke behandeling vragen. Dat geldt ook voor de speciale structuren als de classificatie, taxonomie of typologie, waar wel een afzonderlijke paragraaf (5.3) aan is gewijd, maar waar geen specifieke ontwerpmogelijkheden bij horen.

Dezelfde ontwerpmogelijkheden uit hoofdstuk 4 voor afzonderlijke begrippen, zijn ook toepasbaar voor relaties. Voor toetsvragen op basis van concrete voorbeelden maakt het geen wezenlijk verschil of het voorbeelden van een begrip of van een relatie zijn. Gebruik voor ontwerpmogelijkheden bij relaties ook hoofdstuk 4.

Als vanzelfsprekend is in het bovenstaande aangenomen dat het gaat om relaties die de student zelf moet kunnen leggen, al dan niet geholpen door in het onderwijs behandelde voorbeelden van de betreffende relaties. Maar zo vanzelfsprekend is dit niet. Waarschijnlijk is er in de loop van de laatste honderd jaar in het onderwijs een verschuiving opgetreden van aandacht voor het reproduceren van behandelde stof naar het zelf leggen van vaak wat abstractere verbanden. Dit heeft alles te maken met de opgaande lijn in IQ, het ‘Flynn effect’, zoals dat onder andere door James Flynn (2009) is beschreven. De crux daarvan is niet dat onze overgrootouders zwakbegaafd waren, maar dat zij meer op concreet niveau met de wereld omgingen, waar hun kleinkinderen dat op meer abstract niveau doen. De mensheid is op meer wetenschappelijke wijze gaan denken. Deze trend is waarschijnlijk in sterke mate terug te zien in schoolboeken en in de toets- en examenvragen in verschillende tijden. Zo'n overkill aan reproductievragen is in de 21e eeuw waarschijnlijk niet meer in het onderwijs aan te treffen. Het zou prettig zijn wanneer hier goed onderzoek over beschikbaar kan komen (zoals Genovese, 2002).

5.1 Vertalen en afbeelden

Deze paragraaf behandelt de grammaticale en idiomatische relaties, de logische en wiskundige relaties, en vertalingen van afbeeldingen (representaties) van de ene in de andere vorm. Het gaat hier om vertalen, in eigen woorden weergeven, samenvatten, kaartenmaken, kaartlezen, schematiseren, etcetera, allemaal varianten van het op een andere manier weergeven van dezelfde stand van zaken.

dictee
Een mooie grondvorm voor deze groep van toetsvragen is het dictee: een mondeling gegeven tekst op schrift zetten. Meestal gaat het dan om de juiste spelling. Maar dat kan ook anders zijn, zoals bij een Franse dictee de juiste woorden schrijven, in plaats van de woorden juist schrijven.

De antiheld deed alles op zijn elfendertigst en leverde de op z'n jan-boerenfluitjes in elkaar geflanste genreschilderijen steevast te elfder ure voor de subsidiëring af bij de mecenassen.

De site van Het Groot Dictee der Nederlandse Taal, daar ook alle oude dictees vanaf 1990.

Grondvorm of niet, zodra het helpt om spellingsregels goed toe te passen, wat bij het Groot Dictee onveranderlijk het geval is, valt het dictee ook onder het regime van paragraaf 5.4 over de regels en methoden.

Het aardige van het dictee als toetsontwerp is dat het alles in de hand houdt. Juiste woorden en juiste spelling zijn ook met andere opdrachten te toetsen, zoals een schriftelijk gegeven tekst in eigen woorden omzetten. Die vrije opdracht introduceert veel ruis als het erom gaat woordgebruik en spelling te toetsen, en is dus een stevige afrader. Als dat zo is, dan is dat ook een argument tegen het in de beoordeling van werkstukken meenemen van oordelen over spelling en woordgebruik.

Het gaat hier om een belangrijke vaardigheid die in tal van selectieve situaties een rol speelt, zoals toelating tot het vo, examens in het ho, en in sollicitatiebrieven. Een normatieve vraag is of correct taalgebruik altijd meetelt bij toetsen, alleen voor het gebruik van vaktermen, of helemaal niet (hoofdstuk 8 over normatieve kwesties). Empirisch onderzoek laat zien dat oordelen meebuigen op de kwaliteit van de presentatie, ook waar die presentatie zelf nadrukkelijk niet ter beoordeling staat. Waar het echt spannend is, kan werk worden overgetikt in correcte spelling. Voor de keizerlijke examens in China werd ieder werk standaard overgeschreven, spelling speelde daar uiteraard geen rol.

grammaticale analyse
Redekundig en taalkundig benoemen van woorden is een vorm van vertalen. In Hulshof en Klomp (1978). ‘Training in grammaticale analyse’ geven de auteurs een groot aantal teksten, met telkens een reeks woorden daaruit om redekundig te benoemen (zinsdeel), en een andere reeks woorden om taalkundig te benoemen (woordsoort). Het is geen enkel probleem om van dit type korte open vragen er honderden of duizenden te maken.

“Weg is niet altijd weg, maar terug is ook niet alles: of het is meteen weer weg, of er zit een (verkeerd) luchtje aan.”

Benoem redekundig:

weg (eerste keer)
weg (tweede keer)
terug
een (verkeerd) luchtje

Benoem taalkundig:

maar
alles
of

Dit is grammaticale analyse voor de akte Nederlands MO. De tekst is van Herman Pleij 'Belgische humor over de rug van Madock', De Gids, 1977, en gaat over verloren middeleeuwse teksten. De antwoorden, respectievelijk: onderwerp; naamwoordelijk deel van het gezegde; onderwerp; onderwerp; nevengeschikt voegwoord, onbepaald voornaamwoord, nevengeschikt voegwoord (2x)

grammaticale relaties
Bij grammaticale relaties gaat het om de betekenis van uitspraken of zinnen, zoals bepaald door de onderlinge rangschikking en de vervoeging van de woorden.

Naast deze concrete vragen komen ook abstractere vragen in aanmerking, zoals waar het van belang is dat de student kan aangeven waarom een bepaalde zin grammaticaal (on)juist is, of dat hij kan aangeven welke regel in een bepaald geval is toegepast en dergelijke. Voor een lerarenopleiding zijn deze vragen dan ook concreet. De concrete voorbeelden zijn grammaticaal mogelijk onjuiste zinnen, waarbij de student de geschonden grammaticale regel noemt.

Het vragen van nieuwe voorbeelden bij een bepaalde grammaticale regel past niet in een toets op grammaticaal correct taalgebruik. Dat is anders wanneer een actieve beheersing van de grammatica als systeem het doel van het onderwijs is. Bijvoorbeeld wanneer grammatica zelf het onderwerp van studie is, of wanneer de student grammaticale taalvaardigheid moet leren onderwijzen.

De mogelijkheden voor het gebruik van keuzevragen zijn beperkt. Ze zijn wel te ontwerpen, en de Verenigde Staten gebruikt ze op grote schaal, maar het probleem is dat de verantwoording voor het gebruik van onzinnige afleiders achterwege blijft.

AFRADER

I don't know as I occur with your decision to try and run for office.

that I concur in your decision to try to
as I concur in your decision to try and
that I concur with your decision to try to
as I concur with your decision to try to
no change

Dit is een vraag over idioom, de student moet het idiomatisch beste alternatief aankruisen of alternatief 5. De meeste studenten die de test afleggen zullen alle alternatieven bestuderen. Het probleem is dat het herkennen van niet-idiomatische zinsdelen misschien niet eens tot de onderwijsdoelen hoort, en hoogstwaarschijnlijk niet de vaardigheid is die deze vraag bedoelt te toetsen. Vragen als deze komen voor in de Amerikaanse New High School Equivalency Examination, een grote landelijke toets.

logische en wiskundige relaties
Logische en wiskundige relaties zijn onderling nauw verwant. Wanneer er al vakken zijn waarin wiskundige hulpmiddelen geen plaats hebben, dan spelen logische relaties er zeker nog een rol in, al zou dat slechts zijn in de vorm van een argumentatiekunde.

Het accent ligt op het vertalen van gegeven tekst in symbolen en/of in symbolische relaties, en niet zozeer op het volgens de regels kunnen werken met formules of strings van symbolen (zie daarvoor o.a. 5.4).

Waar gaat het nu om bij het vertalen in logische of wiskundige relaties? Het brengt de beschreven situatie of gebeurtenis op een abstracte vorm. Dat is een eerste stap bij het maken van opgaven of het oplossen van problemen. Het abstraheert van alle specifieke, concrete bijzonderheden. Let, al naar de aard van de beschrijving, op:

afbeelden, modellen bouwen
Afbeelden van de ene representatie in een andere, in het bijzonder het afbeelden van relaties in een nieuwe representatie. Een prototype van deze wijze van vertalen is het omzetten van algebraïsche relaties in meetkundige. Een ander bekend voorbeeld is het gebruik van het Venn-diagram bij de verzamelingenleer en de waarheidstabel in de logica. De behandelde vertaling van concrete situaties in abstracte, wiskundige symbolen en relaties is ook een voorbeeld. Het bouwen van modellen is er eveneens onder te begrijpen; dat kunnen dan zowel wiskundige modellen als schaalmodellen zijn.

kaarten, grafieken, statistieken
Kaarten zijn afbeeldingen van een bepaald landschap vanuit een specifieke interesse (verkeer, grondstoffen) bekeken. Grafieken en tabellen zijn afbeeldingen van bestanden van gegevens, gericht op het met meer gemak kunnen aflezen van gewenste gegevens, samenhangen enz.

samenvatten, abstraheren, concretiseren, hypothesen stellen
Relaties hoeven niet uitsluitend één op één te zijn. In het voorgaande hoofdstuk zijn in feite abstraherende of concretiserende relaties aan de orde. Trek dat nu breder: een belangrijk type relatie is wat bepaalde gebeurtenissen of dingen met elkaar gemeen hebben. Dat gemeenschappelijke kunnen oppervlakkig waar te nemen kenmerken zijn, maar even goed abstractere zaken zoals gemeenschappelijke oorzaken, toepassingen, en wat niet al.

Of gemeenschappelijke kenmerken werkelijk bestaan of niet, dat is vaak de hamvraag. Voor het stellen van diagnoses is een eerste fase immers het opperen van een of meer mogelijke gemeenschappelijke verklaringen voor een gegeven aantal geconstateerde symptomen. De term 'diagnose' suggereert hier teveel een geneeskundige situatie, in feite gaat het om het opperen van veronderstellingen, het stellen van hypothesen, die in nader onderzoek op hun juistheid zijn te toetsen.

Ieder vak kent wel eigen specifieke afbeeldingsvormen, met daarnaast het gebruik van meer algemene, zoals de algebraïsche en meetkundige. Het doel van dergelijke afbeeldingen is in het algemeen het verkrijgen van een beter overzicht (bijna ergonomisch), en het daardoor gemakkelijker aan kunnen pakken van problemen. Niet zelden is het maken van een bepaalde afbeelding een onmisbare stap bij het oplossen van problemen. Soms is het maken van een schets niet beslist noodzakelijk, maar kan dit het vinden van oplossingen wel enorm vergemakkelijken (thermodynamica, Mettes en Pilot).

5.2 Onderscheiden

Een veel voorkomende relatie tussen begrippen is wat hen van elkaar onderscheidt. Bij onderscheidingen-zonder-meer, het onderwerp van deze paragraaf, gaat het om verschillen die niet op enigerlei wijze gesystematiseerd zijn (zoals een taxonomie of classificatie, zie 5.3). Dergelijke onderscheidingen zijn er in twee soorten: het onderscheiden van gemakkelijk te verwarren begrippen en de juiste keuze van instrumenten, technieken en dergelijke. Makkelijk onderling te verwarren begrippen zijn als zodanig meestal al aangeduid: de student krijgt de waarschuwing voor de dreigende misvatting. Bij de juiste keuze gaat het om het volgende probleem: een aantal verschillende technieken zijn ieder afzonderlijk behandeld en geoefend en de student die iedere techniek afzonderlijk beheerst, kiest bij een gestelde opgave uit deze beschikbare technieken de juiste. Let op de ingrijpende omkering die hier aan de orde is. In het onderwijs oefent de student het correct toepassen van een gegeven techniek, terwijl zij later opgaven krijgt waarbij het allereerst van belang is de juiste techniek te kiezen. Een voorbeeld hiervan is statistische hypothesetoetsing: het onderwijs laat de serie verschillende technieken oefenen op geschikte problemen, maar bij de afsluitende toets krijgt de student problemen voorgeschoteld waarbij zij allereerst de juiste techniek moet kiezen, waarop niet of onvoldoende is geoefend. De impliciete context is veranderd, is een andere manier om dit probleem te kenschesen.

Docent Jensen geeft een college over de mate waarin verschillen in intelligentie erfelijk, dan wel milieubepaald zijn.
Voorafgaand vullen studenten de enquêtevraag in of zij denken dat erfelijkheid, dan wel milieu de grootste bijdrage heeft. In zijn college wijst Jensen erop dat bij rigide sociale structuren, slecht onderwijs, en slechte gezondheidszorg, een sterke milieubijdrage is te verwachten; verbeteren deze omstandigheden, dan zullen nog overblijvende verschillen in intelligentie relatief in hogere mate erfelijk bepaald zijn. Na dit college krijgen de toehoorders dezelfde enquêtevraag weer te beantwoorden. Jensen wil nagaan of zijn betoog de meningen heeft beïnvloed. Welke statistische toets (eventueel meerdere) kan hij op zijn gegevens gebruiken?

1. Fischers exacte-waarschijnlijkheidstoets	ja / nee
2. tekentoets	ja / nee
3. Cochran-Q toets	ja / nee
4. McNemar toets voor significantie van veranderingen	ja / nee
5. chi-kwadraattoets voor een enkele steekproef	ja / nee
(Alternatieven 3 en 4 zijn goed.)

Voor een doorzichtige toetsing is het een eerste vereiste dat de student met dit type toetsvraag al tijdens het onderwijs vertrouwd is geraakt. Hij moet kennis hebben gemaakt met aanwijzingen of criteria voor de keuze van de passende techniek. In het gegeven voorbeeld is het voor de keuze van de juiste techniek van belang te weten wat het meetniveau van de verzamelde gegevens is (ordinaal, nominaal, interval), hoe groot het aantal steekproeven is (een, twee, of meerdere) en of deze steekproeven onafhankelijk van elkaar zijn. Door deze criteria langs te lopen, is de juiste techniek te vinden. Dat kan gebeuren aan de hand van een tabel, of misschien moet de student de betreffende beslissingsstappen zo goed beheersen dat de keuze zonder een dergelijke tabel is te maken. Om achteraf enig inzicht te verkrijgen in de overwegingen van de student, vraag dan naar deze gegevens, zonder met deze vraag de student extra aanwijzingen te geven.

Het meetniveau van de enquêteresultaten is

Nominaal
Ordinaal
Interval

Het aantal steekproeven bedraagt

Een
Twee

Zijn er twee steekproeven, zijn deze dan

Afhankelijk van elkaar?
Onafhankelijk van elkaar?

Deze vraagmogelijkheid is in veel vakken te gebruiken. Ik geef een paar voorbeelden, in algemene termen geformuleerd:

De vraagmogelijkheden bij dit soort keuzeproblemen bieden een aantal interessante varianten. Het eerder gegeven voorbeeld is opmerkelijk op deze punten:

Bij dit soort vraagstelling is de verleiding aanwezig problemen op te geven in abstracte vorm.

AFRADER

Wanneer nominale data van twee afhankelijke steekproeven beschikbaar zijn, zijn voor toetsing van de nulhypothese dat de gemiddelden niet van elkaar verschillen te gebruiken:

1. Fischers exacte-waarschijnlijkheidstoets	ja / nee
2. de tekentoets	ja / nee
3. Cochran-Q-toets	ja / nee
4. McNemar-toets voor significantie van veranderingen	ja / nee

Merk op dat de abstracte vorm precies die informatie weggeeft die nodig is om de juiste keuze te kunnen maken. Zo'n vraag kan op het gepaste moment didactisch nuttig zijn (leren omgaan met een gegeven tabel), maar heeft weinig of niets te maken met het vermogen van de student om bij een bepaalde set gegevens uit een gegeven onderzoek de geschikte statische toets te vinden.

Alleen de keuze is gevraagd, en dat ligt soms niet al te zeer voor de hand, vooral niet wanneer het grootste deel van de onderwijstijd juist is gestoken in de rekenkundige bewerkingen die voor het uitvoeren van een gegeven statistische toets nodig zijn. Maar wanneer het belangrijker is dat de student de juiste toets weet te kiezen, is het wenselijk daar ook in de toetsvragen (en in het onderwijs) de nadruk op te leggen. Het is immers mogelijk om alleen de keuze te vragen, zonder verdere rekenkundige uitwerking. De omgekeerde mogelijkheid is ook uit te buiten: alleen berekening vragen, geen keuze. Er zijn nog meer mogelijkheden om een deel van de oplossing van een complexe opgave te vragen, en dat is met name van belang voor wie bij voorkeur van aanvul- of keuzevragen gebruik wil maken:

In het algemeen valt te overwegen om uit en bekend oplossingsalgoritme (zie 5.4) afzonderlijke stappen te isoleren voor afzonderlijke toetsvragen die kort en snel te beantwoorden zijn.

Het derde punt: meerkeuze of niet. Vaak zullen meerkeuzevragen goed te gebruiken zijn, omdat het aantal alternatieve antwoordmogelijkheden maar klein is en de student heel goed weet welke die mogelijkheden zijn. Daarmee is tevens bepaald wanneer meerkeuzevragen informatie 'weggeven': wanneer de geboden alternatieven er slechts enkele uit een veel groter in aanmerking komend aantal zijn of wanneer het niet vanzelfsprekend is dat studenten de alternatieve mogelijkheden op zich ook goed kennen. In die gevallen zijn aanvulvragen beter te gebruiken.

De overige vraagmogelijkheden hebben betrekking op wat in hoofdstuk 4 al uitgebreid besproken is:

Voor gemakkelijk te verwarren begrippen liggen de toetsingsmogelijkheden in lijn met die welke gegeven zijn in 4.3, 4.4 en 4.5. Daar valt aan toe te voegen dat bij te verwarren begrippen het gebruik van keuzevragen vaak op vanzelfsprekende wijze mogelijk is, door als alternatieven de begrippen waarmee verward kan worden (respectievelijk de voorbeelden van die begrippen) op te nemen. Het spreekt bijna vanzelf dergelijke opgaven alleen in een toets te gebruiken wanneer het onderscheiden van deze gemakkelijk te verwarren begrippen in het onderwijs is behandeld.

'Bijna' vanzelfsprekend, want een veel voorkomend misbruik van de meerkeuzevraag is nu juist het vragen van onderscheidingen die in het onderwijs niet behandeld zijn en die evenmin in de onderwijsdoelen thuishoren. De moeilijkheid om goede 'afleiders' voor meerkeuzevragen te bedenken, leidt nogal eens tot vondsten die onbedoeld van de vraag een onderscheidingsvraag maken: de student moet het beste of het juiste antwoord vinden door alle geboden alternatieven te bestuderen en uit de onderlinge vergelijking zijn keuze te bepalen. Ook bij vragen waarbij de docent van de 'goede' student verwacht dat deze zonder omwegen het juiste alternatief weet te kiezen, kan zich dit zelfde probleem voordoen omdat maar zelden een alternatief in absolute zin juist of onjuist zal zijn.

De student moet gemakkelijk te verwarren begrippen dus leren onderscheiden. Dat kan soms louter op basis van vergelijkende waarneming: in dat geval zullen toetsopgaven ook waarnemingsopgaven moeten zijn (concrete objecten, foto's, dia's, film, geluid e.d. gebruiken). Het verschil tussen waarneembare begrippen zal doorgaans ook verbaal te beschrijven zijn en zo'n verbale beschrijving kan voor de student betekenis krijgen wanneer deze gekoppeld is aan vergelijkende waarneming. In die gevallen is het mogelijk toetsvragen te baseren op de verbale beschrijving van het onderscheid, maar het risico is daarbij dat zo'n vraag nogal op een abstract niveau zit (geen voorbeelden, maar met die ene verbale beschrijving). Wanneer het onderscheid is aan te geven in termen van kritische kenmerken, tilt dat het onderscheid naar een meer formeel niveau. Toetsvragen zijn dan gemakkelijker te construeren, ook al is het abstracte vragen naar onderscheidende kenmerken niet aan te raden (zie ook 4.6).

Kijk voor gedetailleerde vraagmogelijkheden in 4.3, 4.4 en 4.5 en naar het laatst gegeven rijtje mogelijkheden, voor problemen van juiste keuze van instrumenten. Juist omdat het om een relatie tussen gemakkelijk te verwarren begrippen gaat, is ook de enkelvoudige vraag om een voorbeeld te benoemen impliciet een vraag naar het onderscheiden van verwarbare begrippen; de meerkeuzevraag ligt dan wel voor de hand, maar de gewone aanvulvraag kan het ook prima doen. Hetzelfde geldt voor het vragen van een nieuw voorbeeld bij een van de verwarbare begrippen.

Tot slot twee opmerkingen. Vergeet niet dat er ook begrippen zijn die wezenlijk aanleiding geven tot verwarring, omdat ze niet objectief zuiver van elkaar te onderscheiden zijn. Wie probeert om onderscheidingsregels op te stellen voor dergelijke begrippen is waarschijnlijk op de verkeerde manier met de stof bezig. Veel van de natuurlijke categorieën, die toch bij uitstek het voorwerp van wetenschappelijk onderzoek zijn, hebben geen duidelijk ten opzichte van elkaar afgebakende grenzen, en in die gevallen is het beter de nadruk te leggen op de meer (proto)typische voorbeelden, en hoe die van elkaar te onderscheiden zijn.

De tweede opmerking is in zekere zin het omgekeerde van de opmerking hiervoor: er zijn ook begrippen die in het geheel niet moeilijk van elkaar te onderscheiden zijn. Toch kan het van belang zijn dat de student zich van de verschillen bewust is en het onderscheid ook expliciet (en niet als vanzelfsprekend) kan maken.

Onderscheiden, klassificeren en diagnosticeren zijn onder de gemeenschappelijke noemer van onderzoek te brengen, wat Deanna Kuhn inquiry noemt. In het Angelsaksische taalgebied is inquiry een staand begrip waarvoor in het Nederlands niet echt een goed equivalent voorhanden is, al spreken we hier wel over een onderzoekende houding, een onderzoekend karakter, en dergelijke. Het verband met het werk van Kuhn over inquiry is belangrijk, en moet in deze en de volgende paragrafen nog worden ingewerkt. In een reactie op het artikel van Kuhn en Pease brengt diSessa het onderscheid tussen begrippen op zich en relaties tussen begrippen, nog eens scherp naar voren, omdat Kuhn en Pease een onderwijsprogramma over relaties hebben gebouwd, waarbij de gebruikte begrippen, zoals 'aardbeving,' als vanzelfsprekend worden beschouwd. Overigens is dat een bewuste keuze, waarvan het interessante is dat het mogelijk is onderwijs over relaties tussen begrippen in te richten, zonder de betreffende begrippen zelf tot direct onderwerp te maken.

Deanna Kuhn and Maria Pease (2008). What needs to develop in the development of inquiry skills? Cognition and instruction, 26, 512-559. abstract, pdf's van publicaties van Kuhn.

5.3 Classificaties

Ik vraag me af hoe classificaties tot stand komen. Er moet zoiets zijn als het ontwerpen van een classificatie. Dat zou dan thuishoren in de categorie die Deanna Kuhn onderzoek noemt, haar inquiry. Natuurlijk, het ontwerpen en het gebruiken van classificaties zijn verschillende zaken. Waar ik aan denk is dan ook iets anders: zijn er ordeningen die gewoonlijk niet als classificatie zijn benoemd? Zijn er rudimentaire vormen? Neem eens causale relaties: er zijn vaak tal van mogelijkheden waardoor een bepaalde stand van zaken kan zijn veroorzaakt; in zo'n open verzameling van mogelijke oorzaken is dan een bepaalde ordening aan te brengen, misschien op basis van empirisch onderzoek, of van literatuurstudie. Zo'n ordening zou een rudimentaire vorm van een classificatie zijn. De classificatie is ingewikkelder al naar gelang meerdere mogelijke gevolgen er deel van uitmaken, relaties ook probabilistisch kunnen zijn, of interactief. Experimenterenderwijs verzamelde causale relaties vormen dan op zich een primitieve classificatie, waarin mogelijk een sterkere ordening in is aan te brengen door relaties onder een gegeven theorie te scharen, of er een theorie bij te ontwerpen. Newton, in zijn bewegingswetten, ontwierp een theorie die een eenvoudiger ordening aanbracht in de empirisch vastgestelde verschijnselen (de bewegingen van planeten, bijvoorbeeld).

Een aparte paragraaf is gewijd aan een apart onderwerp: classificaties. Een classificatie is een ordening van de verschijnselen zoals bestudeerd in een bepaalde tak van wetenschap. Een aantal voorbeelden: Mendelejevs periodiek systeem van scheikundige elementen; de taxonomie voor planten, respectievelijk dieren, in de biologie; typologieën zoals in de persoonlijkheidsleer: min of meer logische indelingen zoals in de rechtsgeleerdheid; en classificaties zoals in de geneeskunde. Een classificatie is meestal een categorische ordening (biologische taxonomieën); de verschillende categorieën overlappen elkaar niet en ieder verschijnsel of object hoort in een en niet meer dan een categorie thuis. Wanneer de categorieën elkaar overlappen, er veel grensgevallen zijn en het lidmaatschap van een categorie bepaald is door het in meerdere of mindere mate hebben van bepaalde eigenschappen, spreekt men in plaats van een classificatie veelal over een typologie.

Ik heb het onderwerp classificaties een 'apart' onderwerp genoemd. De reden is deze: bij classificaties zijn geen toetsvragen te schrijven die specifiek zijn voor classificaties. Omdat classificaties echter een heel geprononceerde plaats in de leerstof kunnen hebben, wil ik er toch een bespreking aan wijden, ongeveer op de wijze waarop in hoofdstuk 3 over definities is gesproken. Deze uiteenzetting moet de docent voldoende inzicht verschaffen in de aard van een classificatie zoals behandeld in de eigen leerstof, om een juiste keuze te kunnen doen met betrekking tot de aard van wat in dit geval op relevante wijze over deze classificatie valt te vragen. Waaruit valt er te kiezen? Een opsomming van de meer voor de hand liggende mogelijkheden is de volgende.

Het is niet zinvol deze vraagmogelijkheden hier tot in detail uit te werken, zie daarvoor andere paragrafen in dit boek. Vraagmogelijkheden 1. en 2. behelzen het terugvragen van informatie (zie hoofdstuk 6, vragen over tekst), 3. en 4. verwijzen naar wat in 5.2 over onderscheiden is gezegd, terwijl 5. en 6. ofwel een vorm van eenvoudig benoemen betreffen (hoofdstuk 4), ofwel een stappenvolgorde of algoritme, en paragraaf 5.4 behandelt dat.

Classificaties zijn er in soorten, en je zou dan ook een classificatie van classificaties kunnen opstellen. Hoewel dat niet noodzakelijk tot een paradox hoeft te leiden, geef ik er de voorkeur aan enkele vormen van classificatie op een meer informele wijze te bespreken. Eenvoudige classificaties zijn gebaseerd op een logische ordening of een stipulatieve ordening (bij afspraak). Voorbeeld: temperaturen boven, respectievelijk bene den nul graden Celsius. Deze temperatuurindeling heeft een zeker aantrekkelijkheid vanwege de eenvoud van het gekozen principe: het vriespunt van een voor de mens zo belangrijke stof als water, maar het blijft een tamelijk willekeurige indeling. In de geneeskunde komen dergelijke classificaties wel voor, bij administratieve of wettelijke normen. In de rechtswetenschap is er een behoefte aan eenduidige normen, ook waar die niet op natuurlijke wijze bij de betreffende verschijnselen of objecten passen; het vak kent dan ook veel indelingen die bij afspraak (bij wet, via jurisprudentie, in de dogmatiek) zijn vastgelegd. De zwakte van classificaties op deze basis, bij afspraak, is dat de classificatie geen of vrijwel geen theoretische betekenis heeft, of met een anglicisme aangeduid: geen systemische betekenis heeft. De classificatie is gericht op en heel direct en praktisch doel en heeft daarbuiten geen nut. In het onderwijs is het dan ook niet raadzaam om aan deze 'kunstmatige' classificaties veel aandacht te besteden. Inleidingen in de rechtswetenschap kenmerken zich nogal eens door een overmaat van juridisch jargon dat op deze wijze is ingedeeld. Bijvoorbeeld: 'Het staats-, administratief en privaatrecht bevatten tal van regels, hoe de mensen zich in de maatschappij horen te gedragen. Deze rechtsnormen kan men onderscheiden in verplichtende en veroorlovende normen; verplichtende normen weer in normen die gebieden iets te doen, en normen die, omgekeerd, een bepaald handelen verbieden. De overgangen zijn 'vloeiend' (Enschedé, 'Strafrecht en strafvordering', in: Bakels, 1971). Of het van belang is dat studenten deze terminologie leren hanteren, zal vooral moeten afhangen van het feit of de terminologie betekenis heeft boven wat zij zelf al uitdrukt.

Classificaties worden pas echt interessant wanneer de variabele of variabelen op grond waarvan de indeling gebeurt, samengaan met andere belangrijke variabelen. Verdeel je de mensheid in vrouwen en mannen op grond van primaire geslachtskenmerken, dan is de mensheid ook op een breed scala van andere kenmerken langs dezelfde lijn verdeeld. Of anders gezegd: de informatie om tot de indeling te komen, maakt ook gevolgtrekkingen mogelijk over kenmerken die niet zijn gegeven, Hempel (1952, blz 53): 'De rationele kern van het onderscheid tussen natuurlijke en kunstmatige classificaties zit in de overweging dat bij de zogenaamde natuurlijke classificaties de bepaalde kenmerken meestal geassocieerd zijn met andere kenmerken waarvan ze overigens logisch onafhankelijk zijn. (...) taxonomische categorieën als soort, species, etc., zoals gebruikt in de biologie, bepalen klassen waarvoor geldt dat organismen diverse biologische kenmerken met elkaar gemeen hebben anders dan die welke de klasse in kwestie definiëren; vaak geven de zo bepaalde groeperingen ook relaties weer die de phylogenetische oorsprong betreffen.' De biologische taxonomie heeft dan ook theoretische of systemische betekenis, gaat veel verder dan het louter op beschrijvende kenmerken indelen van de verschijnselen. In de geneeskunde kunnen we classificaties tegenkomen die gebaseerd zijn op prognose (bijv. leukemie en multiple sclerose), op behandelingsaanpak (bijv. astma, artritis) of op beschrijvende kenmerken (bijvoorbeeld syndromen, vele huidziekten, de meeste hartziekten) (Murphy, 1976, blz. 104). 'Binnen de medische taxonomie is de diagnose het brandpunt van het denken bij de behandeling van de patiënt; terug naar pathogenese en etiologie, voorwaarts naar prognose en behandeling. Zodoende verschaffen diagnostische categorieën de locaties waar clinici de waarnemingen uit hun klinische ervaring opslaan, en bepaalt de diagnostische taxonomie de patronen waarin clinici waarnemen, denken, zich zaken herinneren, en handelen.' (Mezzich & Solomon, 1980, blz. 2).

De rijkste classificaties zijn die welke zijn gebaseerd op essentiële kenmerken. Hecht niet te veel betekenis aan het woordje 'essentieel', dat leidt tot filosofische problemen. Denk aan het periodiek systeem van Mendelejev, dat gebaseerd is op aantallen protonen in de atoomkern en op de daarmee corresponderende aantallen elektronen. In de geneeskunde is te denken aan classificatie gebaseerd op het achterliggende 'mechanisme' van de ziekte (bijv. tuberculose, de bloedziekten). Zo'n classificatie is het brute beschrijvende niveau overstegen en is veeleer gelijk aan een wetenschappelijke theorie of model.

Het ordenend beschrijven van de verschijnselen is veelal een eerste stap op de lange weg naar een werkbare theorie (dat is een vruchtbare theorie). Geen wonder dat een afzonderlijke hulpwetenschap aan het ontstaan is, gericht op methoden en technieken voor het ordenen van verschijnselen (zie de aanbevolen literatuur aan het eind van dit hoofdstuk).
Classificaties hebben in veel disciplines een belangrijke plaats. Desondanks zijn er geen vraagmogelijkheden die specifiek zijn voor classificaties. Dat betekent dat de docent zich moet afvragen op welke wijze de student met een bepaalde classificatie moet weten om te gaan, en dat al naar gelang het daarop gevonden antwoord de vraagmogelijkheden in een ander deel van dit boek te vinden zijn. Voor (medische) diagnostiek bijvoorbeeld zal hoofdstuk 7 (problemen stellen) in zijn geheel van belang zijn.

5.4 Stappenschema's, algoritmen, routines, procedures

Het prototype is hier de methode voor aftrekken, optellen, vermenigvuldigen in het rekenonderwijs in de basisschool. Hoe eenvoudig deze methoden ook lijken voor de wat oudere leraar en hoger opgeleide ouders, ze blijken verdraaid moeilijk te leren, er zijn verschillen van inzicht over de mate waarin kinderen deze methoden in de vingers moeten zien te krijgen, en er is grote maatschappelijke zorg over het succes van het basisonderwijs in het bijbrengen van de nodige vaardigheden. Bij de Periodieke Peiling van het Onderwijs in Nederland PPON 2004 (Janssen, Van der Schoot en Hemker 2005 pdf) blijken Nederlandse basisscholieren deze vaardigheden volstrekt onvoldoende te beheersen, soms tussenvormen van algoritmes te gebruiken (het zogeheten kolomrekenen), of zelfs vaak ten onrechte de opgaven uit hun hoofd te doen en dus meestal fout te beantwoorden (Van Putten, bijdrage p. 125-131 in de vermelde bron pdf). Op een speerpunt van het onderwijs gaan er een paar dingen niet zoals het zou moeten, en omdat het gaat om een vak dat bestaat uit vooral veel opgaven maken, is hier absoluut aan de orde of de rekenopgaven wel goed zijn ontworpen voor moment en doel waarop ze worden ingezet. Omdat zeker na de invoering van de euro alle rekenmethoden op Realistisch Rekenen zijn gebaseerd (Wiskobas is een voorloper), kan de stroom publicaties uit het Freudenthal Instituut duidelijk maken wat de mogelijke knelpunten zijn. Zeker is een knelpunt de opvatting bij voorstanders van Realistisch Rekenen dat basale rekenvaardigheid, vaak geringschattend cijferen genoemd, in deze tijd van rekenmachientjes en internet minder belangrijk is. Dat is een interessant punt, omdat het scherp stelt tot welk niveau van beheersing deze basale rekenvaardigheden zouden moeten gaan, en dat is een belangrijk gegeven voor de ontwerper van toetsvragen (oefenvragen).

Ondertussen is met enige regelmaat in de dagbladen te lezen dat het middelbaar en zelfs het hoger onderwijs eerst de tekorten in basale rekenvaardigheden moeten wegwerken voordat het onderwijs in wiskunde kan beginnen: Nederland heeft een probleem met rekenvaardigheden die kennelijk als ouderwets en overbodig worden ervaren, maar tegelijk wel een voorwaarde zijn voor het kunnen volgen van onderwijs in wiskunde. Het rekenonderwijs staat niet alleen in deze problematiek, het verschijnsel grijpt breed om zich heen in het voortgezet en middelbaar onderwijs dat steeds meer gericht is op competenties waarin het onderscheid vervaagt tussen het opbouwen van inhoudelijke expertise, en handigheid in communicatie. Dat is mogelijk precies het onderscheid tussen het leren beheersen van algoritmen en procedures tot grote hoogten en uiteindelijk goeddeels geautomatiseerd, en het handig leren omgaan met vage eisen die op communicatief niveau worden gesteld en meer tot de persoonlijkheidspsychologie dan tot de onderwijsdoelen horen. Hier is niet gezegd dat Realistisch Rekenen op zich de oorzaak van de gesignaleerde problemen in basale rekenvaardigheden is (zie de opmerkingen hierbeneden bij Slavin en Lake (2008) gemaakt); het is in beginsel mogelijk om tal van oorzaken tegen te gaan binnen de methode van realistsich rekenen—denk aan tijd besteed aan rekenen, en daarbinnen aan basale vaardigheden—of met op zich eenvoudige aanpassingen zoals minder overdadig zijn met contextsommen. Er is een scala van omstandigheden die een rol spelen, en dus ook voor het ontwerp van opgaven van belang zijn.

Procedures, in tal van varianten, komen in alle vakken voor, maar onder deze vakken is er een waar die procedures wel heel gevoelig liggen, en tot op ongekende hoogten van vernuft en perfectie zijn doorontwikkeld: de wiskunde. Casus uit de wiskunde zijn om die reden geknipt om de mogelijkheden en onmogelijkheden van toetsvragen met procedures te onderzoeken. Ik stel mij voor, maar dat is een zaak die zelf juist ook in deze paragraaf aan de orde hoort te zijn, dat de lessen uit wiskundige casuistiek eenvoudig zijn over te dragen naar wat er in andere vakken aan procedures aan de orde is in onderwijs en beoordeling. Vooruitlopend op de verdere herziening van deze paragraaf, volgt hier een korte serie voorbeelden. Probeer telkens een beargumenteerd antwoord te geven voordat u de verdere tekst leest.

De procedure voor aftrekken is ingewikkeld, met lenen als dat nodig is. Typische fout bij dit type opgave is dat de leerling de 3 van de 8 aftrekt, want dat is een eerder al geleerde procedure voor aftrekken van getallen onder de tien. Ofwel: verschillende procedures buitelen bij dit eenvoudige voorbeeld dus al vrolijk over elkaar heen. Laat de leerling haar gegeven antwoord uitleggen, zodat de persoonlijke ratio van het gegeven antwoord duidelijk is. Met andere woorden: stop de reflex om '35' als 'fout geantwoord' af te straffen. En zie: meteen staat de zin van toetsen zelf ter discussie: als de toets losraakt van het leren zelf, gaat hier iets wringen, niet?

Bovenstaand type vraag is de laatste decennia vaak gebruikt in wetenschappelijk onderzoek in de rekenklas. Steevast blijkt dat veel leerlingen die leeftijd inderdaad weten te berekenen. Waar onderwijs al niet toe in staat is. In dit geval is de les, althans volgens sommige onderzoekers, dat het rekenonderwijs voor een deel van de leerlingen is ontspoord en alleen nog bestaat uit gedachtenloos iets doen met getallen. Een vriendelijker interpretatie is dat leerlingen alleen opgaven kennen die altijd een berekenbaar antwoord hebben, en dan is deze vraag een strikvraag die ze in verwarring brengt, maar ook dan is het onderwijs tekortgeschoten door zijn eenzijdigheid. Voor documentatie zie de pagina matheducation.htm. De aansporing is: zorg ervoor dat geoefende procedures ook zijn begrepen. Voor het ontwerp van oefen- en toetsvragen is de les: ze mogen niet uitnodigen tot gedachtenloos rekenen, en soms zullen ze moeten dwingen tot scherp nadenken om het gevraagde zo te vertalen dat het gevraagde antwoord valt te berekenen.

Kijk, hier komt de aap uit de mouw. Wat is dat eigenlijk, '33 min 8'? Op de keper beschouwd, hoort daar een toelichting bij: ik heb een verzameling van 33 (dingen, etc.), waar ik 8 (dingen, etc) afhaal. Dan zijn '33 appels' en '8 peren' verschillende verzamelingen, die niet van elkaar zijn af te trekken. Met andere woorden: '33 - 8' laat heel veel impliciet, en laat heel veel ruimte voor interpretaties die afwijken van de specifieke interpretatie die de leraar voor ogen stond bij het stellen van de vraag.

Dit lijkt wel algebra, maar hoeft het niet te zijn. Als 'a' een symbool is dat staat voor iets anders, zou dat ook 'a=appel' kunnen zijn? Kennelijk bedoelt de vragensteller dat niet, want wat is 33 appels min 8? Is twaalf meer dan een potlood? Dit is een verwarrende wereld voor de leerling. Leerlingen die het leuk vinden met procedures te stoeien, zullen hier wel goed mee weg komen. Leerlingen die wat filosofischer zijn ingesteld, en vragen hebben waar geen antwoord op komt, zouden wel eens aardig in de knoop kunnen raken. Het risico bestaat dat nogal wat leerlingen aan geen van beide toekomen, in verwarring hun eigen procedurele regels bedenken, en daar zo lang mogelijk aan vast houden.

Het gekke is dat bovenstaande opgave, zonder dat u de context kent, van alles kan zijn: degelijke algebra, hoewel niet verder te vereenvoudigen, of een onzinnige appels-en-peren vergelijking, of een zinnige prijs-van-appels-en-peren vergelijking (de peren waren ten onrechte op de kassa aangeslagen, of zoiets).

Dit is een riskante categorie, het risico hangt af van de manier waarop studenten zich het algoritme eigen hebben gemaakt. Is dat zonder begrip gebeurd, dan is het een kunstje dat best heel goed kan zijn geoefend, maar waarin zo'n student dan toch merkwaardige fouten kan maken. Het is natuurlijk de verantwoordelijkheid van de docent om een didactiek te hanteren die dit type bedrijfsongeval voorkomt. Ik zal op dit thema nog enig onderzoek moeten doen, for the time being is enige inspiratie te putten uit de literatuur, zie hier.

ERGERLIJKE KINDERMISHANDELING

6/11 x 15/16 x 22/25 = ....

3/8 : 5/6

Leen 1961, p. 189, citeert P. Wijdenes in Valcoogh, 15 januari 1953. De opgaven zijn uit een rekenboek voor de lagere school, begin 4e klas. Wijdenes telt in dat boekje 3500 van dit soort opgaven, wat hij ergerlijke kindermishandeling noemt.

Leren werken met breuken is belangrijk in het basisonderwijs. Maar er is een belangrijk onderscheid tussen de vaardigheid op zich, en het foutloos maken van gekunsteld ingewikkelde sommen. De ontwerper kan opgaven over breuken net zo moeilijk maken als hij wil. "Wijdenes wil de leerstof beperken tot het begrip gewone breuk: 1/2, 1/3, 1/4, 1/5, 1/6, 1/10, en verder nog 2/3, 3/4, 4/5. Voorts optellen en aftrekken." En dat was ook de lijn van de inspectie in die dagen. Mechanisch oefenen van bewerkingen met breuken (heel, heel veel opgaven maken) holt voorbij aan de hoogste prioriteit: een goed begrip van wat breuken zijn. Als het onderwijs op dit punt helemaal op orde is, kunnen toetsen het feest bederven door toch nog ergerlijke ingewikkeldheden te vragen. Kijk, dit is dus een heel andere manier om te onderscheiden tussen inzicht en mechanische kennis. Onthoud dit voorbeeld. Voor een briljante uitleg van het punt zie Carroll (1987), ook besproken in hoofdstuk 1.

Ik heb het bovenstaande niet zorgvuldig genoeg geformuleerd, en zal waarschijnlijk ook het artikel zelf, van Wijdenes, erbij moeten nemen. Ik kan me niet goed voorstellen dat Wijdenes het vermenigvuldigen van breuken met elkaar, en het delen van breuken op elkaar, niet meer tot de stof van de lagere school vindt behoren. Ook het maken van heel veel opgaven is op zich niet evident didactische onzin. Het regelmatig maken van pittige vermenigvuldigingen en staartdelingen is een goede oefening op deze algoritmen, maar vooral ook op de basale rekenfeiten die daarbij worden gerepeteerd. Veel oefenen met ingewikkelde breuken zinvol is daarnaast waarschijnlijk niet aantoonbaar zinvol terwijl het voor veel leerlingen een enorme frustratie zal zijn (veel fouten), en ik vermoed dat dat ook is wat Wijdenes bedoelt.

Dit voorbeeld illustreert een fundamenteel probleem bij het leren - onderwijzen - van nieuwe procedures: leerlingen zullen proberen de nieuwe procedure, in dit geval het vergelijken van decimale getallen, voor zichzelf begrijpelijk te maken door inpassing in al bekende procedures. Zoiets als het leren van een nieuwe procedure op zich, los van alle al aanwezige kennis, bestaat in de werkelijke wereld niet. Nesher (1986) laat zien dat er zodoende twee belangrijke typen misvattingen bij deze opgave zijn [nb: de opgave zelf is in mijn tekst weggevallen; u begrijpt uit het volgende wel wat er is bedoeld]. De eerste is dat de leerling het getal met het grootste aantal cijfers na de decimaal kiest, dus zowel 0,234 als 0,675 zijn groter dan 0,4; Nesher vond dat eenderde van de leerlingen nog na afloop van het onderwijs in decimalen die misvatting hanteerde, een percentage dat pas in de loop van jaren afneemt. De tweede mogelijke verkeerde inpassing is de redenering dat duizendsten kleiner zijn dan tienden, en 0,4 dus groter is dan zowel 0,234 als 0,675, ook door ongeveer eenderde van de leerlingen gepleegd. Een of twee jaar later blijkt nog steeds eenvijfde van de leerlingen die tweede misvatting te hanteren.

Wat dit geval zo interessant maakt is dat het eenzelfde fenomeen is als wat zich bij het onderwijs in de natuurkunde voordoet, dat nieuwe wetten behandelt waarvoor de leerling dus niet kan weten hoe zij in begrijpelijke termen zijn te duiden. Over natuurkunde zie vooral de volgende paragraaf. De overweldigende betekenis van het op zo grote schaal voorkomen van dergelijke misvattingen is dat het niet volstaat de leerling voor te doen hoe het moet of hoe het werkt, maar dat de leraar ervoor moet zorgen dat de leerling de nieuwe kennis goed opneemt in al bestaande kennis. En dan komt een en ander natuurlijk bij het ontwerpen van vragen over de stof opnieuw aan de orde. De hoofdvraag is dan: is die nieuwe procedurele kennis goed opgenomen in de al bestaande kennis, of zijn er kortsluitingen ontstaan? De vragen moet dan de gelegenheid bieden om belangrijke misvattingen tot uiting te laten komen. Merk op dat de vragen in bovenstaand voorbeeld daartoe makkelijk tekort kunnen schieten, omdat ze om de verkeerde redenen goed kunnen zijn. Reden te meer om ook uitleg te vragen, zeker bij gemaakte fouten.

Ieder vak kent wel een aantal onmisbare technieken, methoden, rekenprocedures en dergelijke. Perfecte beheersing van deze routines maakt dat zij foutloos verlopen ook zonder bewust aan het uitvoeren van de routine te denken. Dat is bijvoorbeeld het geval met de vanzelfsprekende vaardigheid de moedertaal grammaticaal correct te spreken. Deze vaardigheid is niet bewust aangeleerd en slechts weinig mensen die hun grammatica correct hanteren zouden de grammaticale regels ook kunnen verwoorden. Een ander voorbeeld van automatisch aflopende algoritmen zijn de eenvoudige rekenkundige bewerkingen. Deze zijn wel expliciet geoefend en wie ze gebruikt is eveneens in staat uit te leggen wat hij doet en waarom. Dat de werkelijkheid zo simpel niet is, bewijst de analyse die Van Putten (2005) heeft gemaakt van methoden die leerlingen gebruiken voor vermenigvuldigen en delen, in de Periodiek Onderwijspeilingen PPON 1997 en 2004 (zie ook realistisch_ kolomrekenen.htm). Autorijden is eveneens een 'routine' waarbij de ervaren bestuurder geen expliciete aandacht meer hoeft te geven aan de vraag welke handelingen hij wanneer moet verrichten, en hoe hij dat moet doen. Het aanpakken van wetenschappelijke problemen is voor de onderzoeker meestal zo vanzelfsprekend dat het moeilijk valt om alle ondernomen 'denkstappen' aan een ander duidelijk te maken, een verschijnsel dat sterker is waar sommige stappenreeksen in een keer worden gemaakt op basis van ervaring, een ervaring die studenten niet hebben. Naast routines van deze gedetailleerde (denk)-handelingen, zijn er ook stappenschema's met een globaal karakter, die meer een geheugensteuntje zijn bij het uitvoeren van complexe opdrachten zoals het oplossen van problemen, plannen van een scriptie of opzetten en uitvoeren van een onderzoek (zie hoofdstuk 7).

Een vak dat in zekere zin een verzameling van algoritmen is, waar onderzoekers gespitst zijn op het ontwikkelen van steeds betere algoritmen, is de wiskunde. Voorbeelden te over: van het eenvoudige optellen of het maken van een staartdeling tot het ontwerpen van een computerprogramma's, terwijl er ook specialiteiten zijn zoals het leveren van het bewijs dat een bepaalde klasse van problemen geen algoritme kent, dat voor ieder probleem een oplossing oplevert. Een concreet voorbeeld is het oplossen van een vergelijking in een onbekende.

Los op: 8x + 3 = 3x + 18
Beschrijf het gebruikte algoritme.

Antwoord. Gevraagd de waarde van x, of: x = ...

stap 1:

een constante in het linkerlid is te verwijderen door zowel links als rechts deze constante af te trekken.
Resultaat: 8x = 3x + 18 - 3 = 3x + 15

stap 2:

de factor x in het rechterlid is te verwijderden door deze zowel links al rechts af te trekken.
Resultaat: 8x - 3x = 5x = 15

stap 3:

de coëfficiënt van x is gelijk 1 te maken door links en rechts door deze coëfficiënt te delen.
Resultaat: 5x / 5 = 15 / 5, ofwel x = 3.

Zo'n algoritme is op verschillende manieren te formuleren of in een schema te zetten. Doorgaans is de stappenvolgorde kritisch, een andere volgorde zou een ander (onjuist) resultaat opleveren. In het gegeven voorbeeld zou het uitvoeren van stap 3 voor stap 2 tot problemen leiden; stap 1 en 2 zijn onderling wel verwisselbaar.

Het gegeven voorbeeld is een eenvoudig algoritme waarin geen logische beslissingen voorkomen, waarin niet aan specifieke voorwaarden voldaan hoeft te zijn om de volgende stap te kunnen uitvoeren (anders dan dat de voorgaande stap is uitgevoerd). De meeste algoritmen of stappenschema's kennen wel van die logische beslispunten of 'tests', met daaruit resulterende 'loops' naar een eerdere stap of short cuts naar een stap verderop in het algoritme. In het volgende voorbeeld is dat geïllustreerd, en dat is tegelijk een voorbeeld van een meer globaal stappenschema, in tegenstelling tot een specifiek algoritme zoals hierboven gegeven.

Voor het oplossen van een juridische casuspositie kan de student het volgende stappenschema hanteren:

stap 1: breng de casus in kaart
stap 2: geef voorlopige juridische vertaling van feiten in casus
stap 3: selecteer op basis van resultaten van 2 relevante rechtsregels
stap 4: bepaal op basis van resultaat van 3 voorwaarden waaronder de vertaling in stap 2 steek houdt
stap 5: is aan voorwaarden uit 4 niet voldaan in 1, dan terug naar stap 2 (een 'test' stap)
stap 6: pas regels uit 3 toe op casus en bepaal gevolg(en)
stap 7: zijn gevolgen niet aanvaardbaar, dan terug naar stap 2 ('test' stap)
stap 8: formuleer uitspraak

Een heel vrije bewerking van een stappenschema gegeven door Crombag, De Wijkerslooth en Van Tuyll van Serooskerken, 1972

Naast stappenschema's met een voorgeschreven volgorde zijn er ook handelingsvoorschriften zonder een bepaalde volgorde, maar wel volgens strikte regels. Dat zijn 'technieken.' Een toetsvraag gericht op zo'n techniek is:

Maak een tekening van zes figuren. Plaats ten minste een van de personen op de voorgrond, evenzo ten minste een persoon op de achtergrond, en tenminste een in een tussenpositie. De relatie tussen de figuren moet de regels van het rechtlijnig perspectief weerspiegelen.
[Wilson, in: Bloom, Hastings en Madaus, 1971, blz. 550]

Laten we voor het gemak de term 'algoritme' gebruiken voor het hele scala van handelingsvoorschriften: zowel stappenschema's, technieken en routines, als algoritmen zelf. Het is van enig belang om de vraag te beantwoorden welke rol algoritmen in het onderwijs hebben en speciaal in de eigen discipline. Meestal krijgen algoritmen in het onderwijs een heel duidelijke plaats toegewezen: de studenten krijgen er uitgebreid oefening in. Maar is dat ook voldoende? Aan het gebruik van een algoritme zitten meer kanten dan alleen het kunnen toepassen. Een heel belangrijk punt is wel dat de student in staat moet zijn het algoritme toe te passen wanneer de situatie daar om vraagt. Daarnaast zou het niet zo gek zijn wanneer de student voldoende inzicht zou hebben in de achtergronden van het algoritme om ook in staat te zijn dezelfde principes in ongewone situaties toe te passen (of gewoon in het dagelijks leven, waar ook heel wat problemen op te lossen zijn). Dat vraagt niet alleen een goede routinematige beheersing, maar vooral het bewustzijn van het hoe en waarom van het algoritme.

Daarmee ontstaat een indeling van twee categorieën toetsvragen rond algoritmen: het correct uitvoeren van het algoritme, en bij een opgegeven probleem het juiste algoritme weten te kiezen.

De meest voor de hand liggende vraagmogelijkheden behoeven nauwelijks de verheldering aan de hand van extra voorbeelden:

Omdat algoritmen uiteindelijk bedoeld zijn om bepaalde problemen op het eigen vakgebied tot een oplossing te (helpen) brengen, zullen ze in een eindtoets vaak voorkomen als onderdeel van andere opgaven. Wanneer er bij deze opgaven veel fouten zijn bij de keuze, dan wel de uitvoering van het algoritme, is het efficiënter om uitgebreidere opgaven minder afhankelijk van de kennis van algoritmen te maken, en de laatste afzonderlijk te toetsen.

Stappenschema's spelen vaak een rol bij het gestructureerd aanpakken en oplossen van problemen, zoals ook de bedoeling van het als voorbeeld gegeven stappenschema voor het aanpakken van juridische casus is. Zie verder vooral hoofdstuk 7.

AFRADER

Welke allotrope modificaties kent ge van het element phosphorus? Hoe kunnen deze modificaties direct of indirect in elkaar worden omgezet? In welk opzicht draagt het verschijnsel der allotropie bij het element phosphorus een ander karakter dan bij het element zwavel? [eindexamen 1937 no. A2]

Bij de beantwoording moeten de candidaten zonder twijfel 'inzicht' tonen in dit stukje chemische theorie. Maar de feiten over rhombische en monokline zwavel, gele en rode fosfor, mono- en enantiotropie moeten ze toch 'uit geheugen' opschrijven ... en de theorie eigenlijk óók. Is het wel waar, dat op deze wijze het 'inzicht' van de candidaat getoetst wordt? Als afgerond onderwerp komt 'allotropie' in de schoolboeken voor en wordt het, na behandeling in de klas, 'geleerd.'

De Miranda, 1955, p. 26

Het proefschrift van De Miranda (1955) gaat over de worsteling over het onderscheid tussen inzicht en kennis, tussen leren toepassen van wetenschappelijke methoden en het kennen van de vele feiten in het vakgebied, bij de stakeholders van het onderwijs. De feitenkennis wint het overigens vrijwel altijd, op gebrek aan goede gronden. Scheikunde is het vak waaraan hij concrete illustraties ontleent; zijn poging een didactiek te grondvesten is veel breder, en mist nog de kracht die de cognitieve wetenschappen - cognitive science - er een halve eeuw later aan zou hebben geven.

5.5 Wetmatige relaties, modellen of theorieën

wetenschappelijke wetten — natuurwetten — natuurkundige wetten

Wat doen de wetten van Newton met de beweging van de Aarde om de Zon?

De wetten bepalen die beweging.
De wetten kunnen die beweging beschrijven.

Hoe men het ook wendt of keert, praten over natuurwetten of wetenschappelijke wetten houdt altijd een stellingname in over de aard van die wetten. Gemakshalve zijn er twee posities te onderscheiden. De gangbare positie is de deterministische positie — Necessitarian Theory — dat wetenschappelijke wetten gebeurtenissen verklaren of bepalen. De baan van de Aarde om de Zon is zoals hij is omdat de wetten van Newton dat bepalen: niet omdat Newton het zo wilde, maar hij ontdekte het bestaan van die natuurwetten. Een heel andere positie is de regelmatigheidspositie — Regularity Theory — dat wetenschappelijke wetten gebeurtenissen beschrijven. De wetten van Newton kunnen de baan van de Aarde om de Zon beschrijven: niet omdat de Aarde gehoorzaam is aan de door Newton ‘ontdekte wetten’, maar omdat de wetten zo zijn opgesteld dat ze een adequate beschrijving van de baan van de Aarde (of een andere planeten) opleveren. Voor de wetenschapsfilosofische uitwerking zie Schwartz (1985, 1995 html). Het helpt misschien om te weten dat Newton zich niet uitliet over wat de krachten zijn die tussen Aarde en Zon werken, alleen over dàt ze er zijn. Voor het onderwijs maakt het verschil wat de metafysische positie is, en dus ook welke formulering dan passend is voor toetsvragen over, bijvoorbeeld, het gebruik van de wetten van Newton.

Omdat voor beide posities sterke argumenten zijn aan te voeren, zie Weinert (1995), is een expliciete keuze van positie enigszins subjectief. In dit boek valt de keuze op de alternatieve positie: wetten beschrijven regelmatigheden in de wereld. Het argument voor deze positiekeuze is dat we niet kunnen zeggen dat planeten, elementaire deeltjes, jeugdbenden zich gedragen volgens wetenschappelijk wetten — alsof er bewustzijn is van de noodzaak om wetten te volgen, wat niet het geval is — maar op zijn best dat ‘wetten’ regelmatigheden in deze gedragingen kunnen beschrijven.

[december 2009] Dat wetten alleen maar regelmatigheden in de wereld beschrijven, is mogelijk een te armzalige positie, die goed past bij het werk van Galilei en Kepler, maar minder bij dat van Newton. Ik mis er Newton’s revolutie mee. Nu is Newton's eigen werk buitengewoon moeilijk toegankelijk, en de literatuur over Newton is dat voor buitenstaanders ook. Ik heb een leidsman nodig, en dat kan Bernard Cohen zijn. In zijn The Newtonian Revolution schetst hij een helder beeld van de werkwijze van Newton, waarin hij nadrukkelijk aandacht heeft voor Newton's denken in zowel wiskundige als natuurkundige termen. Dat gaat dus ook over de vraag wat de wiskundige formules hebben te maken met de natuurkunde, en dat is precies wat ik zoek. Ik zal hier in een paar zinnen aangeven waar het op neerkomt, en later een uitwerking geven die in een herziening van deze paragraaf resulteert. Het laboratorium van Newton is hier het zonnestelsel, waarvoor Kepler een aantal wetten heeft opgesteld die de loop van de planeten adequaat beschrijven. Kepler's wetten geven dus geen verklaringen. De gouden greep van Newton is geweest om te postuleren dat er een kracht moet zijn die een planeet in zijn baan dwingt — want anders zou de planeet het zonnestelsel uitvliegen zoals een geslingerde steen wegvliegt — en met die kracht te gaan rekenen, zonder verder iets aan te nemen over de aard of de oorzaak van die kracht. Dat is heel bijzonder, en ik vermoed dat hier ook een groot probleem ligt voor middelbare scholieren die met de klassieke natuurkunde kennismaken. De gouden greep gaat verder: de wereld is veel te ingewikkeld om in formules te vangen, dus is het handig om de wereld vergaand te vereenvoudigen tot eenvoudige systemen, zoals alleen de aarde (vrije val), alleen de aarde en zijn maan (o.a. getijdenwerking), of alleen Jupiter en Saternus in hun baan (onderlinge verstoring in die banen). Hoe eenvoudig zo'n systeem ook is, om eraan te kunnen rekenen had Newton nieuwe methoden nodig: de calculus. Wat er dan gebeurt is dat de alleen maar beschrijvende wetten van Kepler een gedaantevewisseling ondergaan naar de verklarende bewegingswetten van Newton. De moeilijkheid is hier dat ‘verklaren’ een bijzondere betekenis heeft: die ‘kracht’ in de wetten van Newton is een abstractie, een deus ex machina, waarvan Newton niet wil en niet kan zeggen wat het is. Hetzelfde voor ‘massa.’ De hedendaagse natuurkunde kan er wel iets over zeggen, maar volledige antwoorden zijn dat zeker niet, vermoed ik. Deze werkwijze van Newton was in zijn tijd ongehoord en revolutionair, en is het model voor veel exacte wetenschap. Alle reden dus voor de ontwerper van toetsvragen om dit goed voor ogen te hebben en te houden. Ik geef een voorbeeld van een model dat op dezelfde wijze is te zien: het tentamenmodel van Van Naerssen (1970). Dat model is een vergaande vereenvoudiging van de toetssituatie, en veronderstelt dat de student een bepaalde beheersing van de stof heeft. Over de aard of de oorzaak van die stofbeheersing zegt het model niets. Aan dit model kan worden gerekend, het kan de verschijnselen verklaren, en voorspellen.

I. Bernard Cohen (1980). The Newtonian Revolution with illustrations of the transformation of scientific ideas. Cambridge University Press. [Cohen heeft een Gids op de Principia geschreven, opgenomen bij de door hem en Anne Whitman verzorgde nieuwe vertaling van de Principia, 1999]

Robert F. van Naerssen (1970). Over optimaal studeren en tentamens combineren. Openbare les. Amsterdam: Swets en Zeitlinger, 1970 html [Ik heb uitgaande van het tentamenmodel van Van Naerssen een verdere ontwikkeling gegeven, het SPA-model, op mijn website beschikbaar, inclusief applets waarmee u zelf aan het model kunt ‘rekenen’]

“We passen nu de algemene gaswet toe op de overgang van toestand A naar toestand B” (uit een schoolboek vwo), is een formulering die verwant is aan de deterministische positie: de gaswet bepaalt de uitkomst, i.t.t. de uitkomst is te beschreven door de gaswet. De gaswet toepassen is de gaswet deterministisch opvatten. Vanuit de regelmatigheidspositie zou de woordkeuze zijn: ‘We beschrijven nu met de algemene gaswet de overgang van toestand A naar toestand B.’

juli 2009; de tekst van het boek is nog niet aangepast op bovenstaande positiekeuze

juni 2009 Deze paragraaf verkeert in beroerde vorm, terwijl het juist het paradigma bij uitstek zou moeten leveren voor het ontwerpen van toetsvragen. In 1983 had ik niet de tijd om uit te zoeken waar toch mijn gevoel vandaan kwam dat er met al die prachtige wetten die in het onderwijs worden behandeld, iets niet in orde is. Of is het de manier waarop bijvoorbeeld evolutietheorie typisch begrijpelijk wordt gemaakt voor scholieren, en dan in examens wordt getoetst of ze die uitleg (dat is nog iets anders dan de theorie zelf) hebben begrepen? Leg je de ‘bouw’ van het waterstofatoom uit door een bolletje te tekenen waaromheen een kleiner bolletje een baan heeft? (zie bijvoorbeeld Biologie voor jou, voor 6 vwo). Het zou kunnen dat het in bepaalde situaties een goed model is, zoals ook Watson & Crick een concreet model gebruikten om achter de strcutuur van DNA te komen, maar wat zijn dan die situaties? Er is dus werk aan de winkel. Denk mee, lever mij materiaal aan.

Ik zoek een verbindend concept. Dat zou bijvoorbeeld het begrip ‘versnelling’ kunnen zijn, en dan kan het volgende artikel een stepping stone zijn om de ontwerp-problematiek te verhelderen:

fit van het model met het fysische systeem. Dat is heel wat anders dan in de meeste schoolboeken gebeurt, waar op wonderlijke wijze de wereld zich precies naar de vergelijkingen van Newton etc. gedraagt. En in werkelijkheid doet de wereld dat niet, wat ieder empirisch onderzoek opnieuw laat zien. Natuurkunde reduceren tot het uitrekenen van formules is dus een diepe misvatting. Nancy Cartwright (1983) zou daaraan toevoegen dat dit natuurkundige werk vrijwel uitsluitend in het laboratorium wordt uitgevoerd, waar veel ‘storende’ invloeden buiten de laboratoriumdeur worden gehouden om de fit tussen onderzochte systemen en hun modellen op te krikken. Dat is het ceteris paribus voorbehoud; alle overige omstandigheden daargelaten, maar overige omstandigheden zijn er natuurlijk altijd wel. Deze vierslag zou in het onderwijs en dus in toetsvragen terug moeten komen: theorie — model — systeem — ceteris paribus. Natuurlijk zijn er uitzonderingen, zoals Hasok Chang (2004) laat zien voor twee eeuwen onderzoek naar temperatuur zonder dat daar een theorie voor beschikbaar was, dus evenmin een model.

Ik kan nog niet goed overzien wat de gevolgen van deze positie zijn voor het ontwerpen van toetsvragen natuurkunde, bijvoorbeeld (maar natuurlijk niet alleen natuurkunde). Misschien is het vooral een kwestie van presentatie, dus correct benoemen wat van de studenten wordt gevraagd op te lossen. Maar ik sluit niet uit dat vanuit deze gekozen positie het regelmatig kan gebeuren dat toetsvragen dubbelzinnig blijken. Onderstaande tekst is (juli 2009) nog niet aangepast aan de hierboven uitgelegde ppositiebepaling.

theorie

evolutietheorie

De verre voorouders van onze eenden hadden poten zoals die van duiven, maar hun leefgebied raakte als gevolg van klimaatverandering overstroomd. Verklaar de evolutionaire ontwikkeling van de zwemvliezen van eenden.

Asterhan & Schwarz, 2009 (p. 380-381). De auteurs gebruiken o.a. deze vraag in een onderzoek naar het veranderen van misvattingen over evolutieleer, naar de Darwiniaanse evolutieleer.

‘Geef de evolutionaire verklaring voor de ontwikkeling van de zwemvliezen van eenden.’ Dit is een erg open vraag, over een notoir lastig onderwerp, een onderwerp bovendien dat typisch is belast met diepgewortelde misvattingen. De ontwerpers van de vraag (zie de box) zijn echter buitengewoon goed voorbereid, en hebben een strak beoordelingsschema opgesteld op basis van uitvoerig onderzoek. Voor een onderwerp als dit mag zo'n investering wel worden gedaan, en hij is gelukkig maar een keer nodig. Ik vat het beoordelingsschema, inclusief puntentoekenning, kort samen in de volgende box.

evolutie verklaard? (vv. bovenstaande box)

0, 1 punt: geen antwoord gegeven, of het antwoord gaat niet over de verandering
2 punten: wel verandering in de tijd genoemd, maar niet hoe of waarom
3 punten: de verandering verklaard als verandering van (alle individuele exemplaren van) de soort
4 punten: de druk van de omstandigheden leidt tot meer variabiliteit binnen de soort; die ‘andere’ individuen slagen erin te overleven en zich voort te planten
5 punten: er bestaat variatie binnen de soort; bepaalde varianten blijken dan betere voortplantingskansen te hebben waardoor de kenmerken van de soort op de lange duur veranderd blijken.

Asterhan & Schwarz, 2009 (p. 380-381). NB: dit beoordelingsschema past bij het onderzoek van de auteurs, het is niet gezegd dat dit ook voor een biologie-examen een goed schema is, maar het is een mooi voorbeeld van wat hier een goed beredeneerd beoordelingsschema kan zijn.

Het beoordelingsschema in bovenstaande box is kort te kenmerken op aanwezigheid van: verandering (2 punten), die bovendien verklaard is (3 punten); door selectie (4 punten); op basis van de variatie binnen de populatie (5 punten). Nu functioneerde deze vraag in een wetenschappelijk onderzoek naar het effect van gezamenlijk in dialoog proberen de vraag goed te beantwoorden, er is daarom over het leerproces en de resultaten ervan veel bekend. Bovendien is dat gerelateerd aan theoretische kaders die relevant zijn voor dit soort lastige onderwerpen waar ook gewone onderwijsprogramma’ mee zijn beladen. Een opmerkelijk resultaat uit hetzelfde onderzoek is bijvoorbeeld dat de proefpersonen niet geweldig consistent waren in hun begrip van evolutietheorie: goed beantwoorden van het ene probleem ging niet altijd samen met eveneens goed beantwoorden van het andere. Tenslotte nog dit. Bij evolutietheorie zitten misvattingen in de weg, bijvoorbeeld de lamarckiaanse idee dat de veranderingen op individueel niveau plaatsvinden (3 punten waard in bovenstaand schema); in een didactische theorie moet daar aandacht voor zijn, nog los daarvan of de theorie van Lamarck op zich ook tot de stof behoort.

Een wet of een theorie zoals in het tekstboek is een ding, zoals het door de lezer is begrepen is een ander ding. Op de een of andere manier heeft de lezer zich een begrippenschema gevormd voor die wet of theorie. Voor de evolutietheorie zou zo'n schema eruit kunnen zien als in de figuur. Een rechtstreekse toetsvraag kan zijn om een conceptueel schema voor de evolutietheorie te tekenen. De voorbereide student moet daar geen moeite mee hebben. Betere vragen zijn die naar een evolutietheoretische verklaring voor een gegeven casus, zoals hoe het zit met de zwemvliezen van eenden. Ieder van de relaties binnen zo’n relationeel schema, voorzover in overeenstemming met de theorie, leent zich voor het ontwerpen van vragen op deelonderwerpen; de ontwerper die vermoedt dat studenten onvolledige of deels onjuiste conceptuele schema’s kunnen hebben, kan daar vragen op ontwerpen.

"Thus we have, for example, Watson and Crick's original sheet metal and cardboard model of DNA, Rutherford's solar system model of atoms, the Bohr model of the atom, and the de Sitter model of space-time. There are also equilibrium models in economics and drift models in evolutionary biology. I think it is possible to understand scientific models in a way that usefully encompasses much of this heterogeneity." [mijn nadruk, b.w.]

Giere, 2006, p. 63

Het ontwerpen van toetsvragen rond bijvoorbeeld natuurkundige wetten is niet lastig of problematisch. Het sterk geformaliseerde karakter van deze relaties, het nauwe verband tussen (theoretische) relatie en (concrete) verschijnselen en een lange traditie in het formuleren en gebruiken van vragen dragen daar alle toe bij. Voorbeelden van toetsvragen zijn voor de docenten uit deze vakgebieden zo vanzelfsprekend dat ik ze hier niet nog eens hoef te geven. Ik zal niettemin toch enkele voorbeelden uitwerken, omdat het voor docenten uit in dit opzicht minder bevoorrechte vakgebieden toch aardig is om te zien hoe een wat strakkere formalisering het ontwerpen van toetsvragen makkelijker maakt.

Mag het schrijven van toetsvragen hier dan al min of meer vanzelfsprekend zijn, dan neemt dat toch niet weg dat er wel een risico bestaat dat de vragen die de docent gewoon is te gebruiken een zekere eenzijdigheid hebben, dat bepaalde aspecten van de leerstof onvoldoende of in het geheel niet in de toetsvragen terugkomen. Er zijn ook enkele vraagmogelijkheden, zie 6.3 en 6.4 (analyse en inferentie) en hoofdstuk 7 (bedenken en oplossen van problemen).

Er zitten heel wat aspecten aan een enkele wetmatige relatie (verder wet genoemd). Wetten zijn nogal eens genoemd naar hun 'ontdekker' en/of hebben een speciale benaming zoals 'eerste hoofdwet van de thermodynamica'. De wet is in verbale vorm weer te geven, zoals stellingen in de wiskunde, en in symbolische (meestal een wiskundige) vorm. De meeste wetten betreffen relaties tussen twee of meer theoretische begrippen. De afleiding van de wet is van belang; afleiding uit andere wetten, uit empirische waarnemingen of de historische ontwikkeling. Toepassingen van de wet zijn het meest interessant, ook in het onderwijs, en dat onderwerp vergt een afzonderlijke uitwerking. Dan zijn er de relaties tot andere wetten binnen een en dezelfde theorie en de toepassingen door het combineren met andere wetten. En tenslotte de plaats die de wet binnen de theorie in haar geheel inneemt en hoe zij afhangt van bepaalde veronderstellingen waarop de theorie gebouwd is.

Newton's tweede bewegingswet. De naam geeft de opsteller van de wet de eer die hem toekomt en geeft het karakter van de wet aan. De wet luidt dat de netto kracht die op een lichaam inwerkt proportioneel is aan de massa van het lichaam en aan zijn versnelling, waarbij de richting van de kracht gelijk is aan de richting van de versnelling. De wet relateert aan elkaar: kracht, massa en versnelling (werkend op, resp. van een lichaam), en is zo te verstaan dat de versnelling van het lichaam volgt uit de netto kracht die op het lichaam inwerkt.

De algebraïsche formulering van de wet is

kracht = massa * versnelling, in symbolen: F = ma.

De vergelijking ziet eruit als een algebraïsche, maar dat is niet helemaal correct: verondersteld is dat de grootheden in bij elkaar passende eenheden zijn, bv. de kracht in newtons (N), de massa in kilogrammen (kg), en de versnelling in meters per seconde-kwadraat (m / s²). Bij bewerkingen op de formule F = ma is het verstandig daarbij de eenheden ook 'mee te nemen'.
Voor de afleiding van de wet zie Newton zelf (Principia, volume 1, The motion of bodies) of leid de wet af uit waarnemingen in een laboratoriumexperiment, enz.

Toepassingen komen straks afzonderlijk ter sprake.

Er zijn o.a. verbanden met de eerste en derde bewegingswet, en met Newtons wet van de universele zwaartekracht.

De wet veronderstelt niet dat luchtweerstand te verwaarlozen is, dat is een van de krachten die de netto kracht bepalen. De wet veronderstelt dat het lichaam rechtlijnig beweegt wanneer er geen netto kracht op inwerkt. Newton presenteerde zijn bewegingswetten overigens als 'axiomata of bewegingswetten,' en in het Latijn 'Mutationem motis proportionalem esse vi motrici impressae, et fieri secundum lineam rectam qua vis illa imprimatur.'

juni 2009 Het bovenstaande is geen goede behandeling van natuurkundige wetten. Ik heb in 1983 geen tijd genomen hier meer werk van te maken. Voor de herziening moeten andere naïeve natuurkundige opvattingen (of Aristotelische, zie Dijksterhuis 1951) en mental models (Champagne, Gunstone an Klopfer 1985) aan de orde komen, plus het ook door Dijksterhuis aangegeven extreem abstracte karakter van deze wetten. Wat dat laatste betreft gaat zich dan de moeilijkheid voordoen dat van deze abstracte hoofdwetten geen concrete experimentele onderzoeken als 'bewijsplaatsen' voorhanden zijn. Op zich klinkt dat misschien verrassend, maar het is in wezen hetzelfde probleem als bij het intelligentie-begrip eerder al oppervlakkig is aangeduid (hoofdstuk 3). Brian Ellis (1965) en Norwood Russell Hanson (1965) brengen chirurgisch nauwkeurig de problemen aan het licht, voor de eerste bewegingswet van Newton, maar daarmee dus ook voor de tweede en derde. Cartwright (1991) neemt ook F=ma onder het mes (kun je zeggen dat luchtweerstand een kracht is in de zin van F=ma? Nee dus), en generaliseert dat naar wetenschappelijke ‘wetten’ in andere disciplines. Er blijft dan van al die ‘wetten’ weinig heel; de winst van de analyse van Cartwright is dat het duidelijk wordt dat wetenschappen vooral veel kennis hebben vergaard die lokaal geldig is, kennis die niet versierd is met het label ‘wet’, maar bescheidener is aangeduid. Zo noemt Elster (1999) als voorbeeld dat we tal van mechanismen kennen die gebeurtenissen achteraf prima verklaren, maar die onbruikbaar zijn om er voorspellingen mee te doen. Dit alles is van eminent belang voor het onderwijs, want wat daar aan bijvoorbeeld natuurkunde of biologie wordt gepresenteerd, en dus ook getoetst, heeft met de wereld van wetenschap niet veel meer te maken. Maar dat gaf Newton al aan: zijn bewegingswetten zijn eerder axioma’s dat rekenformules. Ze toch als rekenformules gebruiken in speelgoedproblemen geeft niet echt een adequaat beeld van wat natuurkunde is, niet?

Verklaar waarom natuurkunde in het programma voor voortgezet onderwijs is opgenomen.

Niemand kan deze eenvoudige vraag sluitend beantwoorden (zoals we dat helaas in het onderwijs gewend zijn te doen, maar waarom eigenlijk?). Waarom is dat zo? Wie historisch onderzoek doet, zal wel enkele mechanismen (Elster, 1999) kunnen bedenken en aannemelijk maken hoe het zover heeft kunnen komen, en waarom in de bepaalde vorm die het vandaag de dag nog steeds heeft.

Welke krachten werken er op een vallend bankbiljet, if any?

Daar kunnen we niets over zeggen. Met een bankbiljet samengeperst tot een rond bolletje en vallend in een vacuumbuis gaat dat al beter, maar bankbiljetten plegen niet in vacuum te vallen, of zich in kogeltjes te veranderen. Zie voor dit probleem: Cartwright (1991).

Er zijn talrijke vraagmogelijkheden die betrekking hebben op deze verschillende aspecten, naast de toepassingen; maar dat zijn precies de vraagmogelijkheden in hoofdstuk 4

Met wetmatige relaties zijn verschijnselen te verklaren of te voorspellen. Speciale vormen van voorspellen zijn: het schatten of berekenen van gevraagde onbekende grootheden en het opstellen van hypothesen en/of het ontwerpen van een onderzoek opzet. Een bijzondere vorm van verklaren waar de student nog wel eens mee te maken krijgt: verklaren waarom een onderzoeker een bepaalde onderzoek opzet kiest of een bepaalde handeling verricht. Vat dat niet op als een psychologische vraag over de onderzoeker: bedoeld is dat de student verband legt tussen de acties van de onderzoeker en bekende wetten in dat vak, dat hij kan formuleren wat de werkhypothese van een ander is).

De voor de hand liggende 'toepassingsvragen' zijn nu:

de eerste drie mogelijkheden heb ik afgeleid van de 'methode van Newton' zoals door Bernard Cohen (1980) beschreven. Het is een eerste kleine stap naar een meer volledige behandeling van de ontwerpmogelijkheden die horen bij het onderwijs in de natuurkunde, maar niet alleen de natuurkunde.

Geef een voorbeeld van toepassing van de tweede bewegingswet van Newton.

Antwoord. Op een lichaam met een massa van 1 kilogram werkt een netto kracht van 1 Newton. De versnelling is dan
a = F / m = 1 N / 1 kg = 1 m / s².

Het gegeven antwoord is niet meer dan een beschrijving van de wet in haar theoretische termen. Is het de bedoeling dat de student een voorbeeld geeft uit het dagelijks leven in concrete termen, vraag dat dan ook.

Een auto met een massa van 1000 kg verhoogt zijn snelheid in 5 seconden van 15 m/s tot 20 m/s. Welke netto kracht oefent dit uit op de auto?
Hint: Bereken eerst de versnelling, en gebruik dan Newtons tweede bewegingswet.

Het aantal vraagvarianten voor de tweede bewegingswet van Newton is eindeloos, en daar komen dan nog de varianten bij die ontstaan door combinatie met andere wetten (combinaties waarmee de student door uitgebreide oefening ook vertrouwd is geraakt).

Bij deze toetsvragen over wetten is het van belang zicht te houden op de afstemming van het gevraagde op de doelen. Wanneer het uitvoeren van wiskundige bewerkingen in de doelen een ondergeschikte plaats bekleedt, is het zaak de toetsvragen zo te ontwerpen dat wiskundige bewerkingen daarin geen extra moeilijkheidsfactor vormen. Dat heeft ook pragmatische betekenis: wanneer berekeningen tijdrovend zijn en slechts van marginaal belang voor de onderwijsdoelen valt er een hoop toetstijd op betere manier te besteden dan door berekeningen te vragen. Het zijn niet alleen opgaven rond natuurkundige wetten die vatbaar zijn voor rekenkundige 'overkill', dat kan ook maar al te gemakkelijk gebeuren bij de vakken statistiek en methodologie in de sociale wetenschappen. Zoek een goede balans in de toetsvragen en de verschillende al eerder genoemde aspecten: formuleren van het probleem, vertalen van het probleem, keuze van toepasselijke wetten bij het gegeven probleem, wiskundige bewerkingen om de (een) oplossing te verkrijgen. Wanneer het mogelijk is toetsvragen zo te schrijven dat ze op een of twee van deze aspecten zijn toegespitst, dan heeft dat voor de toetsing grote voordelen. Dan komt het niet meer voor dat een grote opgave fout is alleen omdat in de vertaling van het probleem een vergissing is gemaakt.

Varianten op een zelfde opgave ontstaan door in de opgave gegevens op te nemen die niet ter zake zijn, door de probleemformulering concreter dan wel abstracter te maken, waardoor de student meer dan wel minder moeite moet doen om probleem in exacte begrippen te vertalen. Een mogelijkheid tot variëren ligt in het aanbieden van te weinig gegevens, met de opdracht aan de student om zelf te vragen om extra gegevens die nodig zijn (bijv., bij juridische casus, bij medische diagnostiek). Denk ook aan de invloed van impliciete context op de moeilijkheid van de opgaven: tijdens het onderwijs zijn de opgaven nogal direct gekoppeld aan het hoofdstuk, waarmee impliciet gegeven is welke wetten waarschijnlijk toepasbaar zijn. Wanneer in een eindtoets opgaven van hetzelfde soort voorkomen, kunnen die veel moeilijker blijken te zijn omdat die impliciete context dan is weggevallen.

Wat de te gebruiken vraagvormen betreft, zal het duidelijk zijn dat hier bij uitstek open vragen zoals de opstelvraag en de aanvulvraag passen. De meerkeuzevraag is soms bruikbaar, bv. de vraag welke wet toepasbaar is op een gegeven probleemstelling waar de goed geïnformeerde student kiest uit een kleine set van alternatieven. Dan zijn diezelfde alternatieven te gebruiken voor een meerkeuzevraag.
Omdat vragen rond wetten en relaties al snel het karakter van problemen krijgen, is er een soepele overgang van deze paragraaf naar hoofdstuk 7 over het stellen van problemen

verdieping

1. Zijn de wetten van Newton waar?

2. Zijn de wetten van Newton universeel waar?

Een beredeneerd antwoord op beide vragen is te vinden in Nancy Cartwright (1999).The dappled world. A study of the boundaries of science (35-68). Cambridge University Press. (zie bijv. p. 48)

De bewegingswetten van Newton zijn waanzinnig abstract, daar zijn wetenschapsfilosofen het met elkaar wel over eens. Niemand die ooit een kracht heeft gezien, of weet wat bijvoorbeeld zwaartekracht is. Toch borrelen schoolboeken over van de sommetjes die met F=ma schijnbaar zo makkelijk zijn te maken. Wordt leerlingen hier een rad voor ogen gedraaid? Wie bekend is met het werk van Nancy Cartwright, zoals haar (1999), zal zich afvragen of haar werk direct van belang is voor de ontwerper van, bijvoorbeeld, opgaven natuurkunde. Mijn antwoord op die vraag is bevestigend. Het springende punt is, zover ik nu (juni 2009) kan overzien, dat abstracte wetten zoals die van Newton alleen betekenis hebben in laboratorium-situaties die zo zijn ingericht dat de wetten daar inderdaad gelden. OK, het zonnestelsel is ook zo'n laboratorium-situatie: het stelsel is door astronomische afstanden van de dichtsbijzijnde sterren afgeschermd van invloeden van ‘buitenaf’, althans invloeden sterk genoeg om enig effect op planetenbanen te hebben. In het laboratorum zijn we heel knap in het in overeenstemming brengen van de gebeurtenissen met de wetten, en bovendien lukt het vaak om laboratorium-achtige omstandigheden te exporteren in de vorm van artefacten zoals machines, computers, batterijen etcetera die netjes in overeenstemming met de daarvoor toepasselijke wetten werken. Maar buiten die machines om, leven we in een wereld waar de wetten van Newton niet universeel geldig zijn (hoe zouden we zoiets immers kunnen weten?). Kijk, die stand van zaken moet de ontwerper van toetsvragen bescheiden maken. Het probleem is dan dat wetenschappers in de regel die bescheidenheid niet hebben, zoals natuurkundigen die uitgaan van universele geldigheid van de wetten van Newton. Leraren natuurkunde valt dan niet te verwijten dat zij dat wetenschappelijk fundamentalisme, zoals Cartwright het noemt, volgen. Het onderwijsprogramma zou interessanter, en minder misleidend zijn, als er een beetje bescheidenheid zou zijn. Toetsvragen over F=ma zijn bij voorkeur realistisch in de zin dat ze in beginsel in de gegeven vorm als laboratoriumproef zijn uit te voeren. En inderdaad, opgaven met ballen, veren, en katrollen zijn proefjes. Maar is dat natuurkunde, of is dat eigenlijk techniek, en waarom het dan ook niet zo noemen? Natuurkunde is een interessant voorbeeld vanwege reus Newton, maar ook andere disciplines hebben zo hun wetten, of maken gebruik van die uit de natuurkunde. Neem mijn eigen vak, psychologie: het afnemen van een psychologische test is toch zoveel mogelijk gelijk aan een laboratoriumproef, maar als dat zo is, wat is dan de ecologische validiteit van whatever it is dat die test op dat moment onder die omstandigheden pretendeert te meten? En is een examen wezenlijk anders, dan? Geen wonder dat paragraaf 2.6 over validiteit van toetsvragen zo waanzinnig uitgebreid is en vooral multidisciplinair. De life sciences zitten helemaal in een spagaat tussen de chaotische werkelijkheid waarin wij dagelijks leven, en de ordelijkheid van het laboratorium. Een lichaamscel is in zekere zin een laboratorum op zich, netjes afgeschermd van invloeden van buitenaf, waarin de razend complexe processen ordelijk verlopen. Maar we kennen niet de exacte parameters van een willekeurige cel, en weten dus niet voor een willekeurige cel hoe de processen daar verlopen. Trudy Dehue laat zien hoe de spagaat uitwerkt in het geval van alles dat op een of andere manier het label ‘depressie’ krijgt opgedrukt (2008, De depressie-epidemie. Amsterdam: Augustus). Kortom: hoe gaat de ontwerper van toetsvragen om met deze spanning tussen de slonzige wereld—the dappled world—en het opgeruimde laboratorium, moet de ontwerper partijdig zijn, of maar net doen of haar neus bloedt?

De uitzondering is mogelijk het gedachtenexperiment; toch benieuwd wat Nancy Cartwright denkt van gedachtenexperimenten.

5.6 Literatuur

Christa S. C. Asterhan & Baruch B. Schwarz (2009). Argumentation and explanation in conceptual change: Indications from protocol analyses of peer-to-peer dialog. Cognitive Science, 33, 374-400.

Douglas Allchin (2009). Teaching science lawlessly. University of Minnesota: History of science and technology Spring colloquium 2009, paper. http://www.tc.umn.edu/~allch001/papers/lawless.htm gezien 7-2009

Douglas Allchin (1999). How school science lies. 5th International History, Philosophy and Science Teaching Conference, Como-Pavia. http://www.tc.umn.edu/~allch001/papers/lies.pdf gezien 7-2009 H. L. Bakels (Red.). Nederlands recht in kort bestek. Deventer: Kluwer, 1971.

Benjamin S. Bloom, J. Thomas Hastings and George F. Madaus (Eds) (1971). Handbook on formative and summative evaluation of student learning. London: McGraw-Hill.

Nancy Cartwright (1991). Fables and models. Proceedings of the Aristotelian Society, Supplementary volume 65, 55-68. Reprinted in Cartwright (1999) as chapter 2.

Nancy Cartwright (1999).The dappled world. A study of the boundaries of science (35-68). Cambridge University Press.

Audrey B. Champagne, Richard F. Gunstone and Leopold E. Klopfer (1985). Instructional consequences of students' knowledge about physical phenomena. In Leo H. T. West and A. Leon Lines: Cognitive structure and conceptual change (pp. 61-90). Academic Press.

Hasok Chang (2004/2007). Inventing temperature. Measurement and scientific progress. Oxford University Press.

I. Bernard Cohen (1980). The Newtonian Revolution. With illustrations of the transformation of scientific ideas. Cambridge University Press.

Hans F. M. Crombag, J. L. de Wijkerslooth en E. H. van Tuyll van Serooskerken (1972). Over het oplossen van casusposities. Groningen: Tjeenk Willink.

Eduard Jan Dijksterhuis (1950). De mechanisering van het wereldbeeld. Amsterdam: Meulenhoff.

Brian Ellis (1965). The Origin and Nature of Newton's Laws of Motion. In R. G. Colodny. Beyond the edge of certainty. Essays in contemporary science and philosophy (pp. 29-68). University Press of America.

Jon Elster (1999). Alchemies of the mind. Rationality and the emotions. Cambridge University Press.

Paul Feyerabend (1993/2008) Tegen de methode. Nieuwe editie, uitgebreid en volledig herzien door de auteur. Vertaald door Marjolein Stoltenkamp. Met een inleiding van André Klukhuhn en Rein Gerritsen. Lemniscaat.

Flynn, James R. (2007/2009). What Is Intelligence? Beyond the Flynn Effect. Cambridge University Press.

Jeremy E. C. Genovese (2002). Cognitive skills valued by educators: Historical content analysis of testing in Ohio. The Journal of Educational Research, 96, 101-114. [ik heb dit artikel nog niet in zijn geheel kunnen zien. 1e pagina]

Ronald N. Giere (1988). Explaining science, a cognitive approach. London: University of Chicago Press.

Ronald Giere (1995). The skeptical perspective: Science without laws of nature. In Friedel Weinert: Laws of nature. Essays on the philosophical, scientific and historical dimensions. (120-138) Walter de Gruyter.

Ronald N. Giere (2006). Scientific perspectivism. The University of Chicago Press.

Norwood Russell Hanson (1965). Newton's First Law: A Philosopher's Door into Natural Philosophy. In R. G. Colodny. Beyond the edge of certainty. Essays in contemporary science and philosophy (pp.6-28). University Presss of America.

Carl G. Hempel (1952/1972). Fundamentals of concept formation in empirical science. London: The University Of Chicago Press, 1972.

H. Hulshof & H. N. Klomp (1979). Training in grammaticale analyse. Zeist: Uitgeverij NIB.

A. Leen (1961). De ontwikkeling van het rekenonderwijs op de lagere school in de 19e en het begin van de 20ste eeuw. Groningen; Wolters. Proefschrift Vrije Universiteit Amsterdam.

J. de Miranda (1955). Verkenning van de 'Terra Incognita' tussen practijk en theorie in middelbaar (scheikunde-) onderwijs. Wolters. Proefschrift RU Utrecht.

E. A. Murphy (1976). The logic of medicine. London: Johns Hopkins University Press.

Norman Schwartz (1985). The concept of physical law. Cambridge University Press.

Norman Schwartz (1995). A Neo-Humean perspective: Laws as regularities. In Weinert (1995, pp. 67-91).

Robert E. Slavin and Cynthia Lake (2008). Effective programs in elementary mathematics: A best-evidence synthesis. Review of Eduational Research, 78, 427-515. pdf [retrieved 11-2008]

Catherine Sophian (2007). The origins of mathematical knowledge in childhood. Lawrence Erlbaum.

Friedel Weinert (Ed.) (1995). Laws of nature. Essays on the philosophical, scientific and historical dimensions. Walter de Gruyter. contents

D. W. Braithwaite & R. L. Goldstone (2015). Effects of variantion and prior knowledge on concept learning. Cognition and Instruction, 33, 226-256. download

What Braithwaite & Goldstone call ‘concepts’ really are laws in economics: conservation of energ in physics; supply and demand; combinations and permutations in statistics. Does that distinction make a difference? Laws are relations between concepts. B&G call them the ‘underlying structure&rsquo! Looks like a category mistake to me: rules mistaken for concepts. Does it affect the research as reported? Let’s see.

E. J. Lowe (2006). The four-category ontology. A metaphysical foundation for natural science. Oxford University Press. isbn 9780199254392 info

Toetsvragen ontwerpen

Handreiking bij het maken van toetsvragen over de leerstof

5. Toetsvragen over relaties tussen begrippen

Ben Wilbrink