Verplichte rekentoets vo — een goed idee?


Werkdocument

Ben Wilbrink

pro memorie: actuele pagina’s


Actuele gebeurtenissen kunnen soms razendsnel gaan, zoals de politieke ontwikkelingen sinds najaar 2013 over de referentieniveaus en over de rekentoets in het bijzonder. Zie voor actuele stukken op mijn thuispagina onder het menu ‘actueel’.




‘Bosker’: de rekentoetsen 2F en 3F deugen niet


Commissie-Bosker (28 mei 2014 openbaar gemaakt). Advies over de uitwerking van de referentieniveaus 2F en 3F voor rekenen in toetsen en examens. pdf; of met aanbiedingsbrief van de bewindslieden hier op te halen html.



Het rapport van de ministeriële Commissie-Bosker is na de aanbieding aan staatssecretaris Sander Dekker enkele dagen onder de staatssecretariële pet gehouden, tot Roel Bosker zijn aanbiedingsbrief rond had. Er zijn wel meer opmerkelijke zaken rond deze commissie, zoals het ronduit politieke advies om toch vooral door te gaan met deze rekentoetsen. Ik vraag mij dan hardop af of deze commissie en/of de voorzitter wel in onafhankelijkheid heeft kunnen werken. Immers, het al dan niet doorgaan met deze rekentoetsen is onderwerp van algemeen overleg tussen de Tweede Kamer en de staatssecretaris, en in het laatste AO in november 2013 was evident de steun voor doorgaan met de rekentoetsen beperkt tot de VVD en de PVV. Ik begrijp ook niet hoe de commissie/voorzitter op het idee heeft kunnen komen om op de zetels van de Tweede Kamer plaats te nemen, en een meerderheid in het parlement zo te bruskeren. Los van de politieke blunder: hoe is het in godsnaam mogelijk dat de commissie/voorzitter concludeert dat er vooral moet worden doorgegaan met deze rekentoets, zonder dat de commissie heeft onderzocht of referentieniveaus rekenen wel voldoende basis hebben in relevante wetenschappelijke disciplines, en onderzocht of heel deze onderneming wel enige behoorlijke relatie heeft met het basisprobleem van de bij de PPON 2004 geconstateerde enorme terugval in basale rekenvaardigheid (sindsdien is geen noemenswaard herstel van die terugval in basisvaardigheid ingetreden). Ongeloofwaardig.

Sprak de voorzitter misschien op eigen gezag? De formulering in het rapport zelf:

Voorgaande neemt niet weg dat de commissie voorstelt om ernaar te streven, de invoering van de rekentoetsen en coe’s volgens planning door te laten gaan.

Het wonderlijke in de geciteerde passage is dat deze moeilijk valt te rijmen met de overige conclusies van de commissie: hoe is het mogelijk om met ondeugdelijke rekentoetsen de invoering ervan ‘volgens planning’ door te laten gaan? Deze context deugt evenmin. Ik merk tenslotte op dat de voorzitter in zijn aanbiedingsbrief nadrukkelijk vermeldt — in afwijking van de tekst in het rapport zelf — dat deze zo omstreden aanbeveling om ernaar te streven de invoering volgens planning door te laten gaan unaniem is gedaan. Ik ben zo vrij om daaraan te twijfelen, omdat ik niet vermag in te zien hoe een commissielid in redelijkheid zich achter deze aanbeveling zou kunnen scharen.


Van het een komt het ander: waarom hebben bewindslieden ervoor gekozen om de voorzitter van de Adviesraad voor primair onderwijs van het Cito (zie http://www.rug.nl/staff/r.j.bosker/, geraadpleegd 31 mei 2014) te vragen het voorzitterschap van deze commissie op zich te nemen? Ik geef onmiddellijk toe dat in een klein land als Nederland het lastig kan zijn om toetsdeskundigen te vinden die geen belangen hebben bij een van de instituten die betrokken zijn in het proces leidend tot de rekentoetsen zoals we die nu kennen, maar er zijn zeker testpsychologen te vinden die voldoende onafhankelijk zijn.


Een politieke analyse is best nuttig en nodig, maar het gaat mij natuurlijk om de inhoudelijke kanten van de kwestie: het ontwerp van toetsvragen, de samenstelling van toetsen, op welke manier de toetsresultaten in enige besluitvorming zitten, wat van een en ander de testpsychologische verdiensten en tekorten zijn, wat dit alles met onderwijs heeft te maken en dan vooral met verschillen in opvattingen over onderwijs, en zo kan ik nog wel even doorgaan. Want het gaat over rekenen: wat is dat, waar is het voor nodig, hoe erg is het om hier tekorten te hebben, zowel voor individuen als voor de samenleving in zijn geheel, in economisch opzicht ook. Het is een uitdaging om het rapport van de commissie-Bosker vanuit mijn bevooroordeelde wetenschappelijke optiek van aantekeningen te voorzien die mogelijk kunnen helpen in het verdere traject van deze rekentoetserij.


Mijn eerste reacties op Twitter


Kamerbrief 13 juni 2014, resultaten afname maart 2014 van de rekentoets:


Deze tekst is 16 juni aangeboden aan de onderwijscommissie van de Tweede Kamer. Ook op 16 juni ter info aan Cito (Peter Hermans). Op 19 juni aangeboden aan de bewindspersonen van OCW Mw Bussemaker en Hr Dekker, en aan het College voor Examens, de heren Laan en Van Lonkhuyzen. Eveneens op 16 juni aangeboden aan de NRC die na aarzeling afzag van publicatie. Het gaat ons evenwel niet om publicatie, maar van belang is dat er iets wordt gedaan met deze informatie.

Dit artikel is ook beschikbaar als pdf, en is tevens geplaatst op de website van Didactief, en door Paul Kirschner als blog1, en nogmaals als blog2.
Het oorspronkelijk langere concept staat hierbeneden.
Ondertussen is dit artikel verplaatst naar hier.


Met die contexten toetsen wij geen rekenen maar vermogen tot (zelf)ontdekkend leren


Ben Wilbrink en Paul Kirschner 16 juni 2014


De staatssecretaris wil doorgaan met rekentoetsen bij eindexamens vo en mbo. Maar deze toetsen geen rekenen, dat mag bij deze toetsen immers met de rekenmachine! Wat toetsen ze dan wel? De Commissie-Bosker heeft deze vraag niet beantwoord.

Voorbeeldrekentoetsen op de Cito-site laten zien dat kandidaten tientallen problemen ‘uit het dagelijks leven’ krijgen. Achterliggende gedachte is dat op school alleen maar leren rekenen niet garandeert dat men later die rekenvaardigheid ook werkelijk kan gebruiken. Dat klopt. Er is geen garantie; maar is dat erg? Nee, want na school gaat het leren natuurlijk door. Maar voorwaarde hiervoor is dus dat de algemene schoolse kennis überhaupt opgedaan is. Kirschner, Sweller en Clark hebben in meerdere artikelen duidelijk gemaakt dat om problemen in het rekenen op te kunnen lossen, je moet kunnen rekenen! In Didactief: “ . . . we kunnen van leerlingen alleen effectieve wiskundige probleemoplossers maken als we ze voeden met grote hoeveelheden wiskundige schema’s [lees: eerst goed leren rekenen], kennis en op wiskundige problemen gerichte strategieën”. Die kennis toepassen ‘in situaties uit het dagelijkse leven’ is nog een lastige opgave. In de psychologie heet dat het probleem van transfer, in feite gewoon voortgezet leren.


Rekentoetsen met ‘situaties uit het dagelijks leven’ testen het vermogen om te leren: opgedane rekenvaardigheid zo aanpassen dat de contextopgaven zijn te maken. Omdat kandidaten zelfstandig werken is het leren hier (zelf)ontdekkend leren. Is het vermogen tot dit soort leren een legitiem (reken-)onderwijsdoel? Wij menen van niet. Is een test hiervan dan een legitiem eindexamenonderdeel? O.i. zijn dit vragen die dringend antwoord behoeven. De Commissie-Bosker geeft dat antwoord niet, staatssecretaris Dekker evenmin. Ons voorstel is nu een expert opinion te vragen vanuit de psychologie; denk aan wetenschappers als Borsboom, Van der Maas, Taatgen, Zwaan, Kirschner. Laat de staatssecretaris opdracht geven voor degelijk experimenteel cognitief-psychologisch onderzoek naar de aard van de kennis en vaardigheden nodig bij contextrekenopgaven.

Er zijn al spijkerharde gegevens. Het Cito rapporteerde foutenanalyses havo en vwo. Het College voor Examens (CvE) rapporteerde testresultaten van examenkandidaten 2014 (in percentages voldoende): BB 38,4, KB 39,2, GL/TL 54,9, havo 45,3, vwo 87,6. Havo en vwo verschillen veertig procentpunten. Dat verschil kan door allerlei reparaties van de Commissie-Bosker wel iets veranderen, maar zal blijven bestaan zolang deze rekentoets meer test op intellectuele capaciteiten dan op rekenvaardigheden. Rekenvaardigheid toetsen kan best, en goedkoop, zoals de rekentoets-3S van de Commissie-Van de Craats.

Om voor havisten de lat dan maar te laten zakken zou een erkenning zijn dat deze rekentoets een intelligentietest is. Pikant is dat het CvE de lat voor de vmbo-opleidingen nu al op verschillende hoogten legt voor dezelfde rekentoets-2F.

Rekenen is geen raketwetenschap. Deze rekentoets moet doeltreffend zijn voor te bereiden, anders deugt er iets fundamenteel niet. Bij doeltreffende voorbereiding hebben kandidaten ongeveer dezelfde slaagkansen. Maar dan moeten gemiddelde resultaten van havo en vwo aan elkaar gelijk zijn! Zolang daar licht tussen zit — nu 40 procentpunten — is dat een harde aanwijzing dat de rekentoetsen niet valide zijn. Leraren kunnen hun leerlingen er evident niet op voorbereiden. We moeten willen weten waar hem dat precies in zit, maar de Commissie-Bosker heeft de vraag niet gesteld. Toch is het een kwaliteitseis (#1.8 in de Standards for Educational and Psychological Testing) het cognitief opereren van de kandidaten te kennen, met wetenschappelijke onderbouwing en al. Als Cito en CvE hier in gebreke blijven, moet er langs andere wegen aan worden gewerkt.

Contextopgaven kunnen een zo grote mentale belasting opleveren dat de informatieverwerking de bottleneck vormt. Veel kandidaten slagen er te vaak niet in om alle informatie goed te verwerken (46 procent scoort onvoldoende). Een simpele les uit de cognitiewetenschap leert ons dat het werkgeheugen van de mens zeer klein is. Hoewel wetenschappers geen exact getal kunnen geven menen zij dat als het om nieuwe informatie gaat, dat het 4 of 5 eenheden informatie bevat. Ook na de maatregelen van de Commissie-Bosker bestaan de rekentoetsen nog steeds uit contextopgaven, met een grote mentale belasting. Op zich hoeft dat voor een examen geen probleem te zijn. Maar een blijvende kloof in slaagpercentage havo-vwo betekent dat deze rekentoetsen te sterk verschillen in mentale belastaarheid meten. Wat we nu graag precies willen weten, kwalitatief als kwantitatief: op welke manieren leveren deze contextopgaven mentale belasting op. Hoeveel informatie moet tegelijk verwerkt worden, en is dat ook voor goede rekenaars in feite niet te veel? Dit zijn niet zulke lastige vragen, en er is passende onderzoekliteratuur beschikbaar.

Hoe meer expertise, des te beter de kandidaat lastige opgaven aan kan. Maar zijn de contexten telkens nieuw, dan is er op dat punt geen expertise om op terug te vallen. Persoonlijke verschillen in geheugencapaciteit maken de ene kandidaat kwetsbaarder voor overlading van het werkgeheugen dan de andere. Al met al geen wonder dat de scores op deze rekentoetsen zo laag zijn, met zo’n groot verschil tussen havo en vwo.


Ben Wilbrink is onderwijsonderzoeker, Paul A. Kirschner is hoogleraar Onderwijspsychologie aan de Open Universiteit.



Relevante publicaties van auteurs en genoemde onderzoekers

D. Borsboom & K. A. Markus (2013). Truth and evidence in validity theory. Journal of Educational Measurement, 50(1), 110-114. [Special Issue: Validity]
http://onlinelibrary.wiley.com/doi/10.1111/jedm.12006/abstract

D. Borsboom, G. J. Mellenbergh & J. H. van Heerden (2004). The concept of validity. Psychological Review, 111, 1061-1071.
http://goo.gl/eIhwGL

H. L. J. van der Maas, D. Molenaar, G. Maris, R. A. Kievit & D. Borsboom (2011). Cognitive psychology meets psychometric theory: on the relation between process models for decision making and latent variable models for individual differences. Psychological Review, 118, 339-356.
http://psycnet.apa.org/?&fa=main.doiLanding&doi=10.1037/a0022749 (abstract)

Paul A. Kirschner, John Sweller and Richard E. Clark (2006). Why Minimal Guidance During Instruction Does Not Work: An Analysis of the Failure of Constructivist, Discovery, Problem-Based, Experiential, and Inquiry-Based Teaching. Educational Psychologist, 41, 75-86.
http://www.cogtech.usc.edu/publications/kirschner_Sweller_Clark.pdf

Paul A. Kirschner, Richard E. Clark, and John Sweller (november 2012). Helemaal uitleggen of zelf laten ontdekken? Onderzoek spreekt voor volledig begeleide instructie. Van Twaalf Tot Achttien, 14-16.
http://dspace.ou.nl/bitstream/1820/4771/1/Van12-18%20-%20november2012%20-%20Helemaal%20uitleggen%20of%20zelf%20laten%20ontdekken%20-%20KSC.pdf

John Sweller, Richard Clark en Paul Kirschner (2010). Teaching General Problem-Solving Skills Is Not a Substitute for, or a Viable Addition to, Teaching Mathematics. Notices of the American Mathematical Society, 57, 1303-1304.
http://www.ams.org/notices/201010/rtx101001303p.pdf

Richard Clark, Paul Kirschner & John Sweller (Spring 2012). Putting Students on the Path to Learning. The Case for Fully Guided Instruction. American Educator, 6-11.
http://www.aft.org/pdfs/americaneducator/spring2012/Clark.pdf

Wim J. van der Linden (2002). On complexity in CBT [Computer Based Testing, b.w.]. In C. N. Mills, M. T. Potenza, J. J. Fremer, & W. C. Ward (Eds.), Computer-based testing. Building the foundation for future assessments (pp. 89-102). Erlbaum. [als e-Book te leen bij KB]
http://goo.gl/c1bkBI (Google preview)

Niels Taatgen (2013). The Nature and Transfer of Cognitive Skills. Psychological Review, 120, 439-471.
http://www.ai.rug.nl/~niels/publications/2013-19654-001.pdf

Rolf A. Zwaan and Michael P. Kaschak (2009). Language in the brain, body, and world. http://goo.gl/yGnmQL In Philip Robbins & Murat Aydede: The Cambridge Handbook of Situated Cognition. Cambridge University Press.

Ben Wilbrink (1983). Toetsvragen schrijven. Utrecht, Het Spectrum, Aula 809. In herziening: Toetsvragen ontwerpen.
http://benwilbrink.nl/projecten/toetsvragen.1.htm

Ben Wilbrink (2014). Al die teksten in onze eindexamens, waar komt dat fenomeen toch vandaan? Kan Sander Dekker precies 75 L zand in een kruiwagen scheppen? Van Twaalf Tot Achttien, Vakblad voor Voortgezet Onderwijs, 24, 28-30.
Versie met notenapparaat:
http://benwilbrink.nl/projecten/hoorzitting_4-12-2013_situationisme.htm#noten

Ben Wilbrink, Denny Borsboom en Michel Couzijn (2010). Spelling, grammatica en interpuntie meebeoordelen op eindexamens? Tweede Kamer motie van de leden Jan Jacob van Dijk en Jasper van Dijk. Examens, Tijdschrift voor de Toetspraktijk, 7 #3, 5-9.
http://www.ben-wilbrink.nl/EXAMENSCOMPLEET_sept_2010.pdf

Ben Wilbrink & Joost Hulshof (2011). De wet, het rekenen, en de rekentoets in de eindexamens havo/vwo. Invoering van de rekentoets havo/vwo in 2014. Examens, Tijdschrift voor de Toetspraktijk, 8 #3, 18-22. http://www.ben-wilbrink.nl/ex-11-3.pdf
Repliek en dupliek:
http://www.ben-wilbrink.nl/zwitser_beguin_2011_wilbrink_hulshof.pdf

Ben Wilbrink, Joost Hulshof & Henk Pfaltzgraff (2012). Examens, Tijdschrift voor de Toetspraktijk, 9 #3, 26-31. http://www.ben-wilbrink.nl/wilbrink_hulshof_pfaltzgraff_2012_De_rekentoetsen_3F_zijn_niet_valide.pdf
Officiële repliek van het CvE, dupliek
http://www.cve.nl/document/artikel_examens_rekentoetsen_vo

Rekentoetsen-met-contexten toetsen geen rekenen, ze toetsen wel op het vermogen voor zelf-ontdekkend leren


Ben Wilbrink en Paul Kirschner

op weg naar tweede concept, beoogde publicatie: NRC. Maximum woordlengte: 800, en dit stuk is nu 1400 woorden. Er is in gesnoeid, NRC wil publiceren, maar dinsdag even niet (zoals het er nu naar uit ziet, maandag 18:15 uur). De tekst voor de NRC is naar de onderwijscommissie van de Tweede Kamer gestuurd, extra voorzien van de literatuurlijst die ik ook hieronder aan het stuk heb gehangen. Gratis advies.


De staatssecretaris wil doorgaan met deze rekentoetsen bij de eindexamens vo en mbo. Maar deze rekentoetsen toetsen geen rekenen, want rekenen - iets dat je zelf moet doen en dat behoort tot de instrumentele vaardigheden van alle burgers - mag bij deze toetsen met de rekenmachine! De klemmende vraag is dan: Wat toetst de rekentoets wel? Voor het antwoord hoeven wij niet te kijken naar de Commissie-Bosker, omdat die niet verder kwam dan aanbevelingen om van alles makkelijker te maken zonder aan te geven waarom precies de rekentoetsen zo moeilijk blijken te zijn, en in het bijzonder ook waarom zoveel moeilijker voor havisten dan voor vwo-ers. Er is dus nog werk aan de winkel; en veel!

Door het Cito beschikbaar gemaakte voorbeeldrekentoetsen laten zien dat kandidaten tientallen problemen ‘uit het dagelijks leven’ voorgelegd krijgen. De achterliggende gedachte is dat op school alleen maar leren rekenen niet garandeert dat men later die rekenvaardigheid ook zal gebruiken in ‘situaties uit het dagelijks leven’. Dat klopt, die garantie is er niet, ook niet voor de kennis opgedaan in andere vakken trouwens. Is dat erg? Nee, want na school gaat het leren natuurlijk door. Nogal algemene schoolse kennis vraagt voortdurend aanpassing aan nieuwe situaties. Maar voorwaarde hiervoor is dus dat de algemene schoolse kennis überhaupt opgedaan, c.q. aanwezig is. Kirschner, Sweller en Clark hebben in een aantal wetenschappelijke maar ook vakdidactische artikelen duidelijk gemaakt dat om problemen in het rekenen op te kunnen lossen, je geen problemen moet leren oplossen maar moet leren rekenen! In, bijvoorbeeld, een artikel in Didactief schrijven zij: “Er vallen dus géén algemene probleemoplossende strategieën te leren. Vertaald naar het wiskundeonderwijs: we kunnen van leerlingen alleen effectieve wiskundige probleemoplossers maken als we ze voeden met grote hoeveelheden wiskundige schema’s [lees: eerst goed leren rekenen], kennis en op wiskundige problemen gerichte strategieën”. Daarna kunnen wij kinderen helpen leren die kennis toe te passen ‘in situaties uit het dagelijkse leven’. Dat laatste is nog een lastige opgave. In de psychologie heet dat het probleem van transfer, maar ook zonder zo moeilijk te doen kunnen we gewoon constateren dat er sprake is van leerprocessen, van verder leren.

Deze rekentoetsen met ‘situaties uit het dagelijks leven’ testen dus het vermogen om te leren: gebruik makend van opgedane rekenvaardigheid deze zo aanpassen dat de voorgelegde contextopgaven ermee zijn te maken. Is dit een legitiem doel van het voortgezet onderwijs, dan? Het gaat om een examensituatie waarin kandidaten zelfstandig moeten werken: het leren is hier (zelf)ontdekkend leren. Is het vermogen tot dit soort leren een legitiem doel van het voortgezet onderwijs? Om het artikel in Didactief weer te citeren: “Hoewel sommige briljante wiskundigen zonder adequate instructie in staat zijn gebleken om wiskundeproblemen te leren oplossen door zelf de oplossingen te ontdekken, is zo’n aanpak nooit de meest effectieve of efficiënte methode om leerlingen wiskunde te leren. Dus niet de manier voor de ‘doorsnee’ leerling”. Als dit, op zich, geen effectieve of efficiënte leerstrategie is, is het testen van dat vermogen dan een legitiem eindexamenonderdeel? Ons inziens zijn dit vragen die nu een dringend antwoord behoeven. De Commissie-Bosker geeft dat antwoord niet, de brief van 13 juni van staatssecretaris Sander Dekker aan de Tweede kamer evenmin. Ons voorstel is nu dat vanuit de psychologie er een expert opinion over wordt gegeven; denk aan wetenschappers als Borsboom, Van der Maas, Taatgen, Zwaan, Kirschner. Nog beter is dat de staatssecretaris tegelijk opdracht geeft om een degelijk experimenteel cognitief-psychologisch onderzoek te (laten) doen naar de aard van de kennis en vaardigheden die nodig zijn voor het beantwoorden van de contextopgaven in deze rekentoetsen.


Er zijn trouwens al spijkerharde gegevens voorhanden. Het Cito rapporteerde voor een klein aantal vragen de foutenanalyses voor havo en vwo, voorzover gegeven antwoorden dat toelaten (kladpapier wordt vernietigd, ongelooflijk maar waar). Het College voor Examens (CvE) rapporteerde de voorlopige testresultaten van de examenkandidaten 2014 (in percentages voldoende): BB 38,4, KB 39,2, GL/TL 54,9, havo 45,3, vwo 87,6. Totaal: 54,4 procent voldoende. Het verschil tussen havo en vwo is circa 40 procentpunt. Dat verschil kan door allerlei reparaties zoals door de Commissie-Bosker voorgesteld wel iets veranderen, maar zo’n verschil zal er blijven zolang deze rekentoets het karakter heeft van een test op intellectuele capaciteiten c.q. het vermogen om goed te kunnen lezen, in plaats van een doeltreffend voor te bereiden toets op rekenvaardigheden. En dat laatste kan best, zoals het eerste deel van de rekentoets-3S van de Commissie-Van de Craats laat zien. Nee, het is geen oplossing om voor havisten de lat dan maar te laten zakken: dat zou een erkenning zijn dat deze rekentoets een intelligentietest is. Het CvE heeft deze erkenning trouwens al gegeven: de lat ligt voor de vmbo-opleidingen nu al op verschillende hoogten, voor dezelfde toets dus.

We draaien het nu even om. Rekenen is geen raketwetenschap. Deze rekentoets in de eindexamens moet doeltreffend zijn voor te bereiden, anders deugt er iets fundamenteel niet. Dit is de eis die A. D. de Groot in 1970 onder woorden bracht, en die Job Cohen (1981) in zijn proefschrift Studierechten in meer juridische termen vertaalde. Bij doeltreffende voorbereiding komen kandidaten met ongeveer dezelfde slaagkansen op voor dit examen. Maar dan moeten gemiddelde resultaten van havo en vwo aan elkaar gelijk zijn! Zolang daar licht tussen zit — op dit moment een verschil van 40 procentpunt! — is dat een harde aanwijzing dat de rekentoetsen niet valide zijn. Ze deugen gewoon niet. Wat niet uitsluit dat het rekenonderwijs niet deugt. We moeten dolgraag willen weten waar hem dat precies in zit, maar de Commissie-Bosker heeft niet eens de vraag gesteld. Toch is het een kwaliteitseis (#1.8 in de Standards for Educational and Psychological Testing) te weten welke de cognitieve processen van de examenkandidaten zijn, en daar moet wetenschappelijke onderbouwing voor gegeven zijn. Als Cito en CvE hier in gebreke blijven, moet er langs andere weg aan worden gewerkt.

De crux van dit al is dat deze contextopgaven (en de toetscondities) een zo grote mentale belasting opleveren dat de informatieverwerking de bottleneck vormt. Veel kandidaten slagen er te vaak niet in om alle informatie goed te verwerken (46 procent scoort onvoldoende). Nu is daar wel iets aan te doen met maatregelen zoals door de Commissie-Bosker aanbevolen. Veronderstel dat al die maatregelen zijn genomen, dan bestaan de rekentoetsen nog steeds uit contextopgaven. Wat deze toetsen dan meten, is het vermogen om uit de gegeven context en de vraagstelling te redeneren naar het bedoelde rekenmodel (en dat met de rekenmachine uit te rekenen). Tenzij de contexten zo kinderachtig worden dat ze beter achterwege kunnen blijven, blijven het vragen die een grote mentale belasting opleveren. Op zich hoeft dat voor een examen natuurlijk geen probleem te zijn. Maar wanneer er een kloof in slaagpercentage blijft tussen havisten en vwo-ers, betekent het dat deze rekentoetsen geen rekenvaardigheid toetsen, maar verschillen in mentale belastbaarheid meten. Wat we nu graag precies willen weten, zowel kwalitatief als kwantitatief: op welke manieren leveren deze contextopgaven mentale belasting op. Hoeveel informatie moet tegelijk verwerkt worden, en is dat ook voor goede rekenaars in feite niet te veel informatie? Dit zijn niet zulke lastige vragen, en er is een behoorlijke hoeveelheid onderzoekliteratuur beschikbaar. De antwoorden hadden dus al bekend moeten zijn, er zijn toch al een paar commissies met dat rekenen-in-contexten in de slag geweest?

Een simpele les uit de cognitiewetenschap leert ons dat het werkgeheugen van de mens zeer klein is. Hoewel de wetenschappers geen exact getal kunnen geven menen zij dat als het om nieuwe informatie gaat, dat het 4 of 5 eenheden informatie bevat. Daarom zijn lange, ingewikkelde opgaven moeilijker te begrijpen dan korte; tegen het einde van zo’n opgave is de capaciteit van het werkgeheugen gewoon overbevraagd — de mentale belasting is te hoog. Hoe meer expertise — dus meer cognitieve schema’s beschikbaar — des te beter de kandidaat meer ingewikkelde zinnen aan kan. Maar zijn de contexten telkens nieuw, dan is er op dat punt geen expertise om op terug te vallen. Dan zijn er natuurlijk ook persoonlijke verschillen in geheugencapaciteit, waardoor de ene kandidaat kwetsbaarder is voor overlading van het werkgeheugen dan de andere. Al met al geen wonder dat de scores op deze rekentoetsen zo laag zijn, met zo’n groot verschil tussen havo en vwo.


Ben Wilbrink is onderwijsonderzoeker zonder institutionele binding, Paul Kirschner is hoogleraar Onderwijspsychologie aan de Open Universiteit.


Enige literatuur

D. Borsboom & K. A. Markus (2013). Truth and evidence in validity theory. Journal of Educational Measurement, 50(1), 110-114. [Special Issue: Validity] http://onlinelibrary.wiley.com/doi/10.1111/jedm.12006/abstract

D. Borsboom, G. J. Mellenbergh & J. H. van Heerden (2004). The concept of validity. Psychological Review, 111, 1061-1071. http://goo.gl/eIhwGL

H. L. J. van der Maas, D. Molenaar, G. Maris, R. A. Kievit & D. Borsboom (2011). Cognitive psychology meets psychometric theory: on the relation between process models for decision making and latent variable models for individual differences. Psychological Review, 118, 339-356. http://psycnet.apa.org/?&fa=main.doiLanding&doi=10.1037/a0022749 (abstract)

Paul A. Kirschner, John Sweller and Richard E. Clark (2006). Why Minimal Guidance During Instruction Does Not Work: An Analysis of the Failure of Constructivist, Discovery, Problem-Based, Experiential, and Inquiry-Based Teaching. Educational Psychologist, 41, 75-86.
http://www.cogtech.usc.edu/publications/kirschner_Sweller_Clark.pdf

Paul A. Kirschner, Richard E. Clark, and John Sweller (november 2012). Helemaal uitleggen of zelf laten ontdekken? Onderzoek spreekt voor volledig begeleide instructie. Van Twaalf Tot Achttien, 14-16.
http://dspace.ou.nl/bitstream/1820/4771/1/Van12-18%20-%20november2012%20-%20Helemaal%20uitleggen%20of%20zelf%20laten%20ontdekken%20-%20KSC.pdf

John Sweller, Richard Clark en Paul Kirschner (2010). Teaching General Problem-Solving Skills Is Not a Substitute for, or a Viable Addition to, Teaching Mathematics. Notices of the American Mathematical Society, 57, 1303-1304.
http://www.ams.org/notices/201010/rtx101001303p.pdf

Richard Clark, Paul Kirschner & John Sweller (Spring 2012). Putting Students on the Path to Learning. The Case for Fully Guided Instruction. American Educator, 6-11. http://www.aft.org/pdfs/americaneducator/spring2012/Clark.pdf

Wim J. van der Linden (2002). On complexity in CBT [Computer Based Testing, b.w.]. In C. N. Mills, M. T. Potenza, J. J. Fremer, & W. C. Ward (Eds.), Computer-based testing. Building the foundation for future assessments (pp. 89-102). Erlbaum. [als e-Book te leen bij KB] http://goo.gl/c1bkBI (Google preview)

Niels Taatgen (2013). The Nature and Transfer of Cognitive Skills. Psychological Review, 120, 439-471. http://www.ai.rug.nl/~niels/publications/2013-19654-001.pdf Rolf A. Zwaan and Michael P. Kaschak (2009). Language in the brain, body, and world. http://goo.gl/yGnmQL In Philip Robbins & Murat Aydede: The Cambridge Handbook of Situated Cognition. Cambridge University Press.

Ben Wilbrink (1983). Toetsvragen schrijven. Utrecht, Het Spectrum, Aula 809. In herziening: Toetsvragen ontwerpen. http://benwilbrink.nl/projecten/toetsvragen.1.htm

Ben Wilbrink (2014). Al die teksten in onze eindexamens, waar komt dat fenomeen toch vandaan? Kan Sander Dekker precies 75 L zand in een kruiwagen scheppen? Van Twaalf Tot Achttien, Vakblad voor Voortgezet Onderwijs, 24, 28-30. Versie met notenapparaat: http://benwilbrink.nl/projecten/hoorzitting_4-12-2013_situationisme.htm#noten

Ben Wilbrink, Denny Borsboom en Michel Couzijn (2010). Spelling, grammatica en interpuntie meebeoordelen op eindexamens? Tweede Kamer motie van de leden Jan Jacob van Dijk en Jasper van Dijk. Examens, Tijdschrift voor de Toetspraktijk, 7 #3, 5-9. http://www.ben-wilbrink.nl/EXAMENSCOMPLEET_sept_2010.pdf

Ben Wilbrink & Joost Hulshof (2011). De wet, het rekenen, en de rekentoets in de eindexamens havo/vwo. Invoering van de rekentoets havo/vwo in 2014. Examens, Tijdschrift voor de Toetspraktijk, 8 #3, 18-22. http://www.ben-wilbrink.nl/ex-11-3.pdf
Repliek en dupliek:
http://www.ben-wilbrink.nl/zwitser_beguin_2011_wilbrink_hulshof.pdf

Ben Wilbrink, Joost Hulshof & Henk Pfaltzgraff (2012). Examens, Tijdschrift voor de Toetspraktijk, 9 #3, 26-31. http://www.ben-wilbrink.nl/wilbrink_hulshof_pfaltzgraff_2012_De_rekentoetsen_3F_zijn_niet_valide.pdf
Officiële repliek van het CvE, dupliek
http://www.cve.nl/document/artikel_examens_rekentoetsen_vo


================================================
Ik geef hier een soort startnotitie voor een diepere analyse van de rekentoetsellende waarin Nederland is gestort: hoe moeten we de psychologie van deze rekenopgaven-in-contexten zien, tegen de achtergrond van inzichten uit de testpsychologie, de cognitieve psychologie, en die van grondleggers van de Nederlandse toetsbedrijvigheid A.D. de Groot en R.F. van Naerssen? Of die van hun erfgenamen Don Mellenbergh en Denny Borsboom? Laat ik eens een greep uit het dagelijks leven van een psycholoog doen, en een boodschappenlijstje opstellen.


13 juni, Bussemaker en Dekker hebben gereageerd op het rapport van hun commissie-Bosker, en ze hebben de resultaten van de rekentoets 2014 doorgestuurd naar de Tweede Kamer.

De indruk die dit alles maakt is dat de bewindslieden en hun adviseurs in de commssie-Bosker zowel het CvE en het Cito geen idee hebben wat er precies aan de hand is, en denken dat wat draaien aan knoppen van de rekentoetsen de enorme problemen wel kan oplossen.

Wat in alle stukken ontbreekt is de eerlijke vraag die kamerleden al wel op het netvlies hebben: Wat is rekenen? En hoe verhoudt deze rekentoets zich daartoe? Het antwoord is natuurlijk niet dat de referentieniveaus precies uitspellen wat rekenen is, omdat wel degelijk de strekking van de rekenvraag ook is: wat hebben die referentieniveaus met rekenen te maken?


  1. pro memorie: de rekentoets is een symptoom van het progressivisme dat de OECD (oa .via PISA) opdringt aan OECD-landen, zie p. 60 laatste alinea in OECD (2014) over assessment in The Netherlands pdf
    • Developing assessments for the mid-21st century


      Across OECD countries, there is a shared ambition to move education systems beyond traditional pedagogical approaches focussing on knowledge transmission and acquisition of basic skills and to promote a broader model of learning that includes competencies to synthesise, transform and apply learning in real-world situations. Such key competencies, or 21st century skills, typically include dimensions such as critical thinking creativity, problem-solving, communication, information and communications technology (ICT) literacy, as well as collaborative, social and citizenship skills (OECD, 2013).

      p. 60

  2. Het gaat om het idee van rekenen-in-contexten, en dan specifiek in examens. De stelling is dat dergelijke opgaven testen op het vermogen om zelfontdekkend te leren, geheel volgens de hervormingsopvattingen in het (internationale) onderwijsveld. De reformistische literatuur is voor psychologen eigenlijk vooral onleesbaar; tot de uitzonderingen daarop hoort werk van Lieven Verschaffel, zoals Van Dooren, Verschaffel, Greer & De Bock (2006), zie hier voor meer info en aantekeningen. In Van Dooren cs een uitstekende uiteenzetting van de filosofie van rekenen-in-contexten — maar de lezer moet wel zelf de vertaling naar de academische wereld buiten deze kring van reformisten. Zoals wat van Dooren c.s. ‘wiskundig modelleren’ noemen, het vermogen om in situaties van het dagelijks leven te rekenen (waar Anne van Streun en de werkgroep rekenreferentieniveaus zich bij aansluit), herkennen als zelfontdekkend leren.
    ===================================================
  3. wat wiskundigen, ouders en de meeste psychologen onder basale rekenvaardigheid verstaan is bijvoorbeeld de uitwerking die de commissie-Van de Craats voor deel 1 van de rekentoets-3S geeft: optellen, aftrekken, vermenigvuldigen, delen; met gehele, decimale en gebroken getallen; werken met benoemde getallen
  4. basaal rekenen is daarmee een glashelder construct, het is goed te toetsen met een groot aantal rekenopgaven die in bijvoorbeeld 30 minuten gemaakt worden, met een redelijke foutenmarge
  5. het is ondenkbaar om validiteit van rekentoetsen te onderzoeken zonder helderheid te verschaffen over wat rekenen is (Richtlijnen NIP; Standards AERA/APA/NCME)
  6. het eerste struikelblok zijn die contexten en het idee om het gebruik van rekenvaardigheid in contexten te toetsen
  7. herken hierin de thematiek van transfer van schoolse kennis naar gebruik buiten school
  8. in Nederland staat het onderwerp ‘transfer’ hoog op het prioriteitenlijstje van Adri Treffers en andere voorstanders van het realistisch rekenen
  9. In een gedachtengang die we (later?) zijn gaan kennen als situationisme, is gepoogd het ‘transferprobleem’ op te lossen door die situaties van buiten de school juist binnen de school te halen, een psychologisch nogal naïeve zet die uiteraard het probleem niet oplost maar wel kostbare consequenties heeft
  10. Nu heeft ook de psychologische literatuur veel moeite met die transfer, zie bijvoorbeeld Mark K. Singley & John R. Anderson (1989). The transfer of cognitive skill. Harvard University Press.
  11. Het mes van Ockham hanterend, laat zich de stelling verdedigen dat situaties van transfer niet eigensoortig zijn, maar vergelijkbaar met gebruikelijke situaties waarin wordt geleerd, met misschien een iets grotere afstand die moet worden overbrugd tussen bekende algemene regels en de verbijzondering ervan die past op de gegeven probleemsituatie. Dus: transfer = leren. In de psychologische theorievorming komen we dit tegen bij Stellan Ohlsson (2011). Deep Learning. How the Mind Overrides Experience. Cambridge University Press. info.
  12. Nog even bij Ohlsson blijvend: zijn cognitieve psychologie draait de algemeen geaccepteerde volgorde van het leren perfect om. Het leren begint bij de abstractie en gaat vandaar verder naar steeds concretere, meer specifieke situaties die verbijzonderingen van de algemene regel vragen of zijn. Voor wie de ‘niveautheorie’ van Van Hiele kent, of de Freudenthal-variant daarvan: via concrete voorbeelden komen tot het abstracte inzicht. Inderdaad: perfect omgekeerd. Met enorme didactische consequenties, mogen we gevoeglijk aannemen.
  13. Voor contextopgaven in rekentoetsen impliceert het voorgaande dat het construct dat ze testen zoiets is als leervermogen. Laten we zeggen dat het gaat om intelligentie, meer specifiek: fluid intelligence
  14. Het laatste is voor een eindexamen al gauw iets dat onaanvaardbaar is (zie hierbeneden A. D. de Groot, 1970): op een eindexamen dat in feite een intelligentietest is kan niemand zich doeltreffend voorbereiden.
  15. Hoe is het mogelijk dat het onderwijsveld en onze instituties een intelligentietest hebben geaccpteerd respectievelijk gemaakt, in plaats van een rekentoets? Dat moet alles hebben te maken met onderwijsopvattingen die internationaal bekend zijn als constructivisme. Van Dooren, Verschaffel e.a. (2006 hier) hebben die opvattingen uitstekend verwoord, toegespitst op het onderwijs van rekenen-in-contexten. De stelling over rekentoetsen-met-contexten als tests op leervermogen laat zich dan aanscherpen tot de stelling dat zij het vermogen tot zelfontdekkend leren testen. In het eindexamen, nota bene. Als het nu nog personeelsselectie was: het is het recht van werkgevers om op intelligentie en leervermogen te selecteren, geen probleem daarmee.
  16. Een belangrijk onderscheid is nu tussen het toetsen op intellectuele capaciteiten in absolute zin (experimentele psychologie) en in relatieve zin (differentiële psychologie). In Gierl & Haladyna (2013, zie hier), gewijd aan technieken om testitems automatisch te genereren, zijn voortdurend beide benaderingen naast elkaar aan de orde. Wanneer het Cito probeert om rekentoetsen zo onderscheidend mogelijk te maken, is dat een differentieel-psychologische benadering. Wanneer een groep psychologen gaat achterhalen welke cognitieve processen er nodig zijn om rekenopgaven te beantwoorden, vraagt dat een experimenteel-psychologische benadering. Zoals Cronbach in 1957 al betoogde (zie hier), zijn beide benaderingen nodig om tot valide tests te geraken.
    ==============================================
  17. werken met contexten kennen we uit de personeelsselectie: assessment centers (ACs)
  18. van die ACs weten we dat ze zelden op validiteit zijn gebouwd, en zelden validiteit hebben
  19. en dan hebben die ACs nog het voordeel dat ze situaties uit de betreffende beroepspraktijk gebruiken, een af te bakenen verzameling dus
  20. een goede afbakening valt voor ‘situaties in het dagelijks leven’ waarin rekenopgaven besloten liggen nauwelijks te maken, en zeker niet wanneer de voorbeeldrekentoetsen als representatief beschouwd zouden worden (wat ze evident niet zijn)
  21. iedere psychologische test en dus ook iedere toets moet aan bepaalde kwaliteitseisen voldoen: welke zijn dat eigenlijk?
  22. allereerst maar dat onderscheid tussen tests en toetsen, een verdomd belangrijk onderscheid Wilbrink (1986 webpagina)
  23. Op een psychologische test bereiden kandidaten zich niet specifiek voor (als dat wel gebeurt, is de validiteit van de test naar de mallemoeren), op een examen juist wel (in de mate waarin kandidaten dat niet kunnen of doen, is de validiteit van dat examen gemankeerd)
  24. A.D. de Groot (1970) webpagina heeft uitstekend aangegeven welke kwaliteitseisen dan volgen voor examenonderdelen
  25. het te testen/toetsen construct moet wel helder zijn, maar juist bij contextopgaven is dat een enorm probleem
  26. omdat rekenvaardigheid daarin moeilijk is te onderscheiden van toetsen op het vermogen tot transfer van die vaardigheid (zie in het voorgaande voor de complicaties rond die transfer)
  27. pm: taalvaardigheid en wereldkennis die nodig zijn, respectievelijk hoe daaruit verschillen tussen kandidaten volgen
  28. pm: cognitive load: wat moet er zoal tegelijk worden onthouden, uit het geheugen opgehaald; persoonlijke verschillen in capaciteit werkgeheugen
  29. materiaal in Mentale belasting van contextopgaven in rekentoetsen
  30. Ook wanneer vooronderstellingen over die psychologische processen zijn blijven hangen in vage omschrijvingen als ‘toepassen in situaties uit het dagelijks leven’:
    “If the rationale for a test use or score interpretation depends on premises about the psychological processes or cognitive operations used by examinees, then theoretical or empirical evidence in support of those premises should be provided. (p. 19)”

    AERA, APA & NCME (1999).The Standards for Educational and Psychological Testing. standard 1.8 zie hier.

  31. Thomas P. Carpenter, Mary M. Lindquist, Westina Matthews & Edward A. Silver (1983). Results of the third NAEP mathematics assessment: Secondary school. Mathematics Teacher, 76, 652-659. JSTOR read online .

    Behandelt o.a. het bekende busprobleem, door de Freudenthal-groep heel veel gebruikt

    • Alan H. Schoenfeld (2009). Method. In: F. Lester, Second handbook of research on mathematics teaching and learning 69-107. National Council of Teachers of Mathematics.
      An army bus holds 36 soldiers. If 1128 doldiers are being bussed to their training site, how many buses are needed?

      The calculation is straightforward: 36 goes into 1128 thirty-one times, with a remainder of 12. Hence 32 buses are needed. Here is the frequency of resposes from the stratified nationwide sample of studnets who worked the problem:

      • 23% 32
      • 29% 31 R 12
      • 18% 31
      • 30% other
      The vast majority of students who worked the problem performed the necessary computation correctly. But then, more than a third of the students who did the computation correctly wrote down an impossible answer (the bumber of buses needd must be an integer, after all!), and a substantial number of others rounded down instead of up, which makes no sense in the given context.

      Schoenfeld p. 90

      Schoenfeld maakt hier een ernstige fout, onvergeeflijk in een tekst over onderzoekmethoden voor wiskunde in het onderwijs. Hij legt een eigen pseudo-logische norm op aan 14-jarigen in de VS.

  32. “Adding more realism to test items does not automatically lead to valid measures. [ . . ] Any new feature added to a test that is not essential to the variable the test is intended to measure is a potential threat to [construct] validity”

    p. 93, in
    Wim J. van der Linden (2002). On complexity in CBT. In C. N. Mills, M. T. Potenza, J. J. Fremer, & W. C. Ward (Eds.), Computer-based testing. Building the foundation for future assessments (pp. 89-102). Erlbaum. [als e-Book te leen bij KB] Google preview

    Goed gebalanceerd stuk, zoals ik het (gedeeltelijk) heb gelezen. Wim van der Linden, eerste voorzitter van de Nederlandse Vereniging voor Examens, heeft tegenwoordig besognes in de VS (hoofd testonderzoek CBT-McGraw-Hill, vice-president NCME). Geen beletsel voor kamerleden om hem eens uit te nodigen voor een gesprek over de problemen die deze rekentoetsen ’met authentieke contextopgaven’ geven.

  33. The history of the application of psychological theories to education is a spotty one. John Dewey (1938/1997) [Experience and Education] was among the first serious scholars of education to take this task seriously, and constructivism, even today, has its origins in Dewey. Indeed, the whole thinking-skills movement may be seen as originating in large part in Dewey’s work.

    Robert Sternberg (2008). Applying psychological theories to educational practice. American Educational Research Journal, 45, 150-165.

    NB: dit lijstje is nog niet volledig ;-)


Referentieniveaus beschrijven wat leerlingen moeten kennen en kunnen en zijn wettelijk vastgelegd.

p. 5

Deze uitspraak in het rapport behoeft nuancering, al was het maar omdat de referentieniveaus de normen voor dat kennen en kunnen niet vastleggen. Belangrijker is het volgende. Bij de behandeling in de Tweede Kamer (Handelingen 31 maart 2010) heeft de minister van onderwijs André Rouvoet de referentieniveaus helder bepaald als een uitwerking van de kerndoelen voor het onderwijs, niet als een toevoeging of uitbreiding ervan. Deze nuancering is ook hierom van belang: de kerndoelen voor het rekenonderwijs zijn destijds gekozen als uitvloeisel van bepaalde opvattingen over het rekenonderwijs (‘realistisch rekenen’, constructivisme) die internationaal maatschappelijk omstreden zijn, en neergeslagen in kerndoelen beargumenteerbaar een vorm van staatsdidactiek inhouden.


Van het 2F-niveau heeft de Expertgroep aangegeven dat de daarin beschreven kennis en vaardigheden nodig zijn om maatschappelijk te kunnen functioneren.

p. 5

Het mag zo zijn dat de expertgroep dat heeft proberen te beschrijven, maar dat is nog iets anders dan onderbouwen met deugdelijk onderzoek. Dat laatste zal ook knap lastig zijn, omdat er bij het rekenen in de opvatting van de expertgroep bepaald sprake is van een samenstel van verschillende vaardigheden en capaciteiten, en een achterban waarin bijvoorbeeld de alomtegenwoordigheid van rekenmachientjes al voldoende evidentie is om het belang van basale rekenvaardigheid te bagatelliseren. Ik geef een enkel voorbeeld van onderbouwend onderzoek, in dit geval het belang van goed breukenonderwijs voor vervolgtrajecten in het onderwijs: Siegler c.s. (2011) http://goo.gl/yLJKl.

In testpsychologische termen is hier aan de orde dat de validiteit van de rekentoetsen aangetoond moet worden in relatie tot dat maatschappelijk functioneren. Ik kan mij niet herinneren ook maar een begin van enige poging tot dergelijk valideringsonderzoek te zijn tegengekomen. Gezien de voorbeeldrekentoetsen is een testpsychologisch oordeel al op voorhand dat deze toetsen niet valide zijn, zoals beargumenteerd door Wilbrink, Hulshof & Pfaltzgraff (2012) pdf. Daar moet bij worden vermeld dat het College voor Examens (CvE) op genoemd artikel heeft gereageerd (Kastelein, 2012, http://goo.gl/nAovLQ ) met het betoog dat de rekentoetsen wel degelijk valide zijn omdat het proces van totstandkoming volgens de regels is verlopen. Dat laatste is een misvatting over wat het begrip ‘validiteit’ in de testpsychologie inhoudt.


p. 6: een opsomming van de onderwerpen waarover de cie. adviezen geeft, waaronder niet genoemd . . . over doorgaan met de rekentoetsen volgens planning. For the record. Is dat advies over doorgaan een last minute ideetje geweest?


Er is, in algemene zin, nog betrekkelijk weinig ervaring met didactiek en onderwijs van rekenen als zelfstandige basisvaardigheid in vo en mbo.

blz. 11

Dat is een wonderlijke uitspraak. Ik maak me sterk dat er nog niet zo gek lang geleden uitstekend rekenonderwijs werd gegeven in het vo. Misschien bedoelt de commissie rekenonderwijs op realistische leest gestoeld? Maar dan is toch de hamvraag of de hervormingsbeweging in het rekenonderwijs, ook internationaal, wel op enige deugdelijke empirische grond berust? Dit is geen marginale vraag, als het om deze rekentoetsen gaat, maar een hoofdvraag.

De beelden die in het veld bestaan over wat rekenen is die niet zozeer geënt zijn op de referentieniveaus, maar bijvoorbeeld wel op de eerste generatie leermiddelen.

blz. 11

Precies. De spijker op de kop. ‘Wat is rekenen?’ De commissie deinst hier terug, en verschuilt zich achter de opdracht van OCW om geen kritische opmerkingen over de referentieniveaus te maken, of over de ideologie waarop deze referentieniveaus steunen.

En zo kan ik eigenlijk iedere zinsnede uit dit commissierapport wel kritiseren, dat ga ik dus niet doen. Het beeld is helder: deze commissie gaat niet tornen aan de staats-rekendidactiek zelf, hoewel dat evident het grootste probleem is dat met deze rekentoetsen aan het daglicht is getreden.




De eerste overpeinzingen: rekenblogs op het forum van Beter Onderwijs Nederland


Voor de goede orde vermeld ik hier dat ik mijn lidmaatschap van BON in 2012 heb beëindigd. Laat ik zeggen: wegens onverenigbaarheid van karakters. In drie woorden: gebrek aan openheid.


Een inhoudelijk begin is gemaakt in de vorm van blogs op het forum van BON: Realistische rekenreferentieniveaus? Het rekenrapport van de werkgroep-Van Streun. blog 7547


Het referentiekader rekenen in de praktijk: hoe realistisch is dat? blog 7555


De wet, de rekentoets, het rekenen, en de eindexamens, ihb. havo/vwo [16] blog 7765


Reactie voorzitter van de rekentoetswijzercommissie op Wilbrinks blog blog 7779
brief Victor Schmidt aan Ben Wilbrink


Dupliek op de repliek van Schmidt zal verschijnen als blog [17], eind juni


Is dit misverstand mogelijk het probleem?

De indruk wordt steeds sterker dat er sprake is van een mega-misverstand bij de wetgever en bij de instituties die betrokken zijn bij de uitvoering van de Wet referentieniveaus Nederlandse taal en rekenen.


Dat misverstand — of dat nu per abuis is of met opzet gecreëerd — is dat Nederlandse leerlingen over de hele linie van het rekenen belangrijke tekorten hebben, en zij dus doorheen het hele vo extra onderwijs over de volle breedte van de rekendoelen nodig hebben, en daar ook nog eens een keer op hun eindexamen mee lastig moeten worden gevallen.


PPON


Maar dat is niet het geval. De tekorten zitten precies in de hoek die altijd denigrerend door de Freudenthal-groep in de hoek is gezet als ‘opa’s rekenen’ en ‘cijferen’. Maar die hoek is toevallig wel de hoeksteen waar de rest van het rekengebouw op steunt, de wiskunde niet te vergeten.


Wie hieraan mocht twijfelen: zie de recente rapportages van de PPON-rekenen, bijvoorbeeld zoals samengevat in een figuur (hierboven) in de oratie van Marja van den Heuvel-Panhuizen pdf.

Anders dan de afbeelding suggereert is het niet zo dat de prestaties op de kroonjuwelen van het realistisch rekenen nu heel behoorlijk zouden zijn, want enorm vooruitgegaan. Wie de PPON-rapportage goed bestudeert, komt erachter dat de prestaties op dat handig en schattend rekenen enz. heel beroerd waren in de voorafgaande jaren, en in 2004 dus een stuk minder beroerd. Dat is vooruitgang, toch?


Wat nu dreigt te gebeuren: alle leerlingen worden opgejut om beter te gaan presteren, maar dan vooral op de meer intelligentietest-achtige typen rekenopgaven. Maar daar doen Nederlandse leerlingen het al briljant op (althans: in PISA; het zijn tenslotte slimme rakkers). Zodoende komt er van extra aandacht voor de funderende rekenvaardigheden weinig terecht, maar daar was het juist allemaal om begonnen. Kortom, die verdient een eigen blog. Ter voorbereiding van onder andere die blog, is het nodig de wet- en regelgeving na te lopen.




De wet

Behandeling van de wet in de Tweede Kamer, onder nummer 32 290, zie ikregeer.nl pagina 32290


Doorlopende Leerlijnen Taal en Rekenen. dossier 31332


Wet van 29 april 2010 tot vaststelling van regels over referentieniveaus voor de taal- en rekenvaardigheden van leerlingen (Wet referentieniveaus Nederlandse taal en rekenen).

Staatsblad. pdf. Hoofdzaken:


De wet zegt weinig over specifieke referentieniveaus, de wet noemt niet het onderscheid tussen F (fundamenteel niveau) en S (streefniveau) maar spreekt voor het basisonderwijs over telkens twee referentieniveaus voor taal en idem voor rekenen.

Artikel 2 regelt dat die referentieniveaus zelf bij algemene maatregel van bestuur worden vastgesteld.

Merk op dat de wet zelf niets zegt over de mate waarin de referentieniveaus bereikt moeten worden, anders dan ‘zoveel mogelijk’. De diagnostische toetsen zijn kennelijk bedoeld om tussentijds vast te stellen wat er nog niet is bereikt van dit ‘zoveel mogelijk’.




Reken-wiskunderesultaten: eind van de basisschool

Egbert Harskamp (200). Reken-wiskunderesultaten van leerlingen aan het eind van de basisschool. Bijlage A bij: Werkgroep-Van Streun (2008). Over de drempels met rekenen. Consolideren,  onderhouden,  gebruiken en verdiepen. Onderdeel van de eindrapportage van de Expertgroep Doorlopende Leerlijnen Taal en Rekenen. pdf

Harskamp is bekend met effecten van meer traditioneel rekenonderwijs versus op realische leest geschoeid rekenonderwijs: hij promoveerde op een (door SVO gesubsideerd) onderzoek naar eventuele verschillen, en hoe persoonlijke kenmerken samenhangen met rekenprestaties.

E. G. Harskamp (1988). Rekenmethoden op de proef gesteld. Proefschrift Rijksuniversiteit Groningen.


Harskamp maakt gebruik van de resultaten van de Periodieke Peilingen van het Onderwijsniveau (PPON). Dat komt goed uit, hopelijk maakt dat een eigen analyse van die resultaten voorshands overbodig.




referenties

Jan van de Craats (december 2007). Domeinbeschrijving rekenen Discussiestuk ten dienste van de Expertgroep Doorlopende Leerlijnen Rekenen en Taal. pdf

Joost Hulshof: Kritiek op de realistische didactiek pdf

Ben Wilbrink: Realistische rekenreferentieniveaus? Het rekenrapport van de werkgroep-Van Streun. blog 7547

Ben Wilbrink: Inspectie: Scholen gebruiken naast hun realistische rekenmethode additionele methoden voor de basisvaardigheden. Blog op het forum van BON 7520

Ben Wilbrink: Het ontwerp van de vragen in de Nationale Rekentoets 2006 html en 2007 html

Zie ook de (Engelstalige) pagina met becommentarieerde literatuur over rekenen/wiskunde en onderwijs matheducation.htm (internationaal ) en matheducation.dutch.htm (Nederland(s)).


documenten

Werkgroep-Van Streun (uit de Commissie Meijerink) (2008). Over de drempels met rekenen. Consolideren, onderhouden, gebruiken en verdiepen. Onderdeel van de eindrapportage van de Expertgroep. Doorlopende Leerlijnen Taal en Rekenen. Experetgroep Doorlopende Leerlijnen Taal en Rekenen. pdf

Commissie-Meijerink / werkgroep-Rijlaarsdam-van den Berg / werkgroep-Van Streun (2008). Referentiekader taal en rekenen. De referentieniveaus. Taal. Rekenen. Doorlopende Leerlijnen Taal en Rekenen. pdf

Wet van 29 april 2010 tot vaststelling van regels over referentieniveaus voor de taal- en rekenvaardigheden van leerlingen (Wet referentieniveaus Nederlandse taal en rekenen). Staatsblad. pdf

Besluit van 17 juni 2010, houdende vaststelling van referentieniveaus Nederlandse taal en referentieniveaus rekenen (Besluit referentieniveaus Nederlandse taal en rekenen). Staatsblad. pdf

Onderwijsraad (24-7-2009). Advies Kaders voor de referentieniveaus. pdf

advies VO-Raad over referentieniveaus taal en rekenen. pdf

(19-1-2010). Wetsvoorstel tot vaststelling van regels over referentieniveaus voor de taal- en rekenvaardigheden (Wet referentieniveaus Nederlandse taal en rekenen) pdf

OCW (8-3-2010). Nota wetsvoorstel referentieniveaus taal- en rekenvaardigheden. pdf (brief pdf)

OCW (5-1-2010). Brief aan de Tweede Kamer over centrale examinering taal en rekenen mbo. pdf

OCW (24-9-2010). Beantwoording kamervragen over spellingvaardigheden. pdf

Inspectie (23-9-2009). Het taalonderwijs op taalzwakke en taalsterke scholen pdf

Kamerbrief toetsing in het basisonderwijs (1-3-2011). pdf

OCW (7 oktober 2009). Toewijzing en invoering Referentiekader Taal en Rekenen. pdf [Bijlage bij brief aan de Tweede Kamer (7 oktober 2010): Voortgang implementatie referentiekader taal en rekenen - aan de Tweede Kamer pdf]

Jasper van Dijk (7-4-2008). Kamervragen van het Kamerlid Jasper van Dijk (SP) over problemen met de rekentoets op de Pabo. [pdf met de antwoorden nog niet gevonden]

OCW Nieuwsbericht (7-10-2009). Verplichte rekentoets voor middelbare scholier. html

Naar hogere leerprestaties in het voortgezet onderwijs. Advies van de Onderwijsraad met daarin aanbevelingen om te komen tot een kwaliteitsverhoging van het voortgezet onderwijs. Het doel hiervan is hogere leerprestaties van alle leerlingen. pdf

OCW (21-1-2010). concept-Examenbesluit beroepsopleidingen WEB. pdf

OCW (21-1-2010). Conceptbesluit referentieniveaus Nederlandse taal en rekenen. pdf

OCW (27-1-2010). Examens. Om het taal- en rekenniveau van leerlingen te verbeteren, zullen de eindexamens ook veranderen. De bestaande examenprogramma’s worden aangepast aan de referentieniveaus. Verder zullen alle leerlingen een rekentoets afleggen als onderdeel van het eindexamen. Vanaf 2010 vinden proefafnames van deze rekentoets plaats. Aan de hand van de resultaten hiervan wordt besloten of en hoe de toets gaat meewegen in de slaag/zakbeslissing. html

OCW (5-11-2009). Brief aan de Tweede Kamer over Beleidsreactie KNAW-rapport Rekenonderwijs op de basisschool. pdf


literatuur

Jan van de Craats en Rob Bosch (2007/2009). Basisboek rekenen. Pearson Education Benelux.

Inspectie (18 maart 2011). Automatiseren bij Rekenen-Wiskunde. pdf

Inspectie (23-9-2009). Het taalonderwijs op taalzwakke en taalsterke scholen pdf

C. Lebiere (1999). The dynamics of cognition: An ACT-R model of cognitive arithmetic. Kognitionswissenschaft, 8, 5-19 pdf [The Ph.D. dissertation itself is available also: http://act-r.psy.cmu.edu/papers/236/cl_1998_a.pdf

Tom Braams & Marisca Milikowski (Red.) (2008). De gelukkige rekenklas. Boom.

Battice Beijer & Katja de Bruijn (2010). Cognitieve deelvaardigheden Rekenen (Desoete, & Royers, 2006) graad 1 bruikbaar in Nederland? Bachelorthesis, HS Zuyd opleiding logopedie. pdf [Empirisch onderzoekje met aangepaste test van Desoete] [o.a. lijst van rekentests]

Liesbeth van der Plas-Eskes (2008). Minder bekende problemen van het Nederlandse wiskunde onderwijs. pdf

Ben Wilbrink, Denny Borsboom & Michel Couzijn (2010). Spelling, grammatica en interpunctie meebeoordelen op eindexamens?. Examens, Tijdschrift voor de Toetspraktijk, september, 5-9. [eind 2011 vrij beschikbaar als http://www.e-xamens.nl/archief/2010/3/tijdschrift.pdf] concept

Gerard J. J. M. Straetmans en T. J. H. M. Eggen (2005). Afrekenen op rekenen: over de rekenvaardigheid van pabo-studenten en de toetsing daarvan. Tijdschrift voor Hoger Onderwijs. pdf


links

Website van Jan van de Craats website

met Zwartboek rekenonderwijs

Website FIsmewebsite

Website Ben Wilbrink wiskundeonderwijs en rekenonderwijs Rijksoverheid.nl OCW: webpagina Taal en Rekenen html

Doorlopende Leerlijnen Taal en Rekenen. Website html

Reken VOort. Rekenen voor het Voortgezet Onderwijs html

Malmberg Rekenblokken html



21 juni 2014 \ contact ben at at at benwilbrink.nl    

Valid HTML 4.01!   http://www.benwilbrink.nl/projecten/rekentoets_vo.htm