Onderzoek David de Jong.pdf
Transcript of Onderzoek David de Jong.pdf
Kwaliteit van Toetsing op
het Gomarus College
DAVID DE JONG
P300884
GRONINGEN, JANUARI 2012
BEGELEIDER: ESTHER HOEKMAN
MEL - PENTA NOVA
2
3
Inhoudsopgave Voorwoord .............................................................................................................................................. 5
Samenvatting ........................................................................................................................................... 6
1 Aanleiding en inleiding ........................................................................................................................ 7
1.1 Aanleiding ..................................................................................................................................... 7
1.2 Relevantie van het onderwerp ....................................................................................................... 7
1.3 Hoofdvragen en deelvragen ........................................................................................................... 8
2 Theoretisch kader ............................................................................................................................... 10
2.1 Geschiedenis van toetsing ........................................................................................................... 10
2.2 Het doel van toetsing ................................................................................................................... 13
2.3 Begripsbepaling opbrengstgericht werken .................................................................................. 15
2.4 Opbrengstgericht werken: wie, hoe en wat? ................................................................................ 18
2.5 Belemmeringen voor opbrengstgericht onderwijs ....................................................................... 21
2.6 Conclusie ..................................................................................................................................... 22
3 Dataverzamelingsmethode ................................................................................................................. 23
3.1. Kwantitatief onderzoek (survey) ................................................................................................ 23
3.2 Kwalitatief onderzoek (workshop) .............................................................................................. 25
3.2.1. Methode ............................................................................................................................... 26
3.2.2. Steekproef ............................................................................................................................ 27
3.2.3. Instrument ............................................................................................................................ 27
3.2.4. Analyse ................................................................................................................................ 27
3.2.5. Betrouwbaarheid en validiteit .............................................................................................. 28
3.2.6. Ethische verantwoording ..................................................................................................... 28
4 Resultaten ........................................................................................................................................... 30
4.1 Kwantitatief onderzoek ............................................................................................................... 30
4.2 Antwoorden bij deelvragen 1 en 2 ............................................................................................... 40
4.3 Resultaten open vraag uit kwantitatief onderzoek ....................................................................... 41
4.4 Antwoorden bij deelvragen 2 en 3 ............................................................................................... 41
4.5 Uitvoering van de workshops ...................................................................................................... 42
4.6 Uitkomsten plannen van aanpak .................................................................................................. 46
4.7 Beoordeling proces en uitkomsten .............................................................................................. 47
4.8 Uitkomsten laaghangend fruit ..................................................................................................... 50
4
5 Conclusies, aanbevelingen en discussie ............................................................................................. 51
5.1 Conclusies: .................................................................................................................................. 51
5.2 Aanbevelingen ............................................................................................................................. 52
5.3 Discussie ...................................................................................................................................... 53
Literatuur ............................................................................................................................................... 57
Bijlagen ................................................................................................................................................. 59
Bijlagen:………………………………………………………………………………………………………………………………59
I. Brief en vragenlijst Drachten…………………………………………………………………………………………….60
II. Brief overige locaties……………………………………………………………………………………………………….64
III. Uitkomsten kwalitatief deel van kwantitatief onderzoek………………………………………………..65
IV. Uitkomsten Plannen van Aanpak …………………………………………………………………………………..73
V. Brief samenstelling focusgroep Drachten ……………………………………………………………………….77
VI. Brief samenstelling focusgroep Magnolia/overige locaties…………………………………………….78
VII. Planning focusgroep Drachten…………………………….………………………………………………………..79
VIII. Planning focusgroep Magnolia/overige locaties……………………………………………………………80
IX. Genoemde onderwerpen focusgroep Drachten……………………………………………………………..81
X. Genoemde zaken focusgroep Magnolia/overige locaties…………………………………………………82
XI. Formulier Plan van Aanpak…………………………………………………………………………………………….83
XII. Formulier Laaghangend fruit…………………………………………………………………………………………84
XIII. Uitkomsten Laaghangend Fruit…………………………………………………………………………………….85
5
Voorwoord Het opleveren van deze masterscriptie vervult me best wel met enige trots. In april
2009 werd ik gevraagd om directeur te worden van een mooie vestiging van het
Gomarus College in Drachten. Ik stemde in. Met dat besluit kwam er heel bewust ook
een einde aan een lange periode (ruim 15 jaar) in de lokale politiek. Een nieuwe baan
met nieuwe verantwoordelijkheden, maar ook een tijd dat ik na werktijd weer eens
wat meer thuis kon zijn en aandacht besteden aan vrouw en (klein)kinderen.
Je bent goed en wel bezig en je wordt gevraagd mee te doen aan een traject van
minimaal twee jaar om een masteropleiding Onderwijskundig Leiderschap te gaan
doen. Het thuisfront was in eerste instantie niet enthousiast, maar het was wel een
unieke gelegenheid om met een groep van ongeveer 10 mensen uit het
gereformeerd basis- en voortgezet onderwijs intern deze opleiding te volgen. Mijn
opleiding MO-Pedagogiek had ik in 1990 afgesloten en het was dus 20 jaar geleden
dat ik een echt serieuze studie om handen had.
In het begin viel het niet mee. Mensen als Marzano, Fullan, Quinn en anderen
betekenden voor mij nog niet veel en ondanks het feit dat ik directeur was, had ik
nog maar beperkt nagedacht over leiderschap en innoveren. Het waren allemaal
mensen die in de jaren 80 van de vorige eeuw nog niet echt meededen. En dan de
manier van onderwijs geven. In de 20e eeuw kreeg je een boek, je volgde colleges en
maakte toetsen en aan het einde daarvan had je een diploma. Hoewel we
ongetwijfeld regelmatig reflecteerden op wat we deden, kenden we de term toen
niet en het maken van papers en netwerkanalyses behoorde ook bepaald niet tot het
standaardrepertoire.
Het is te danken aan mijn medestudenten, velen een paar jaar jonger dan ik , mijn
docenten die het nodige geduld met mij moesten opbrengen en mijn geliefde Rianne
dat ik heb doorgezet en nu na twee jaar de studie met deze scriptie mag bekronen.
Wat is het mooi dat je met zo’n scriptie aandacht, veel aandacht kunt besteden aan
zaken die je al heel lang bezighouden, maar waar je nooit zoveel tijd in hebt kunnen
steken als nu het geval is. Het was bij tijden best zwaar, lastig en vervelend, maar ik
hoop dat deze terminologie niet bij de lezer op zal komen bij het lezen van deze
scriptie. Uiteindelijk werd het een zeer leerzaam traject.
6
Samenvatting Er wordt wat afgetoetst in scholen. Het Gomarus College is daarop geen
uitzondering. Op basis van de uitslagen van deze toetsen worden heel wat besluiten
genomen die voor iedereen in, maar ook voor velen buiten de school, van groot
belang zijn. Er wordt veel tijd en energie gestoken in toetsing en toch ….
Omdat toetsen altijd beter kunnen is dit onderzoek gedaan. Teveel leerlingen krijgen
adviezen die niet lijken te passen bij hun cijfers. Te vaak worden cijfers voor
kennisgeving aangenomen, in het cijfersysteem genoteerd en doorgegaan naar het
volgende hoofdstuk of onderdeel. Op kleinere vestigingen is vaak één collega
verantwoordelijk voor een heel vak dat daar wordt verzorgd. Nieuwe collega’s, zo
blijkt ook in dit onderzoek, zijn matig voorbereid op toetsing en zoeken hulp en steun
bij het verbeteren van het toetsproces.
Leeropbrengsten vormen steeds vaker onderdeel van het verantwoordingsproces
binnen scholen, maar ook naar de buitenwacht: collega scholen, de pers en niet te
vergeten de inspectie van het onderwijs. In Vensters voor verantwoording wordt
voor heel veel zaken verantwoording afgelegd en toch ….
In deze masterthesis is onderzoek gedaan naar de kwaliteit van toetsing op het
Gomarus College. Er is een survey gehouden onder docenten, eindigend met een
open vraag naar vragen, problemen en ideeën op het gebied van toetsing. Na
uitwerking van de resultaten is nader ingezoomd op mogelijke verbeteringen van het
toetsingsproces in een tweetal workshops met twee keer acht deskundigen uit het
veld.
Uit dit onderzoek blijkt dat het allemaal nog beter kan. Dat hier heel veel ideeën voor
zijn en dat die deels gemakkelijk uitvoerbaar zijn. Belangrijkste thema’s zijn hierbij:
De analyse van toetsen: Is deze toets een betrouwbaar en valide instrument en hoe
kunnen we dat vaststellen? Het normeren van toetsen: welke beoordeling van de
toets doet recht aan de toets en de leerling? Er zou veel beter gebruik gemaakt
moeten worden van de vakgroep en de schoolleiding moet meer laten merken het
thema belangrijk te vinden. Overwogen moet worden in hoeverre een soort van
leerlingvolgsysteem als van het CITO ook een rol kan spelen op het Gomarus College.
Een antwoord op deze vragen moet worden voorbereid door een stuurgroep die
leiding geeft aan werkgroep die binnen een half jaar met concrete conclusies en
aanbevelingen komt.
Bij de docenten bestaat veel kennis en kunde over dit onderwerp. Men kan veel van
elkaar leren, wanneer dat voldoende wordt gefaciliteerd. Dat kan zijn in tijd, scholing
en geld. De keuze hiervoor zal deels worden bepaald door de krappe tijd waarin we
momenteel opereren, maar dat kan en mag geen reden zijn om dit onderwerp niet
hoog op de agenda te plaatsen.
7
1 Aanleiding en inleiding
1.1 Aanleiding Ieder mens heeft zo zijn eigen beeld erbij als het gaat om toetsing. Vrijwel ieder mens
heeft er ook mee te maken (gehad). Al op jonge leeftijd wordt getoetst of je je veter
vast kunt maken en als het lukt, ontvang je een diploma. Anderen herinneren zich het
maken van examens en de spanning die dat wel of niet met zich meebracht. En hoe
vaak werd iemand niet getoetst waarbij van te voren vaak moeilijk was te zeggen of
je het had gehaald of niet. Soms was een voldoende beoordeling een enorme
opluchting, een andere keer een 5,4 een oordeel dat een hoop extra werk opleverde.
Toetsen zijn een belangrijk onderdeel van het onderwijsleerproces. Op de uitkomsten
ervan worden heel belangrijke beslissingen gebaseerd: wel of niet overgaan naar een
volgend leerjaar, wel of niet een diploma ontvangen dat recht geeft op doorstuderen
op een andere opleiding.
Tijdens de master Educational Leadership is veel aandacht besteed aan
opbrengstgericht werken en het gebruik van data. Ook vanuit allerlei andere gremia
(ouders, inspectie, schoolleiding, de journalistiek) is er steeds meer aandacht voor
cijfers en opbrengsten. Op een willekeurige school verzamelt men heel wat data en
voor een deel doet men dat door middel van toetsing. Op basis van deze dat wordt
informatie gegenereerd door normen aan de data te verbinden. Een voorbeeld
hiervan is de overgang van het ene naar het andere leerjaar of het maken van een
advies aan het einde van bijvoorbeeld de onderbouwperiode. In de praktijk als
docent en directeur is me opgevallen dat deze zogenaamde harde informatie lang
niet altijd zo hard is als wordt beweerd of verondersteld.
Het zal duidelijk zijn dat dit fenomeen veel eerder is geconstateerd. De Groot (1966)
schreef zijn boek Vijven en Zessen in het midden van de jaren 60. Als je tijdsgeest en
het schoolsysteem even probeert slechts door de oogharen waar te nemen, is er nog
bijzonder veel van de informatie relevant. Het is na 45 jaar geleden te zijn geschreven
nu nog zeer leesbaar en relevant.
1.2 Relevantie van het onderwerp In de afgelopen jaren is er steeds meer aandacht gekomen voor opbrengsten in het
onderwijs. Cijfers van de leerlingen zijn een indicatie van de voortgang van het
leerproces, maar al sinds het midden van de jaren zestig wordt getwijfeld aan de
betrouwbaarheid van cijfers. In 1966 schreef A.D. de Groot het boek “Vijven en
zessen: een schotschrift tegen de averechtse deskundigheid van onderwijzers en
onderwijzeressen”. Daarin toonde hij aan dat cijfers vaak op onzuivere gronden tot
stand kwamen en dat de beoordeling bij de tot dan toe bekende examens veel te
subjectief tot stand kwam. Onder andere daarom pleitte hij voor de oprichting van
een Centraal Instituut voor Toetsontwikkeling (CITO). Dat werd opgericht in
8
1967/1968. De aandacht de objectieve toetsing van opbrengsten had De Groot
opgedaan aan het einde van de jaren 50 in de Verenigde Staten. Daar bezocht hij het
Federal Institute dat zich bezighield met testen aan de hand van meerkeuzevragen,
een tot dan toe tamelijk onbekend fenomeen in Nederland. In eerste instantie was
de aandacht vooral gericht op het lager onderwijs, na 1985 het basisonderwijs. Later
kwam er steeds meer aandacht voor toetsing in het voortgezet onderwijs.
Uit eigen ervaring op het Gomarus College is bekend dat de voorspellende waarde
van een advies aan het einde van de tweede klas alleen op basis van resultaten van
toetsen een hachelijke onderneming is. In de afgelopen jaren is steeds ongeveer 10%
van de leerlingen met een ander diploma of zonder diploma van school gegaan in
vergelijking met het advies in klas 2 (bron Magister: leerlingvolgsysteem (LVS)
gebruikt op het Gomarus College)
In de recent verschenen Staat van het Onderwijs 2008/2009 (2010) schrijft de
inspecteur-generaal dat steeds meer scholen opbrengstgericht bezig zijn, maar dat
zelfreflectie nodig is en blijft. Scholen moeten hun eigen rol bij het bereiken van
prestaties onderkennen. Dat lijkt vanzelfsprekend, maar bij veel scholen die als zwak
of zeer zwak worden gekwalificeerd, blijkt men vaak de oorzaken buiten zichzelf te
zoeken. Vooral leerling-kenmerken of ziekte onder personeel worden als oorzaken
aangewezen.
1.3 Hoofdvragen en deelvragen Door dit onderzoek wordt duidelijkheid verkregen over de volgende hoofdvraag:
Op deze wijze kan er duidelijkheid ontstaan of er sprake is van een probleem en wat
daar aan te doen valt. Op basis van eigen praktijkervaring binnen het Gomarus
College, als docent Engels en leidinggevende is mijn ervaring dat velen met deze
problematiek worstelen, dan wel een pragmatische oplossing hebben gevonden.
Hoe moet volgens het docententeam van het Gomarus College
een toetssysteem functioneren waarin op basis van valide
toetsen recht wordt gedaan aan de kwaliteiten van de
leerlingen en voldaan wordt aan de door de overheid gestelde
doelen en dat geborgd is binnen een kwaliteitssysteem?
9
Deze hoofdvraag is op te splitsen in de volgende deelvragen:
1. Op welke wijze vindt nu toetsing plaats?
2. Wat zijn de didactische en organisatorische knelpunten in het huidige
toetssysteem?
3. Welke verbeteringen kunnen worden aangebracht om validiteit van toetsen te
vergroten?
4. Welke mogelijkheden worden gezien om deze verbeterde toetsing te borgen?
10
2 Theoretisch kader
2.1 Geschiedenis van toetsing
Je kunt stellen dat zolang er al geleerd wordt, zolang wordt er ook al getoetst. In de
Bijbel wordt al duidelijk dat stukken tekst uit de Heilige Schrift worden ingeprent en
gereciteerd. Ben Wilbrink (1995) geeft een aardig beeld van het toetsen door de
eeuwen heen. Hij beschrijft de eerste bekende schriftelijke toetsen die in de Tang
dynastie (vanaf 800 AD) werden afgenomen. Deze examens waren bijzonder zwaar
en van de duizenden deelnemers slaagden er slechts enkelen. Voor de niet
geslaagden moest opnieuw drie jaar worden gestudeerd, alvorens opnieuw deel te
kunnen nemen. De geslaagden werden de literati genoemd en genoten een enorm
aanzien en kregen vaak hoge functies in het Chinese ambtenarenapparaat. In
verschillende boeken worden deze examensessies beschreven en de titel China’s
examination hell van Miyazaki (1976) lijkt voor zich te spreken. In de vroege en hoge
Middeleeuwen betekende kennis uit het hoofd kennen. Het ging dan om vaak
Bijbelse teksten die geheel geciteerd konden worden. Vragen en antwoorden is de
dominante didactische werkvorm in het onderwijs. Dit vragen en antwoorden leidde
tot een catechetische methode. Een bijzonder voorbeeld ervan wordt beschreven
door Schotel (1875) als hij beschrijft hoe Arminius tot hoogleraar theologie wordt
toegelaten: "Daarenboven zou Arminius tot doctor in de godgeleerdheid (een eere die
vóór hem aan niemand bewezen was) worden bevorderd, voor en aleer hij in de
Universiteit mocht profeteren en lezen, en bij die gelegenheid de examinatie van
doctoren in de theologie in 't byweesen van den geheelen senaat der Universiteit
moeten ondergaan.'' (curatoren aan de Heeren van Amsterdam.) Het examen
"duurde twee dagen en eindigde met de schriftelijke verklaring van Gomarus,
Arnoldus en Helmichius: 'dat Arminius niets had verclaert dat zoude mogen strijden
met de confessie of catechismus, waarop zij elkander de hand gegeven en Arminius
met die professie geluc gewenscht hadden.'" (p. 76). Deze manier van toetsen zou tot
ver in de 19e eeuw gehandhaafd blijven op veel scholen en universiteiten.
Het leerstofjaarklassensysteem dateert uit
de 15e eeuw. In Zwolle was Joan Cele (zie
afbeelding) een begenadigd rector van een
Latijnse school die zo succesvol was dat
leerlingen overal vandaan kwamen om het
onderwijs in Zwolle te volgen. De stad had
rond 1500 ongeveer 5000 inwoners, maar
de school van Cele had tussen de 800 en
1000 leerlingen. Deze werden opgedeeld in
een acht verschillende groepen. Deze
groepen waren zo groot dat er binnen de
11
klas kleinere groepen werden gemaakt onder leiding van een leerling. Ieder half jaar
werden toetsen mondeling afgenomen en werd besloten of men naar een volgende
klas mocht gaan. Toetsing werd met name gedaan door reciteren, maar ook inzicht
werd door Cele in de afweging betrokken. Leerlingen werden gestimuleerd tot leren
door beloning en straffen. Lange tijd was straffen in de zin van lijfstraffen een
geaccepteerd verschijnsel. Hoewel meester Cele stevig strafte, hij hanteerde de plak
en roede met verve, maar volgens Schoengen (1911) was er sprake van een voor die
tijd humane vorm van straffen. Onder invloed van het humanisme werd steeds vaker
gebruik gemaakt van beloningen om studenten en leerlingen te motiveren. Soms
gebeurde dat door punten toe te kennen, andere keren door prijzen aan de beste
leerlingen/studenten toe te kennen. Vanaf het midden van de 19e eeuw worden deze
stelsels steeds vaker vervangen door een cijferstelsel. In onderstaande tabel wordt
een overzicht gegeven van hoe er in verschillende landen met cijfers wordt
omgegaan.
(bron: http://nl.wikipedia.org/wiki/Cijfer geraadpleegd op 24 oktober 2011)
12
Op scholen en universiteiten in Nederland en België wordt werk van leerlingen en studenten door middel van cijfers tussen 1 en 10 beoordeeld. Men tracht hiermee een zo objectief mogelijk beoordelingssysteem te verkrijgen. Bijkomend voordeel is dat men met cijfers gemiddelden kan berekenen, dus een beter beeld kan hebben hoe gepresteerd wordt over een langere periode. Men kan lineair tot een cijfer komen (wie bijvoorbeeld 65% goede antwoorden heeft krijgt een 6,5), niet-lineair (aftrek voor ieder fout antwoord, bijvoorbeeld 5 fout is een 7,5; 10 fout een 5), of via een puntentelling met formule en/of verdeelsleutel. Het is wettelijk vastgelegd dat deze cijfers tussen 1 en 10 moeten liggen[3], een nul kan dan ook officieel niet worden gegeven. Hoe het ook zij, de cijfers op een schoolrapport geven in België en Nederland de volgende beoordelingen weer:
cijfer betekenis
10 uitstekend
9 zeer goed
8 goed
7 ruim voldoende
6 voldoende
5 twijfelachtig
4 onvoldoende
3 ruim onvoldoende
2 slecht
1 zeer slecht
In de Verenigde Staten en een aantal Angelsaksische landen krijgt men letters in plaats van cijfers. In Frankrijk lopen de cijfers van 1 tot en met 20, waarbij 10 of hoger voldoende is, en een 8 of 9 onvoldoende maar compensabel. Dit systeem wordt ook toegepast op de Belgische universiteiten. In Rusland lopen de cijfers van 1 tot en met 5. Het equivalent van cum laude wordt daar gevormd door gouden en zilveren sterren. In Denemarken loopt de reeks tot 12. In Zwitserland lopen de cijfers van 1 tot en met 6. Soms is de betekenis ook omgekeerd, waarbij 1 voor goed staat en de beoordeling met het klimmen van de cijfers afneemt, dit is bijvoorbeeld het geval in Duitsland waar de cijfers van 6 tot 1 lopen. En in weer andere landen, zoals Zweden, doet men niet aan cijfers
13
2.2 Het doel van toetsing Moelands en Sanders (1996) kwamen tot een driedeling voor wat betreft het doel
van toetsen, uitgaande van het gebruiksdoel, namelijk een onderwijskundig
meetinstrument:
1.Meetinstrumenten die tot doel hebben de kwaliteit van een onderwijssysteem te
beoordelen
Met een onderwijssysteem wordt hier zowel een individuele school (mesoniveau) als
een verzameling scholen (macroniveau), bijvoorbeeld een onderwijstype, bedoeld.
Een voorbeeld van deze categorie is het periodiek peilingonderzoek voor basis- en
speciaal onderwijs (PPON) waarmee een grondslag wordt geboden voor een brede
discussie over de inhoud en het niveau van het onderwijs op landelijk niveau.
2. Meetinstrumenten die tot doel hebben de kwaliteit van de leerling te beoordelen
Binnen deze categorie wordt een onderscheid gemaakt tussen meetinstrumenten die
bedoeld zijn voor selectie, classificatie, plaatsing, certificering (beheersing).
3. Meetinstrumenten die tot doel hebben het onderwijsleerproces te beoordelen
Dit betreft meetinstrumenten op basis
waarvan een docent kan besluiten het
onderwijs aan een (groep) leerlingen
anders in te richten. Als voorbeeld kunnen
de toetsen genoemd worden die
ontwikkeld zijn in het kader van het
leerlingvolgsysteem voor het
basisonderwijs, zoals het Leerling- en
onderwijsvolgsysteem van CITO. Deze
instrumenten hebben primair tot doel het
onderwijs optimaal te laten aansluiten bij
de (cognitieve) ontwikkeling van de
leerling.
In 2011 is bij het CITO een brochure/boekwerk uitgekomen onder redactie van Piet
Sanders dat een schat aan informatie over toetsing bij elkaar brengt. Op
overzichtelijke wijze wordt nagegaan wat het doel van toetsing is.
Deels komt de indeling overeen met die uit 1996, maar duidelijk is ook dat er in die
15 jaren die ertussen zijn verstreken andere inzichten zijn gekomen over het toetsen
en doelen die daarmee gediend zijn. Sanders komt nu tot de volgende indeling met
een verdere onderverdeling in subdoelen:
14
1. Toetsen voor het beoordelen van leerlingen (microniveau). Hij maakt daarbij
verder een onderscheid tussen toetsen waarmee leerlingen worden
a. geselecteerd (HAVO diploma geeft recht op toelating tot het HBO)
b. geclassificeerd (aan het eind van het basisonderwijs wordt aan de hand van een
classificatieschema bepaald naar welk onderwijsniveau een leerling in het voortgezet
onderwijs mag gaan. Hierin spelen de CITO eindtoets en andere voortgangstoetsen
een belangrijke rol)
c. geplaatst (via een bepaalde route een doel bereiken, bijvoorbeeld een Mbo-
diploma via een Beroepsopleidende Leerweg (BOL) of een Beroepsbegeleidende
Leerweg (BBL), hierin kan een beroepentest een rol spelen)
d. gecertificeerd (summatieve toetsen, assessment of learning, afsluitende toetsen,
waarvan examens het bekendst zijn)
2. Toetsen voor het beoordelen van het onderwijsleerproces
Deze toetsen worden aangeduid als formatieve toetsen, assessment for learning. Ze
hebben tot doel om lesgevers te informeren over het verloop van het leerproces aan
individuele of groepen leerlingen. Het leerlingvolgsysteem van het CITO is hierin
zowel voor basisonderwijs als voortgezet onderwijs veelgebruikt.
3. Toetsen voor het beoordelen van groepen leerlingen en scholen
Hiervoor wordt naast de eerder genoemde CITO toetsen voor individuele leerlingen,
ook gebruik gemaakt van cijfers van de Inspectie van het Onderwijs, veelal verzameld
door DUO (Dienst Uitvoering Onderwijs), maar ook periodieke onderzoeken als COOL
(CohortOnderzoek OnderwijsLoopbanen) dat sinds 2007-2008 leerlingen van hun 5e
tot hun 18e volgt in basis- en voortgezet onderwijs en het MBO (Middelbaar
Beroepsonderwijs). Drie aspecten van de ontwikkeling van leerlingen staan in het
onderzoek centraal:
a. de cognitieve ontwikkeling: kennis en vaardigheden in het Nederlands, Engels en
rekenen/wiskunde;
b. de ontwikkeling van sociale competenties, waaronder burgerschapscompetenties;
c. de sociaal-emotionele ontwikkeling.
4.Toetsen voor het beoordelen van de kwaliteit van het onderwijs
Sinds 1987 wordt het PPON (Periodiek Peilingonderzoek van het Onderwijsniveau)
uitgevoerd. Hiermee wil het ministerie van Onderwijs zicht krijgen en houden op het
niveau van het onderwijssysteem. Het gaat niet om de resultaten van individuele
leerlingen, maar om het systeem van onderwijs. Heel bekend is hierbij ook het PISA
onderzoek (Programme for International Student Assessment) waarbij kennis en
15
vaardigheden van 15 -jarigen uit een groot aantal landen op het gebied van
leesvaardigheid, wiskundige en natuurwetenschappelijke geletterdheid worden
vergeleken . Regelmatig wordt naar dit onderzoek verwezen om de stand van het
Nederlandse onderwijs af te zetten tegen meer dan 60 landen uit de hele wereld.
In de scholen wordt het vaakst gebruik gemaakt van beoordelingstoetsen van het
werk van individuele leerlingen. De toetsing op microniveau. Dat gebeurt veel met
toetsen die bij een methode worden geleverd, maar ook aanvullend met
eigengemaakte toetsen.
2.3 Begripsbepaling opbrengstgericht werken Er bestaan veel verschillende beschrijvingen van leeropbrengsten en
opbrengstgericht werken. Om hierin een goede eigen keuze te kunnen maken is het
goed de theorie hierover op een rijtje te zetten.
Als we spreken over opbrengstgericht onderwijs (Adams, 2004 p.8) gaat het om “het
specifieke wat een leerling zou moeten leren als resultaat van een periode van
specifieke en ondersteunde studie. Het gaat hierbij om wat de leerling heeft bereikt
en niet om de intentie van de leerkracht. De opbrengsten kunnen heel breed of heel
smal worden beschreven. Het gaat dan altijd om een beschrijving van wat een
succesvolle leerling kan of kent aan het einde van een bepaalde leerperiode”
[vertaling].
De Universiteit van Warwick (UK) (2004-2009 p. 1)) beschrijft leeropbrengsten
(learning outcomes) als volgt: “de vaardigheden en kennis die een leerling bezit na
het succesvol beëindigen van een deel van het onderwijs” [vertaling]. Ze
onderscheiden daarin een viertal categorieën:
1. Kennis en begrip van het onderwerp
2. Vakspecifieke vaardigheden zijn praktische vaardigheden die zijn geïntegreerd in
de opleiding, zoals laboratorium vaardigheden, taalvaardigheden en
gespreksvaardigheden
3. Cognitieve vaardigheden, intellectuele vaardigheden zoals het begrip van
methodologie, synthese, evaluatie of het in staat zijn tot kritische analyse
4. Sleutelvaardigheden die gemakkelijk kunnen worden aangewend in andere
contexten, als daar zijn: mondelinge en schriftelijke communicatie, werken in een
team, probleemoplossend denken, rekenen en IT-vaardigheden [vertaling]
De Universiteit van Exeter (2009 voor het laatst gewijzigd p.1) beschrijft
leeropbrengsten op een andere manier: “dat wat een leerling kan laten zien na het
succesvol afronden van een module” [vertaling]. Het gaat dan om:
16
1. een duidelijke relatie met het niveau van leren
2. het geeft duidelijk aan welke beoogde winst in kennis en vaardigheden een
typische leerling hoort te behalen
3. het kan worden getoetst [vertaling]
Richard Frye (1999) van de Western Washington
University beschrijft het verschil tussen individuele
beoordeling van studenten in termen van learning
outcomes en de (openbare) verantwoording van
opleidingen met betrekking tot de resultaten. Er
moet dus een duidelijk onderscheid worden
gemaakt tussen assessment (beoordeling) en
accountability (verantwoording). Bij beide
onderdelen noemt hij voortdurende bijsturing via
de cyclus Plan, Do, Check, Act (PDCA-cyclus) van
groot belang.
Opvallend is dat opbrengstgericht werken met name in het basisonderwijs steeds
meer ingang vindt. Het ligt voor de hand om te denken dat hier vooral van belang is
geweest de start van het CITO met de Eindtoets Basisonderwijs. Deze begon in 1966
met de Amsterdamse Schooltoetsen, maar werd na de start van het CITO door deze
organisatie overgenomen en steeds verder ontwikkeld. In eerste instantie ging het
met name om taal, lezen en rekenen, maar in de loop der jaren is de range van de
test steeds verder uitgebreid. De tegenwoordige Eindtoets bestaat uit de
onderdelen: taal, rekenen/wiskunde,studievaardigheden en wereldoriëntatie,
waarbij deze vier onderdelen verder worden opgesplitst in subonderdelen.
Daarnaast zijn er steeds vaker voortgangstoetsen die door het CITO worden gemaakt
en op veel basisscholen worden gebruikt. Deze voortgangstoetsen beginnen al in de
laagste groepen (bv. ordenen, tijd en ruimte, beginnende geletterdheid). Vanaf 2007
werd er door Ledoux, Blok en Boogaard (2009) onderzoek gedaan voor het Ministerie
van Onderwijs naar opbrengstgericht werken in het basisonderwijs. De makers van
het rapport Opbrengstgericht werken; over de waarde van meetgestuurd onderwijs
spreken liever over meetgestuurd onderwijs. Dit is een bijna letterlijke vertaling van
data driven teaching, zoals dat onder andere bij Earl en Katz (2006) en Michael Fullan
(2007) wordt gebezigd. Ledoux et al spreken over “toetsen die gebruikt worden om
de effectiviteit van het onderwijs te onderzoeken en zo nodig te verbeteren”
In de 21e eeuw wordt er steeds meer aandacht besteed aan de opbrengsten van het
onderwijs. De inspectie rekent ook het voortgezet onderwijs hierop steeds meer af.
In 2002 werd een veranderde vorm van toezicht op het onderwijs ingevoerd. In
Veranderend Toezicht: De Inspectie van het Onderwijs en de Wet op het
17
onderwijstoezicht (2002) wordt al aangegeven dat men de kwaliteit van het
onderwijs wil beoordelen en bevorderen. Er moet op scholen systematisch aan
kwaliteitsbewaking worden gewerkt. Er wordt ingegaan op het nut en de noodzaak
van zelfevaluatie. Er wordt een duidelijk zicht geboden op elementen die een rol
spelen bij de beoordeling van kwaliteit. Bij opbrengsten gaat het dan om
leerresultaten en de voortgang in de ontwikkeling van leerlingen. Bij de inrichting van
het onderwijsleerproces gaat het dan om: leerstofaanbod, leertijd, pedagogisch
klimaat, schoolklimaat, didactisch handelen van leraren, leerlingenzorg en inhoud,
niveau en uitvoering van toetsen, tests, opdrachten en examens.
Ook in het voortgezet onderwijs is de inspectie van het onderwijs begonnen met
spreken over opbrengstgericht onderwijs. Steeds vaker worden resultaten van
scholen op het gebied van overgang van leerlingen en slagingspercentages, maar ook
cijfers voor het centraal schriftelijk examen aangeduid als leeropbrengsten. Deze
wijze van beschrijven is in het eerste decennium van de 21e eeuw in zwang gekomen.
Ook anderen (bv dagblad Trouw, Scholen moeten resultaten publiceren, 13 maart
1998) maken gebruik van deze indicatoren om scholen hieraan af te meten en ouders
voor te lichten. De opbrengstenkaarten van het voortgezet onderwijs zijn op het
wereldwijde web te raadplegen (http://tkrtp.owinsp.nl/). Duidelijk is wel dat velen
(waaronder ouders) veel moeite hebben dit te interpreteren. De beelden die
hierdoor ontstaan geven een heel grof beeld van de werkelijkheid. Er wordt slechts
aandacht besteed aan instroom-, doorstroom- en uitstroomgegevens en het
schoolexamen in relatie tot het centraal schriftelijk examen. Hierbij wordt de nadruk
gelegd op Nederlands, Engels en wiskunde, omdat de meeste leerlingen die vakken in
hun pakket hebben. Deze gegevens geven sturingsmogelijkheden, maar het is erg
lastig om te beoordelen waar nu precies in welke leerjaren en bij welke vakken
goede, minder goede of slechte resultaten worden behaald. Deze opbrengstkaarten
geven slechts informatie op hoofdlijnen. Misschien bruikbaar voor de
onderwijsinspectie en de ouders, maar om op microniveau te kunnen sturen
onvoldoende. Als een school beter in staat wil zijn om deze hoofdlijnen te analyseren
en sturen is het gewenst om nader in te zoomen op de opbrengsten per vak en per
leerjaar en misschien zelfs wel per docent. Om dat op een goede manier te doen is
een nadere bestudering van opbrengstgericht onderwijs door het gebruik van goede
toetsen noodzakelijk.
Met name in de Angelsaksische landen is steeds meer aandacht gekomen voor het
meten van leeropbrengsten (Onderwijsraad, 2006), omdat men daar middels
onderzoek door onderwijsinspectie samen met universiteiten tot de conclusie was
gekomen dat het niveau van het onderwijs naar een veel hoger niveau kon en moest
worden getild. In de Verenigde Staten zag het rapport “A nation at risk, towards
excellence for all” (Tomlinson, 1983) het licht waarin uitgebreid werd stilgestaan bij
de deplorabele staat waarin het onderwijs in de VS zich bevond. De uitkomsten van
18
een uitgebreid onderzoek deed op vele terreinen de haren ten berge rijzen. Er
mankeerde veel aan de verschillende curricula (veel punten konden worden gescoord
met onderdelen die niet tot de hoofdzaken van het onderwijs behoorden, zoals
sport, gezondheid, huwelijkscursussen etc.). Men was zeer ontevreden over wat het
onderwijs opleverde (veel minimumeisen waren ook vaak maximumeisen). Ook bleek
er vergeleken met veel andere landen weinig tijd aan school en huiswerk te worden
besteed en daarnaast werd het vak van leraar slecht gewaardeerd. Voor Europa was
het beeld niet wezenlijk anders. In 1995 werd het OESO-CERI-rapport Educational
Research and Development: Trends, issues and development gepubliceerd. Dit
rapport was snel uitverkocht, is nooit herdrukt, maar is nog steeds relevant. De
diagnose in het rapport was onder meer: “onderwijsonderzoek is
gefragmenteerd,vaak irrelevant, navelstarend, slecht van kwaliteit, en matig
bruikbaar” (Onderwijsraad, 2006 p.88). Alle reden om het onderzoek in het onderwijs
op een nieuwe en verbeterde wijze aan te pakken. De onderzoekspraktijk diende dus
te worden verbeterd en de onderzoeken moeten gaan over zaken die relevant zijn, er
toe doen. Ook daarom de keuze gemaakt voor kwaliteit van toetsing.
A.D. de Groot (1966) zag al in de 60-er jaren dat voor sommige vakgebieden het
moeilijk was om harde gegevens over opbrengsten te meten en daarom
introduceerde hij het zogenaamde leerverslag (learner report). Op het gebied van
Kunst en Cultuur deden leerlingen hierin verslag van hun leerervaringen. Deze
ervaringen waren volgens De Groot fundamenteel als zij door de lerende werden
herinnerd en gerapporteerd als belangrijk in hun eigen ontwikkeling. Eigenlijk ligt
daarin de oorsprong van een portfolio zoals dat in het laatste decennium van de
vorige eeuw een vlucht heeft genomen. Het is een manier van het meten van
opbrengsten.
2.4 Opbrengstgericht werken: wie, hoe en wat? Voor het basisonderwijs is een uitgebreid onderzoek gedaan naar het gebruik van
data ter verbetering van het onderwijs door Ledoux et al (2009) Zij geven de
voorkeur aan de term meetgestuurd onderwijs boven data driven teaching. In de
eerste plaats omdat het een Engelse term is, maar ook omdat het door de term
teaching exclusief lijkt te verwijzen naar leraartaken, terwijl ook de schoolleiding
hierin een taak heeft.
Meetgestuurd onderwijs definiëren zij als volgt: onderwijs waarbij betrokkenen zich
in hun taakuitvoering laten sturen door uitkomsten van metingen.(Ledoux et al, 2009,
p. 12)
Onder betrokkenen vallen bij een school vele groepen: leerlingen,
onderwijsgevenden en leidinggevenden, ouders, de omgeving, de inspectie, de
overheid met voor ieder een specifieke invulling. Ik kijk vooral naar de eerste drie die
direct binnen de school een rol vervullen. Leerlingen kunnen als ze veel fouten
19
hebben in een opdracht besluiten om de opdracht of een vergelijkbare nog eens te
doen, de onderwijsgevenden kunnen bij slechte prestaties besluiten nog eens (op
een andere manier) uitleg te geven en de leidinggevenden kunnen besluiten bij
slechte rekenresultaten in overleg met de docenten uit te zien naar een andere
rekenmethode. Metingen kunnen niet gelijkgesteld worden met toetsen. Metingen
kunnen veel ruimer worden geïnterpreteerd. Als eerste denk je aan
vorderingenmetingen, maar ook beoordelingen van schriftelijk werk. Daarnaast
spelen ook portfolio’s, onderzoeken naar welbevinden,
oudertevredenheidsonderzoeken een rol. Het is zelfs denkbaar dat metingen van het
CO2-gehalte in lokalen een rol kunnen spelen, omdat een te hoog gehalte nadelig is
voor leerprestaties.
Om maximaal resultaat te halen moet er een nauwkeurige cyclus worden doorlopen.
Hoe hoort de evaluatieve cyclus er ideaalgesproken uit te zien? (Blok, Otter en
Roeleveld, 2002):
1. Vastleggen van doelen en standaarden: het gaat dan bij doelen niet om termen
van onderwijsaanbod, maar doelen in termen van beheersing door leerlingen.
Daarnaast hoort te worden vastgelegd wat het streefniveau is. Dat kan middels een
scheiding voldoende/onvoldoende, maar even goed in een standaard minimum (te
behalen door bijv. 95% van de deelnemers) en standaard voldoende (te behalen door
75% van de leerlingen).
2. Het verzamelen van informatie: hierbij gaat het om informatie over het
vorderingenniveau van de leerling aan de hand van observaties, producten of
toetsen. Hoe regelmatiger deze informatie wordt verzameld, hoe hoger de kwaliteit
van de uitkomsten. Het spreekt voor zich dat de kwaliteit van de verzamelde
informatie van groot is belang voor de uitkomsten van de evaluatieve cyclus.
3. Het registreren van de vorderingen: het is van groot belang de vorderingen
adequaat te registeren. Was in het verleden de docentenagenda daarvoor het
instrument, in deze tijd zijn steeds vaker computersystemen hierbij ondersteunend.
Het is dan mogelijk individuele leerlingen te volgen, maar ook groepsgewijs kunnen
vergelijkingen worden gemaakt.
4. Het interpreteren van vorderingen: interpretatie kan pas zinvol plaatsvinden als
gebruik gemaakt wordt van een standaard/standaarden. Theoretisch is er sprake van
twee soorten standaarden: leerstofgericht (in hoeverre beheerst de leerling de
leerstof) of normgericht (als het vorderingenniveau wordt gerelateerd aan het niveau
van leeftijdgenoten). Vaak wordt hierbij onvoldoende onderscheid gemaakt. We
kennen de verschillen waarbij de ene docent vooral de inspanning van de leerling
beoordeelt, terwijl de ander meer kijkt naar wat beklijft van verwerkte leerstof.
20
5. Het nemen van beslissingen: het proces van evaluatie is pas compleet als op grond
van de interpretatie ook beslissingen worden genomen. Deze beslissingen kunnen op
verschillende niveaus plaatsvinden. Een leerling kan beslissen na een onvoldoende
harder te gaan werken, een docent kan een andere werkvorm kiezen, op een school
kan een studiedag worden georganiseerd
Verhoeven (2008) spreekt bij een dergelijk onderzoek van kwantitatief of kwalitatief
onderzoek in een empirische cyclus. Deze cyclus moet bestaan uit een geformuleerd
probleem, een theoretisch antwoord, een toetsing middels onderzoek aan de
empirie (ervaring), waarna een conclusie wordt geformuleerd. Vaak wordt deze
cyclus herhaald waardoor een empirische spiraal ontstaat.
De fasen in een dergelijk onderzoek vertonen veel overeenkomsten:
probleemanalyse (afbakening probleem-/vraagstelling), onderzoeksontwerp (hoe de
vraag beantwoorden/welke methode, tijd en middelen), dataverzameling, data-
analyse en rapportage.
In haar lectorale rede “De schoolleider als leerling” gaat Krüger (2010) in op redenen
waarom scholen onderzoekende en daarmee meetgestuurde scholen zouden
moeten willen zijn. Zij noemt 4 redenen die ik volledig onderschrijf en waarbij ik nog
één aanvulling wil geven.
1. De samenleving verandert in snel tempo en daarom zullen scholen mee moeten.
De autonomie van scholen is vergroot, zeggenschap over personeel, middelen en
curriculum zijn toegenomen. Er is sprake van een slag om de leerling, waarbij
profilering en externe waardering van de school een grote rol spelen.
2. We leven in een kennismaatschappij. We worden overstelpt met informatie en we
moeten (leerlingen, maar ook onszelf) leren daar kritisch mee om te laten gaan.
Wanneer wordt informatie kennis? Onderzoeksvaardigheden van allen bij de school
betrokken moeten worden vergroot.
3. Er is een steeds sterkere drang (intern en extern) tot verantwoording. Ik heb het al
gehad over de rol van de inspectie, maar ook naar veel anderen. Denk aan ouders,
gemeenten, bedrijfsleven. Transparante verantwoording levert vervolgens extra
autonomie op. Wij weten waar we mee bezig zijn, moet het adagium zijn.
4. Leraren moeten eigenaar worden van de onderwijskwaliteit. Als je niet sterk
extern wilt worden aangestuurd en vrijheid om je als professional verder te
ontwikkelen en je kwaliteiten tot zijn recht te laten komen wilt terugwinnen moet je
open staan voor feedback. Helaas is het vele jaren werkelijkheid geweest (en soms
nog?) dat docenten goed kunnen onderwijzen, maar zoveel moeite hebben met
leren. Earl en Katz (2006) spreken hier van een mindshift. Een heel andere manier
21
van aankijken tegen het leren van docenten en schoolleiders. Dat belang moet
worden ingezien.
Voor gereformeerde scholen is een vijfde reden wellicht ook geldig.
5. Leraren en leidinggevenden die werken op een school met een gereformeerde
identiteit als het Gomarus College, die werkelijk dienend bezig willen zijn, zoals de
Heer dat van hen vraagt en die een schoolplan hebben waarin het begrip presentie
(Baart, 2001/De Muijnck, 2002) hoog in het vaandel staat, zijn aan hun leerlingen
verplicht alles in het werk te stellen om hen zo goed mogelijk onderwijs te bieden.
Baart omschrijft presentie als volgt: “Een praktijk waarbij de zorggever zich
aandachtig en toegewijd op de ander betrekt, zo leert zien wat er bij die ander op het
spel staat – van verlangens tot angst – en die in aansluiting dáárbij gaat begrijpen
wat er in de desbetreffende situatie gedaan zou kunnen worden en wie hij/zij daarbij
voor de ander kan zijn. Wat gedaan kan worden, wordt dan ook gedaan. Een manier
van doen, die slechts verwezenlijkt kan worden met gevoel voor subtiliteit,
vakmanschap, met praktische wijsheid en liefdevolle trouw”. Om dat vast te kunnen
stellen is onderzoek onontbeerlijk.
2.5 Belemmeringen voor opbrengstgericht onderwijs Zoals eerder gezegd zijn er meerdere actoren op het gebied van opbrengstgericht
onderwijs. Zowel binnen de school als daar buiten (ouders, besturen, inspectie) is de
aandacht voor leeropbrengsten vergroot. Binnen de school gaat het dan om
leerlingen, docenten en schoolleiding. Eerder is al beschreven welke fasen moeten
worden doorlopen om succesvol te zijn als onderzoekende school. Welke redenen
zijn er aan te geven waarom veel scholen vaak niet verder komen dan de fases 2 en 3
(verzamelen en registreren van informatie)? Hier is onderzoek naar gedaan in het
basisonderwijs (Blok, Sleegers & Karsten, 2006) en uit eigen ervaring kunnen deze
redenen ook voor het voortgezet onderwijs worden onderschreven.
Dat er geen maximaal rendement wordt gehaald komt bij de verschillende groepen
door verschillende redenen.
Bij leerlingen: Verhoging van leeropbrengsten (resultaten) wordt met name bereikt
door het geven van feedback. Er zijn meerdere vormen van feedback (De Vries, 2008)
te onderscheiden: persoonsgericht en taakgericht. Daarnaast kan deze positief of
negatief zijn. Uit onderzoek is gebleken dat positieve feedback het gunstigste
resultaat oplevert. Om het lerend vermogen te vergroten is het ook van groot belang
dat deze feedback taakgericht is. Te vaak wordt geen of negatieve (persoonsgerichte)
feedback gegeven.
Bij docenten: Er zijn verschillende vormen van toetsing, formatief als toetsen worden
gebruikt in de loop van het onderwijsproces om het leerproces bij te sturen en
summatief als toetsen achteraf worden gebruikt om vast te stellen welke
22
leervorderingen zijn gerealiseerd. Vaak wordt summatief getoetst en te weinig
taakgerichte feedback gegeven (Black & William, 1998). Docenten hebben te weinig
weet van de (volledige) evaluatieve cyclus. In het voortgezet onderwijs wordt vaak
gebruik gemaakt van bij een methode geleverde toetsen. De waarde ervan wordt
weinig ter discussie gesteld en vaak zijn ze niet of slechts beperkt genormeerd.
Binnen de opleidingen voor docenten (onderzoek bij een tiental PABO’s) is wel
aandacht voor het juiste gebruik en de juiste interpretatie van toetsen, maar meestal
gaat het om een analyse per leerling en wordt het groepsniveau niet meegenomen
(Ledoux et al, 2009). Tenslotte wordt de evaluatieve cyclus als tijdrovend ervaren en
veel docenten geven aan daar onvoldoende tijd voor te nemen.
Bij managers: op scholen zijn veel meetuitkomsten beschikbaar (cijfers op toetsen,
tevredenheidonderzoeken, portfolio’s etc.). Er lijkt bij het management sprake te zijn
van kennisachterstand. Men is vaak onvoldoende geschoold in het toepassen van de
evaluatieve cyclus, met name het interpreteren van vorderingen en het (laten)
nemen van maatregelen (Blok, Sleegers & Karsten, 2006). Daarnaast is er ook sprake
van terughoudendheid om meetresultaten breder bekend te maken, omdat dit (als
de resultaten tegenvallen) negatieve gevolgen kan hebben voor de school (bij o.a.
ouders en inspectie)(Ledoux et al, 2009).
2.6 Conclusie
Gedurende de afgelopen 100 jaar is er steeds meer aandacht gekomen om
opbrengsten van onderwijs te meten. Diverse termen worden daarbij gebruikt. In dit
onderzoek zal de term meetgestuurd onderwijs of data driven teaching gebruikt
worden. De definitie hiervan luidt: toetsen die gebruikt worden om de effectiviteit
van het onderwijs te onderzoeken en zo nodig te verbeteren waarbij opgemerkt moet
worden dat alleen het gebruik van goede toetsen niet per definitie leidt tot beter
inzicht in de competenties van de leerling. Daarvoor is het nodig de hele evaluatieve
cyclus te doorlopen.
Binnen de school moeten alle actoren in het onderwijsleerproces betrokken zijn bij
het vergroten van de opbrengsten van het onderwijs. Leerlingen moeten goede (liefst
positieve) taakgerichte feedback krijgen, docenten moeten extra aandacht besteden
aan het maken van de juiste toetsen, beter voorbereid worden op het gebruiken van
de hele evaluatieve cyclus (leidend tot een spiraal) en extra tijd steken in dit
(leer)proces. Het management moet voldoende geschoold zijn om te ondersteunen
en sturen waar nodig en de angst kwijtraken om ook eens slechte resultaten te laten
zien. Als de cyclus goed wordt toegepast kan dat alleen maar leiden tot verdere
verbetering van leerproces en -resultaten.
Meetgestuurd onderwijs is onderwijs waarbij betrokkenen zich in hun taakuitvoering
laten sturen door uitkomsten van metingen. Metingen dienen plaats te vinden na
vaststelling van doelen en standaarden, het maken en afnemen van goede toetsen,
23
een juiste vastlegging van deze gegevens en na interpretatie/analyse een juiste
bijstelling van de toetsing.
3 Dataverzamelingsmethode Voor het onderzoek naar de kwaliteit van toetsing op het Gomarus College wordt in
dit onderzoek gebruik gemaakt van zowel een kwantitatief deel, de zogenaamde
survey (Verhoeven, 2008), als van een kwalitatief deel, een workshop of interactieve
modelbouw (Swanborn, 2006). Er is gekozen voor deze twee stappen om in eerste
instantie breed vast te stellen dat de verwachte problematiek zich ook werkelijk
voordoet en in welke mate, om vervolgens te kijken welke verbeteringen daar zijn te
maken.
3.1. Kwantitatief onderzoek (survey) Het eerste deel van het onderzoek is bedoeld om vast te stellen of en in hoeverre het
veronderstelde probleem zich voordoet op het Gomarus College. Is er sprake van
twijfel over de kwaliteit van toetsing bij degenen die daar iedere dag mee bezig zijn,
namelijk de docenten. In dit onderzoek willen we weten hoe de docenten
momenteel de situatie rond toetsing ervaren. Daarom is gekozen voor een survey
onderzoek. Het is minder makkelijk om daarmee causale verbanden aan te geven.
Dat is ook niet de bedoeling van dit deel van het onderzoek. Het surveyonderzoek is
gehouden door middel van een vragenlijst. De vragenlijst is bedoeld om een
antwoord te vinden op de eerste twee deelvragen: Op welke wijze vindt de toetsing
nu plaats en wat zijn de didactische en organisatorische knelpunten die worden
ervaren in het huidige toetssysteem? De laatste vraag is een open vraag en daarmee
kwalitatief van aard en leidt tot minder gestructureerde antwoorden. Deze vraag
helpt om ook de derde deelvraag te beantwoorden: welke verbeteringen kunnen
worden aangebracht om de validiteit van toetsen te vergroten? Deze deelvraag
vraagt naar meningen en ideeën. Kwalitatieve open vragen zijn daarvoor het meest
geschikt (Verhoeven, 2008).Het levert ook input voor het tweede deel van het
onderzoek. De vragenlijsten zijn per mail aan de deelnemers van de steekproef
toegezonden. Bij de vragenlijst is een begeleidende brief gestuurd om het doel van
het onderzoek aan te geven en hoe er daarna mee zal worden omgegaan.
Op het Gomarus College in Drachten werken ongeveer 25 docenten. Het aantal
docenten op alle vestigingen van het Gomarus College is ongeveer 250. Door
meerdere collega’s, zowel leidinggevenden als docenten is gevraagd om het
onderzoek uit te breiden naar het hele Gomarus College. Daarmee gaat het dan om
ongeveer 250 onderzoekseenheden. Dat maakt het betrekken van alle eenheden in
het onderzoek tot een heel bewerkelijke opgave en daarom is gekozen voor een
systematisch gestratificeerde steekproef uit de 7 andere locaties van het Gomarus
College. In eerste instantie is de vragenlijst voorgelegd aan alle docenten van de
24
locatie Drachten. Hierbij gaat het dus om een populatie onderzoek van de populatie
docenten in Drachten. Van de overige vestigingen zijn steeds acht docenten
benaderd. Op alfabetische volgorde te beginnen met de A. Dit is een systematische
gestratificeerde steekproef (Verhoeven. 2008).De analyse heeft plaatsgevonden op
basis van alle geretourneerde vragenlijsten, zowel uit Drachten als uit de andere
locaties. Dit is geen probleem om dat er waarschijnlijk weinig verschil zal zijn omdat
verondersteld mag worden dat de antwoorden van respondenten uit Drachten niet
sterk af zullen wijken van de andere vestigingen, omdat toetsing vaak berust op
schoolbrede afspraken die in de vakgroepen zijn gemaakt. De systematisch
gestratificeerde steekproef is getrokken uit de schoolgids Gomarus College 2010-
2011. Dit is het steekproefkader (Baarda, 2006). Van ieder locatie zijn de eerste acht
docenten op alfabetische volgorde benaderd te beginnen met de letter A Er zijn dus
56 respondenten benaderd, naast de 25 uit Drachten (hele populatie). Er is geen
rekening gehouden met de verschillende groottes van de 7 locaties. De keuze voor de
steekproefgrootte is afhankelijk van: de heterogeniteit van de steekproef, de vereiste
nauwkeurigheid en het karakter van het onderzoek (Baarda, 2006). Wat het eerste
betreft is er sprake van allemaal docenten, maar met veel verschillende variabelen en
eigenschappen in de zin van sekse, vakgebied, ervaring en opleiding. Het onderzoek
is bedoeld om een globaal beeld te krijgen. De nauwkeurigheid is van lager belang. In
dit onderzoek worden ruim 80 eenheden uit een populatie van 250 benaderd. Omdat
de gegevens niet in kruistabellen onderling met elkaar vergeleken worden is een
respons van minimaal 30 noodzakelijk (Baarda, 2006 p. 166).
Het onderzoek is ethisch verantwoord, omdat de respondenten anoniem en vrijwillig
meewerken en de gegevens geen negatieve effecten voor de respondenten kunnen
hebben. Om de anonimiteit zoveel mogelijk te waarborgen zijn er geen persoonlijke
gegevens in de enquête opgenomen.
Het grootste deel van de data wordt gestructureerd verzameld middels een
vragenlijst met keuzemogelijkheden. Voordelen van een vragenlijst zijn: groot bereik,
anoniemer dan een mondeling interview, de doelgroep is middels e-mail eenvoudig
bereikbaar. Naast een aantal vragen over de situatie van de respondent (locatie, vak,
methodetoetsen) worden 24 stellingen voorgelegd. Deze vragen zijn gegroepeerd
rondom de evaluatieve cyclus (Blok, Otter en Roeleveld,
2002) zoals die wordt beschreven in het theoretisch
kader. De voorgestelde vragenlijst is opgenomen als
bijlage 1. Voor de vragenlijst is gebruik gemaakt van de
zogenaamde Likertschalen, genoemd naar Rensis Likert
(zie foto), die deze schalen in 1932 voor het eerst
gebruikte. Er kan gekozen worden voor een even aantal
keuzemogelijkheden (4 of 6) of een oneven aantal (5 of
7). Voordeel van de eerste is dat men niet altijd kan
25
kiezen voor het middenantwoord, maar dat kan ook weer tot een bepaalde frustratie
leiden. Een oneven schaal levert vaak een gemiddelde score op vanwege wat
centrale tendentie wordt genoemd. Voor dit onderzoek wordt gekozen voor een
zespuntsschaal, vooral om te voorkomen dat het middenantwoord vaak wordt
gekozen (Verhoeven, 2008). Deze schaal loopt van helemaal mee eens (1) tot
helemaal mee oneens (6). Hoewel dit in principe een ordinale schaal betreft is het
mogelijk om een intervalmeetniveau toe te kennen (Verhoeven, 2008 p.211-212). Er
wordt verondersteld dat de afstand tussen de zes keuzemogelijkheden vergelijkbaar
is waardoor er ook mee gerekend kan worden met gemiddelden en
standaarddeviaties. De beweringen moeten dan wel op een gelijke wijze worden
gesteld of omgekeerd worden toegepast. De vragen a tot en met w zijn allemaal zo
gesteld dat een lage score een gewenste uitkomst oplevert. Vraag x levert bij een
lage uitkomst een score op die ongewenst is. Hier is een hoge score een gewenste
uitkomst. De vragenlijst is aan collega studenten voorgelegd voor commentaar. Twee
collega’s gaven enkele suggesties voor verbeteringen, waar gebruik van is gemaakt.
Dit vergroot de betrouwbaarheid (Verhoeven, 2008). Vanwege een voldoende grote
steekproef en een heldere en consistente vragenlijst is de validiteit van het
kwantitatieve onderzoek gewaarborgd. Het onderzoek middels vragenlijst en het
gesprek in de workshop zorgt voor triangulatie van onderzoeksmethoden. Dit
vergroot de betrouwbaarheid van de uitkomsten. Wat betreft de validiteit is de vraag
of er wordt gemeten wat we beogen te meten. De theoretische onderbouwing met
de evaluatieve cyclus en de vragenlijst die daarom heen is gemaakt geeft voldoende
vertrouwen dat gemeten wordt wat wordt beoogd.
3.2 Kwalitatief onderzoek (workshop) Het tweede deel van het onderzoek is een kwalitatief deel. Waarom een kwalitatief
deel? Omdat we op zoek zijn naar meningen en ideeën. Om deelvraag drie en vier te
kunnen beantwoorden moeten er ideeën en meningen verzameld worden. Dit vraagt
om onderzoeksmethoden die recht doen aan de veelheid en diversiteit van
antwoorden. Kwalitatieve onderzoeksmethoden zijn hier bij uitstek geschikt voor.
Verhoeven (2008) zegt hierover dat bij deze vorm van onderzoek de beleving door de
onderzochte centraal staat. Het is interpretatief van aard en in tegenstelling tot
kwantitatief onderzoek worden geen meetbare gegevens verzameld, geen causale
verklaringen gezocht. Centraal staat de betekenis die de onderzochte aan situaties
geeft.
De combinatie met een kwantitatief deel kan leiden tot een beter inzicht. De stelling
is te verdedigen dat in veel gevallen de combinatie van kwalitatief en kwantitatief
onderzoek uiteindelijk tot meer inzicht leidt in het gekozen probleemveld (Baarda,
2009 woord vooraf). Doelstelling is om verbeteringen in het toetsingsproces te
bewerkstelligen en deze verder te borgen (deelvragen 3 en 4). De ecologische
validiteit is gewaarborgd omdat de uitkomsten direct toepasbaar zijn op de locatie
26
van onderzoek en omdat de onderzoekseenheden direct betrokken zijn bij het
onderwerp is grotere commitment/betrokkenheid te verwachten (Swanborn, 2006)
omdat er sprake is van een workshop die op dezelfde wijze is gestructureerd als veel
andere vergaderingen op school. In Drachten werkt men dan met collega’s die men
allemaal kent, in Groningen zijn er ook minder bekende collega’s bij.
3.2.1. Methode
Om een antwoord op de deelvragen 3 en 4 te krijgen wordt gewerkt met een
mengvorm van een focusgroep en een workshop (Verhoeven, 2008). Als
basismateriaal voor deze groepen dient het materiaal dat is verzameld middels de
open vraag in de vragenlijst, waarin werd gevraagd naar ervaringen en ideeën.
Vervolfgens zijn de focusgroepen samengesteld. Hierin werd door middel van een
interview en workshop geprobeerd een antword te vinden op deelvragen 3 en 4.
Hierbij heeft de onderzoeker de rol van moderator. Er wordt gewerkt met een groep
van 8 personen. Eén groep wordt samengesteld uit de docenten van het Gomarus
College in Drachten en één groep uit docenten van de andere vestigingen. Er is
gekozen voor twee groepen om een zo hoog mogelijk rendement te behalen en ter
vergroting van de ecologische validiteit. In dit tweetal focusgroepen met ter zake
kundige docenten worden problemen bij toetsing geïnventariseerd, daarna
gecontroleerd of de genoemde problemen overeenkomen met de vastgestelde
problemen uit het kwantitatieve onderzoek of dat er nieuwe problemen worden
ingebracht. Vervolgens zullen de aandachtspunten die het vaakst worden genoemd
in een workshop verder worden uitgewerkt naar een plan van aanpak. Deze
workshops bestaan uit 8 collega’s per workshop. Er is sprake van een
groepsinterview waarin op basis van topics bepaalde onderwerpen aan de orde zijn
gebracht. De onderwerpen zijn: analyse van toetsen, normeren van toetsen, rol van
de vakgroep, gebruik van methodegebonden toetsen, enz.
Het moet gaan over toetsing en wat daarbij belangrijke aandachtspunten zijn.
Volgens Swanborn (2006) zorgt deze werkwijze voor betrokkenheid. Nadine van der
Pol (2011) schrijft over de verwerving van kennis in de traditie van Swanborn: “Er
wordt een team samengesteld van diverse soorten medewerkers en samen werken zij
aan een oplossing. Deze mensen weten precies wat de probleem gebieden zijn en
kunnen hun deel van de organisatie goed vertegenwoordigen. Ze zijn hier niet bezig
met toetsbare resultaten, maar met praktische ervaringen en inzicht. Uiteindelijk
moeten onderzoeksresultaten toepasbaar zijn, maar wat vooral belangrijk is, is dat ze
worden overgenomen en toegepast door de mensen. Als mensen zich niet kunnen
verplaatsen of identificeren met de resultaten blijven deze resultaten voor altijd stof
verzamelen in je bureaulade. Door de werknemers tot onderzoekers of
probleemoplossers te benoemen heb je al een kleine groep dragers van de oplossing.
Deze mensen kunnen met hun overtuiging anderen ook aanzetten tot het omtoveren
27
van de resultaten naar een oplossing of actie”.
3.2.2. Steekproef
De samenstelling in Drachten vond eerst plaats door vrijwillige aanmelding. We
noemen dat zelfselectie (Verhoeven, 2008). Voordeel hiervan is een duidelijke
motivatie voor het onderwerp. Nadeel kan zijn dat er sprake is van elitevertekening
(Baarda, 2009). Dat betekent dat je teveel afgaat op de informatie van mensen die
een centrale plaats innemen in de gekozen locatie, in dit geval Drachten. Opvallend
daarbij was dat alleen mannelijke respondenten zich zelf melden. Daarna zijn bewust
vrouwelijke collega’s gevraagd. Het gericht vragen is bedoeld om de groep te laten
bestaan uit collega’s van verschillende vakgroepen, een mix van mannen en vrouwen
en met verschillende jaren ervaring. Dit was van belang om een goede afspiegeling
van het personeel te krijgen en daarmee een representatieve groep. De workshop
van de overige vestigingen is samengesteld door aan de leidinggevenden te vragen
welke collega’s op het gebied van toetsing een bepaalde expertise hebben
opgebouwd. Aan de 7 vestigingen is aan de directeuren gevraagd 2 of 3 namen door
te geven. Uit de lijst van 17 namen zijn vervolgens acht benaderd om mee te werken.
Daarbij hebben twee om praktische redenen moeten afhaken en zijn twee
vergelijkbare collega’s gevraagd. Bij deze groep is ook weer gekeken naar de juiste
mix zoals in Drachten.
3.2.3. Instrument
Uit het kwalitatieve deel van het kwantitatieve onderzoek is geprobeerd een grootste
gemene deler te halen. De items die hieruit naar boven kwamen zijn besproken.
Vervolgens is binnen de workshops door middel van een mentossessie (iedere
deelnemer ontving twee rolletjes met elk 5 snoepjes welke mochten worden
verdeeld over de onderwerpen op de tafels) een volgorde van belangrijkheid
aangegeven. Elke deelnemer mocht aan de genoemde items een waarde toekennen.
Daarmee werd een rangorde van belangrijkheid binnen de workshop aangegeven.
Het was de deelnemers duidelijk dat ze vervolgens met de top 4 in tweetallen een
plan van aanpak gingen maken. Voor dit plan van aanpak was een format gemaakt.
Daarna is in groepen van twee collega’s gewerkt aan een plan van aanpak voor de
problemen met de hoogste prioriteit.
3.2.4. Analyse
Eerst is gekeken in hoeverre er items zijn genoemd die niet onder te brengen zijn bij
de kernitems. Vervolgens werd gekeken naar de volgorde van belangrijkheid zoals die
door de mentossessie in de beide workshops is aangebracht. Wat zijn de
overeenkomsten en wat de verschillen? Daarna leveren de tweetallen een achttal
plannen van aanpak die richting kunnen geven aan de aanpak na de onderzoeksfase.
28
Ook hierbij zijn overeenkomsten en verschillen te beschrijven. Tenslotte is gevraagd
of de tweetallen ideeën hebben die heel gemakkelijk zijn uit te voeren en of ze die
aan het papier willen toevertrouwen, het zogenaamd laaghangend fruit. Deze punten
kunnen zo mogelijk op korte termijn binnen de school worden opgepakt.
3.2.5. Betrouwbaarheid en validiteit
In dit kwalitatieve deel van het onderzoek is gewerkt met de items uit de open vraag
van het survey onderzoek. De items zijn opgegeven door 40 respondenten uit een
populatie van ongeveer 250. Hoewel er meer collega’s uit Drachten in de workshops
aanwezig waren is door de zorgvuldige verdeling over vakgroepen, ervaring en sekse
een groep ontstaan die een goede afspiegeling is van het Gomarus College als geheel.
Er is dus sprake van populatievaliditeit (Verhoeven, 2008).
Wat betreft de onderwerpenlijst/topiclijst bij de gesprekken is uitgegaan van de
terminologie van Blok, Otter en Roeleveld (2002). Hier wordt gebruik gemaakt van de
vijf fasen van de evaluatieve cyclus zoals die ook een belangrijke rol heeft gespeeld in
de vragenlijst van het surveyonderzoek. Hiermee is de betrouwbaarheid van het
onderzoek vergroot. De opzet van de workshops is in overleg met collega-studenten
gebeurd. Zij hebben waardevolle aanvullingen gegeven op de werkwijze. Onder
andere de suggestie om de gesprekken in de workshops op te nemen zijn waardevol
gebleken, omdat daardoor naderhand een deel van het gesprek nog eens te
beluisteren was. Ook het benadrukken van het zoveel mogelijk gelijk laten zijn van de
omstandigheden heeft gezorgd voor goed vergelijkbare resultaten. De beide
workshops werden gehouden op verschillende plaatsen. De eerste in Drachten op 24
november 2011 en de tweede op 28 november 2011 in Groningen op de
Magnolialocatie. Voor beide workshops was een lokaal beschikbaar. Een PowerPoint
presentatie zorgde voor de gelijke structuur in de workshop. In de bijlagen treft u een
overzicht aan van de voorbereidingen en uitvoering.
3.2.6. Ethische verantwoording
De respondenten van de workshops zijn voorgedragen door hun leidinggevenden.
Vervolgens zijn zij definitief gevraagd door de onderzoeker. Hun medewerking is op
vrijwillige basis. Er is hen vooraf duidelijk gemaakt dat het gaat om een eenmalige
gebeurtenis van ongeveer twee uren. Ook het tijdstip is ruim tevoren bekend
gemaakt, waarop een tweetal mogelijke deelnemers moest afhaken. De uitkomsten
zijn anoniem verwerkt en hebben voor de deelnemers geen nadelige effecten
(Baarda, 2006). Met name voor de docenten in Drachten zou er sprake kunnen zijn
van een machtspositie voor de onderzoeker. Voor hen was het lastiger om te
weigeren mee te werken aan het onderzoek. Toch denk ik dat er voldoende ruimte is
geweest voor de collega’s om open en eerlijk te antwoorden. Dat blijkt ook uit het
29
feit dat er weinig verschil zat in de beantwoording tussen Drachten en de overige
vestigingen.
Samengevat: Het antwoord op de deelvragen 1 en 2 (deels 3) zal worden gegeven door het
kwantitatieve onderzoek met een kwalitatieve eindvraag. De vragen 3 en 4 zullen
verder worden uitgewerkt in de workshops.
30
4 Resultaten
4.1 Kwantitatief onderzoek Uitkomsten van het kwantitatief onderzoek naar Toetsing op het Gomarus College. Er
is voor gekozen om geen diepgaande analyse met SSPS te doen, maar op basis van de
antwoorden een beeld te schetsen van de stand van zaken op het Gomarus College.
Dat levert weliswaar minder exacte uitkomsten, maar de bedoeling van het
kwantitatieve onderzoek is niet meer en niet minder dan het schetsen van een beeld.
1. Respons
Om een goed beeld te krijgen van de stand van zaken op het Gomarus College is de
vragenlijst voorgelegd aan alle collega’s in Drachten en de eerste 8 docenten uit de
schoolgids per vestiging (7 in totaal: Vondelpad 1, 2 en 3, Magnolia, Leeuwarden,
Assen en Zuidhorn)
Locatie Uitgezet Respons %
Drachten 25 17 68
Assen 8 7 87,5
Magnolia 8 4 50
Zuidhorn 8 1 12,5
Vondelpad 1 8 1 12,5
Vondelpad 2 8 2 25
Vondelpad 3 8 6 75
Leeuwarden 8 2 25
Totaal 81 40 49,3
Aantal docenten per locatie in schooljaar 2010-2011 (er zijn soms dubbelingen,
waardoor het totaal kleiner is dan de optelling van de verschillende locaties ).
Opvallend is de hoge respons in Drachten (werkplek onderzoeker) en de hoge
respons van de vestiging Assen en Vondelpad 3. Ook is opvallend de lage respons van
Zuidhorn en Vondelpad 1. In mindere mate geldt dat voor Leeuwarden en Vondelpad
2.
Locatie Docenten
Drachten 25
Assen 19
Magnolia 25
Zuidhorn 20
Vondelpad 1 63
Vondelpad 2 37
Vondelpad 3 55
Leeuwarden 17
Werkzaam op 2 vestigingen (schatting) 19-
242
31
Van de populatie van het Gomarus College (242 docenten) zijn er 81 benaderd met
de vragenlijst (33,5%) en hebben er 40 de vragenlijst ingevuld en geretourneerd. De
respons is daarmee 49,3% en van het totaal van de school heeft 16,5% deelgenomen
aan het onderzoek. Volgens Baarda (2006, p165) is de minimale grootte van een
steekproef 30. Omdat hier verder geen bewerkingen behalve een overzicht,
gemiddelden en standaarddeviaties uit zijn gehaald, is een groep van 40
respondenten verantwoord en levert dat een duidelijk beeld op van de stand van
zaken op het Gomarus College. Het is de bedoeling om een globaal beeld te krijgen.
2. Hoofdvak van respondenten
Hoofdvak Aantal Percentage
A exacte vakken 10 23,8
B talen 12 28,6
C zaakvakken 13 31
Overige vakken (creatief, gd, lo e.d.)
7 16,7
Totaal 42 100,1 (afrondingsverschil)
Waarvan in 2 categorieën 2 4,8
Er is een goede verdeling over de verschillende vakken, waardoor er een goed
totaalbeeld kan ontstaan
05
1015202530354045
Vakgroep van de respondenten
Aantal
32
3. Hoe blijven collega’s op de hoogte van kerndoelen en eindtermen?
Werkwijze Aantal N
A opleiding/studie 15 40
B via de uitgever 15 40
C internet 20 40
D anders 12 40
Niet van toepassing 0
Totaal 62
Iets meer dan de helft van de docenten geeft aan via meerder manieren op de
hoogte te blijven van de kerndoelen en eindtermen voorhun vak. Het meest wordt
gebruik gemaakt van internet, maar ook opleiding/studie en de uitgever worden vaak
als bron gebruikt. Bij anders werd vaak collega’s/vakgroep en vakliteratuur genoemd,
maar ook werd de examencoördinator, zelfreflectie en de methode genoemd.
4. Maak je voor je hoofdvak gebruik van een onderwijsmethode
Aantal N
Ja 39 40
Nee 0 40
Geen antwoord 1 40
0 10 20 30 40 50
Ja
Nee
Soms
Geen antwoordN
Aantal
33
Ik heb geen informatie kunnen vinden over het gebruik van een onderwijsmethode in
het voortgezet onderwijs, maar op het Gomarus College wordt voor alle vakken
gebruik gemaakt van een methode. Het ziet er wel naar uit dat door het gebruik van
ICT dit aantal de komende jaren verder zou kunnen afnemen of in digitale vorm kan
worden gebruikt.
5. Heeft deze methode ook toetsen die daarbij horen?
Aantal N
Ja 35,5 40
Nee 3,5 40
Geen antwoord 1 40
0 10 20 30 40 50
Ja
Nee
Geen antwoord
N
Aantal
0 10 20 30 40 50
Ja
Nee
Geen antwoord
N
Aantal
34
De halven zijn ontstaan doordat 1 respondent aangaf dat er ja en nee toetsen bij de
methode zitten. Bij bijna 89% van de respondenten zijn er toetsen bij de methode
beschikbaar.
6. Maak je gebruik van deze toetsen?
Aantal N
Ja 28 40
Nee 2 40
Soms 6 40
Geen antwoord 4 40
Het overgrote deel van de docenten maakt gebruik van bij de methode geleverde
toetsen (85%), hoewel het niet door iedereen even stelselmatig lijkt te gebeuren. Een
klein gedeelte (5%) kiest er voor om geen gebruik te maken van bijgeleverde toetsen.
De reden daarvoor is niet aan te geven, maar één van de respondenten geeft in een
voetnoot aan nog niet te weten of er ook bij de nieuwe methode gebruik van
gemaakt gaat worden, omdat deze respondent de toetsen erg slecht vindt. Zij die
geen antwoord gaven waren degenen die geen toetsen bij de methode hadden.
0 10 20 30 40 50
Ja
Nee
Soms
Geen antwoord
N
Aantal
35
7. Wat is de reden dat gebruik maakt van de toetsen?
aantal N
A leervorderingen vaststellen
30 40
B onderwijs effectief? 28 40
C motiveren van leerlingen 16 40
D anders 8 40
Geen antwoord 5 40
Veel respondenten gaven meerdere opties aan, waarbij het vaststellen van de
effectiviteit van het onderwijs (70%) en het vaststellen van de leervorderingen (75%)
het vaakst werden genoemd. Ook noemt bijna de helft dat het motiveren van
leerlingen een reden voor gebruik van deze toetsen is. Vraag blijft of het antwoord
anders zou zijn geweest wanneer gebruik zou zijn gemaakt van eigen toetsen. Door
een aantal respondenten zijn andere redenen genoemd: onderwijs evt aanpassen, je
moet cijfers hebben, kijken waar hiaten in hun kennis zijn om dit vervolgens bij te
spijkeren, om het niveau vast te stellen, om inzichtelijk te krijgen wat ze wel en niet
kunnen, om te evalueren: inzet/leerpotentieel. Om te motiveren, leerlingen zelf ook
hun vorderingen en/of zwakheden te laten zien. Voor een groot deel zijn deze
antwoorden onder te brengen bij A t/m C.
In het volgende deel zijn aan de respondenten beweringen voorgelegd over hun
toetsen. Zij werden gevraagd hierop te antwoorden met een cijfer 1 (helemaal mee
eens) tot en met 6 (helemaal mee oneens). Voor dit onderzoek wordt gekozen voor
een zespuntsschaal, vooral om te voorkomen dat het middenantwoord vaak wordt
gekozen (Verhoeven, 2008). Deze schaal loopt van helemaal mee eens (1) tot
0 10 20 30 40 50
A leervorderingen vaststellen
B onderwijs effectief?
C motiveren van leerlingen
D anders
Geen antwoord
N
aantal
36
helemaal mee oneens (6). Hoewel dit in principe een ordinale schaal betreft is het
mogelijk om een intervalmeetniveau toe te kennen (Verhoeven, 2008 p.211-212). Er
wordt verondersteld dat de afstand tussen de zes keuzemogelijkheden vergelijkbaar
is waardoor er ook mee gerekend kan worden met gemiddelden en
standaarddeviaties. De beweringen moeten dan wel op een gelijke wijze worden
gesteld of omgekeerd worden toegepast. De vragen a tot en met w zijn allemaal zo
gesteld dat een lage score een gewenste uitkomst oplevert. Vraag x levert bij een
lage uitkomst een score op die ongewenst is. Hier is een hoge score een gewenste
uitkomst. De volledige vragenlijst is te vinden in de bijlagen.
Vragen totaal gemiddeld sd
7a doelstelling voor maken toets 74 1,9 0,7
7b relatie met doelen onderwijsprogramma 100 2,5 1
7c toets om beginsituatie vast te stellen 185 4,7 1,1
7d afnemen diagnostische toetsen 138 3,5 1,5
7e eerst deeltoetsen 109 2,7 1,6
7f regelmatig meerkeuzetoetsen 135 3,4 1,7
7g normering van tevoren vastgesteld 81 2,1 1,2
7h nieuwe toets met collega bespreken 183,5 4,7 1,6
7i leerlingen om feedback vragen 141 3,5 1,3
7j analyseer de uitkomsten 102 2,6 1,1
7k resultaten met leerlingen bespreken 94 2,4 0,9
7l toets bijstellen na afname 138 3,5 1,4
7m welke vraag ligt op wel cognitief niveau 84 2,2 1,2
7n relateren aan eindexamen 82 2,8 1,5
7o een collega nog eens laten nakijken 212 5,3 1,2
7p ik heb een vaste normering 91 2,5 1,2
7q verschillende norm voor VMBO/HAVO-VWO 67 1,8 1,2
7r elke leerling gelijke beoordeling 87 2,2 1,2
7s toetsen elders bij zelfde methode bruikbaar 85 2,1 1,2
7t voldoende aandacht aan verbeteren toetsen 103 2,6 1,1
7u voldoende kennis om goede toetsen te maken 86,5 2,2 0,9
7v voldoende kennis om toets van goede norm te voorzien
83,5 2,1 0,9
7w extra scholing voor toetsing is gewenst 148 3,7 1,5
7x te weinig tijd om goede toetsen te maken 161 4 1,3
Gemiddeld 113,45 2,91 1,23
37
0
1
2
3
4
5
6
7a
do
elst
ellin
g vo
or
mak
en
to
ets
7b
rel
atie
me
t d
oe
len
on
der
wijs
pro
gram
ma
7c
toe
ts o
m b
egi
nsi
tuat
ie v
ast
te s
telle
n
7d
afn
eme
n d
iagn
ost
isch
e t
oe
tse
n
7e
eer
st d
eelt
oet
sen
7f
rege
lmat
ig m
eerk
euze
toe
tse
n
7g
no
rmer
ing
van
te
vore
n v
astg
este
ld
7h
nie
uw
e to
ets
me
t co
llega
be
spre
ken
7i l
eer
linge
n o
m f
eed
bac
k vr
agen
7j a
nal
yse
er d
e u
itko
mst
en
7k
resu
ltat
en m
et
lee
rlin
gen
bes
pre
ken
7l t
oe
ts b
ijste
llen
na
afn
ame
7m
we
lke
vraa
g lig
t o
p w
el c
ogn
itie
f n
ivea
u
7n
rel
ate
ren
aan
ein
dex
amen
7o
een
co
llega
no
g e
ens
late
n n
akijk
en
7p
ik h
eb e
en
vas
te n
orm
erin
g
7q
ver
sch
illen
de
no
rm v
oo
r V
MB
O/H
AV
O-V
WO
7r
elk
e le
erl
ing
gelij
ke b
eoo
rde
ling
7s
toet
sen
eld
ers
bij
zelf
de
me
tho
de
bru
ikb
aar
7t
vold
oe
nd
e aa
nd
ach
t aa
n v
erb
ete
ren
to
ets
en
7u
vo
ldo
en
de
ken
nis
om
go
ede
toe
tse
n t
e m
aken
7v
vold
oe
nd
e k
en
nis
om
to
ets
van
go
ed
e n
orm
te
voo
rzie
n
7w
ext
ra s
cho
ling
voo
r to
etsi
ng
is g
ewen
st
7x
te w
ein
ig t
ijd o
m g
oed
e to
ets
en
te
mak
en
score per item
gemiddeld
38
Uit deze vragen ontstaat het volgende beeld:
1. (7a) Vooraf is er bij toetsmakers een duidelijk beeld van de doelstelling van de
toets. Men is het daar gemiddeld iets meer dan mee eens en er zijn nauwelijks
afwijkende meningen daarover.
2. (7b) De vragen bij een toets worden behoorlijk gerelateerd aan het
onderwijsprogramma. Men is het daar gemiddeld meer dan een beetje mee eens. De
spreiding is hier iets groter. Enkele docenten zijn het hier een beetje mee oneens en
één is het er mee oneens.
3.(7c) Er worden weinig toetsen gemaakt om de beginsituatie vast te stellen. De
meeste docenten doen dat niet. Drie docenten geven aan het wel te doen.
4.(7d) Het afnemen van diagnostische toetsen gebeurt gemiddeld even vaak wel als
niet. De spreiding is hier fors. Er zijn docenten uitgesproken voorstanders, maar er
zijn er ook die het helemaal niet doen.
5.(7e) Het afnemen van deeltoetsen voor een grote toets is men het gemiddeld wel
een beetje mee eens, maar uit de individuele antwoorden blijkt dat men dat meestal
juist wel of juist niet doet.
6. (7f) Het afnemen van meerkeuzetoetsen laat een vergelijkbaar beeld zien. Men
doet het wel of men doet het niet. Daardoor ontstaat een gemiddeld beeld, maar de
spreiding is het breedst van alle vragen.
7.(7g) Het vaststellen van de normering vooraf wordt gemiddeld beantwoord met:
mee eens. Toch zijn er 5 collega’s (12,5%) die het daar (deels) niet mee eens zijn.
8.(7h) Het bespreken van een toets met een collega wordt door bijna niemand
gedaan. Slechts 3 personen (7,5%) zegt dat te doen (helemaal) mee eens. Gemiddeld
is de steekproef het daar niet mee eens. De spreiding is niet erg groot (1,2).
9.(7i) Op de vraag of feedback van leerlingen op een toets wordt gevraagd komt in
totaal een gemiddeld antwoord, maar met een redelijke spreiding. 7 respondenten
geven aan het hier (helemaal) niet mee eens te zijn, terwijl 9 aangeven het er mee
eens te zijn.
10.(7j) Op de bewering of de uitkomsten van een toets worden geanalyseerd
antwoorden de respondenten gemiddeld dat ze dat wel doen tot soms doen. 7
respondenten geven aan het in meer of mindere mate niet met de bewering eens te
zijn. De meeste respondenten zijn het met de bewering eens.
11.(7k) Op de vraag of de toets naderhand met leerlingen wordt besproken wordt
aangegeven dat dat wel gebeurt. Slechts 4 respondenten (10%) is het hier
gedeeltelijk mee oneens.
39
12. (7l) Op de bewering dat een toets na afname wordt bijgesteld komt in totaal een
gemiddeld antwoord, 10 respondenten (25%) zijn het er (helemaal) mee eens, 9
respondenten (22,5%) is het er (helemaal) mee oneens.
13.(7m) Op de bewering of de respondent weet op welke cognitieve niveaus de
vragen liggen is het gemiddelde antwoord: mee eens. Slechts 4 respondenten (10%)
geeft aan in meer of mindere mate het met deze stelling oneens te zijn.
14. (7n) Op de vraag of er een relatie wordt gelegd tussen toetsen en het examen
wordt gemiddeld gezegd dat men het daar deels mee eens is. De spreiding is
behoorlijk groot en velen hebben geen antwoord gegeven. Dat kan meerdere
oorzaken hebben: - er is geen examen in het vak, - men is niet op de hoogte van het
examen van het vak, - men weet het niet.
15. (7o) Op de vraag of men wel eens een collega opnieuw na laat kijken is het
antwoord behoorlijk eenduidig. Dat doet men niet. Slechts 2 respondenten (5%) doet
dat wel eens.
16. (7p) Op de vraag of men werkt met een vaste normering per toets is zit men
gemiddeld tussen mee eens en deels mee eens. 6 respondenten (15%) geeft aan het
daar (deels) niet mee eens te zijn.
17.(7q) Op de vraag of er verschillende normeringen worden toegepast voor VMBO-
en HV-toetsen is men gemiddeld sterk van mening dat het gebeurt. Hier werden de
meeste helemaal mee eens gescoord. Slechts 4 respondenten (10%) is het in meer of
mindere mate niet met de bewering eens.
18. (7r) Op de vraag of iedere leerling op dezelfde wijze wordt beoordeeld is het
gemiddelde oordeel mee eens, maar een spreiding van 1,2 geeft wel aan dat er
verschillend over wordt gedacht. 6 respondenten (15%) geeft aan het in meer of
mindere mate niet met de stelling eens te zijn.
19.(7s) Op de vraag of de toets van respondent op iedere andere school met
dezelfde methode is te gebruiken geeft men gemiddeld aan dat men het daar mee
eens is. 6 respondenten (15%) is het daar in meer of mindere mate mee oneens.
20.(7t) Op de vraag of er voldoende tijd wordt besteed aan het verbeteren van
toetsen scoort men een 2,6 gemiddeld, wat inhoudt dat men het er (deels) mee eens
is. 7 respondenten (17,5%) vindt dat niet (in verschillende sterktes)
21. (7u) Op de bewering of men voldoende kennis heeft om goede toetsen te maken
antwoorden de respondenten gemiddeld dat men het er mee eens is, maar 3
respondenten (7,5%) vinden dat het niet voldoende is.
40
22. (7v) Op de bewering of men voldoende kennis heeft om een toets van een goede
normering te voorzien geeft men gemiddeld aan daarover te beschikken. Toch geven
twee respondenten (5%) aan daar moeite mee te hebben en ook 7 geven aan het
slechts deels met de stelling eens te zijn (17,5%)
23.(7w) Op de vraag of extra scholing is gewenst ligt het gemiddelde antwoord in het
midden iets meer naar dat het niet nodig is. Toch geven 17 respondenten (42,5%) in
meer of mindere mate aan dat scholing gewenst is.
24. (7x) Op de bewering: Ik heb te weinig tijd om goede toetsen te maken geeft men
gemiddeld aan het daar deels mee oneens te zijn. De spreiding is redelijk groot, wat
ook blijkt uit het aantal respondenten (14 = 35%) dat het (deels tot helemaal) met de
stelling eens is.
4.2 Antwoorden bij deelvragen 1 en 2 De deelvragen luiden:
1. Op welke wijze vindt nu toetsing plaats ?
2. Wat zijn didactische en organisatorische knelpunten in het huidige systeem?
De verzamelde kwantitatieve gegevens geven dus aan dat:
- er maar weinig gebruik gemaakt wordt van toetsen om de beginsituatie vast te
stellen
- er een grote spreiding is te zien bij het afnemen van diagnostische toetsen
- er een grote spreiding is te zien in het afnemen van deeltoetsen voor een
eindtoets
- nieuw gemaakte toetsen nauwelijks met collega’s worden besproken
- de normering van de toetsen voor het grootste deel van tevoren wordt
vastgesteld
- aan leerlingen even vaak wel als niet feedback wordt gevraagd over een toets
- de uitkomsten van toetsen regelmatig niet of slechts gedeeltelijk worden
geanalyseerd, gezien het feit dat men het daar gemiddeld iets meer dan een
beetje mee eens is
- de relatie met het eindexamen door velen wordt gelegd, maar het lijkt er op dat
docenten die alleen lesgeven in de onderbouw deze relatie moeilijk (kunnen)
leggen
- docenten vrijwel nooit het werk van een collega nog eens nakijken om te zien of
de beoordeling overeenkomt
- op de stelling of er sprake van een vaste normering is dat heel vaak niet altijd het
geval is
- bijna iedereen een verschillende normering aanhoudt voor HV-klassen en VMBO-
klassen
41
- iedere leerling meestal dezelfde beoordeling ontvangt als andere leerlingen met
vergelijkbare scores
- er volgens de collega’s voldoende aandacht is voor het verbeteren van toetsen
- de meeste docenten vinden dat er voldoende kennis is om goede toetsen en
normeringen te maken, toch zijn er vrij veel die aangeven dat extra scholing in
een behoefte voorziet
- of er voldoende tijd is om toetsen te maken wordt niet helemaal duidelijk, op de
stelling dat er te weinig tijd is geeft men gemiddeld aan het er een beetje mee
oneens te zijn, maar de spreiding is vrij groot
4.3 Resultaten open vraag uit kwantitatief onderzoek Veel respondenten hebben naast de kwantitatieve gegevens ook bruikbare
kwalitatieve gegevens geleverd. De laatste open vraag waarin werd gevraagd om
knelpunten bij het maken van toetsen en ideeën om de toetsing beter te maken
leverden veel reacties op. Hieruit zou opgemaakt kunnen worden dat veel
respondenten bij de meerkeuzevragen niet alle ideeën en vragen kwijt konden. Dat is
ook een voorzien nadeel van een sterk gestructureerde vragenlijst. De open vraag
aan het einde levert een grote hoeveelheid extra informatie op waar in het
kwalitatieve deel van het onderzoek verder mee gewerkt kan worden. In de bijlage
treft u een overzicht aan van alle opmerkingen, die vervolgens zijn gerubriceerd als
ideeën, problemen en uitgangspunten.
4.4 Antwoorden bij deelvragen 2 en 3 De deelvragen luiden:
2. Wat zijn didactische en organisatorische knelpunten in het huidige systeem?
3. Welke verbeteringen kunnen worden aangebracht om de validiteit van toetsen te
vergroten?
- de wijze waarop wordt gekeken naar de bij de methode geleverde toetsen is enorm
divers (“Valkuil is voetstoots uitgaan van de kwaliteit van methodegebonden
toetsen”, “Het nadeel is dat sommige methodegebonden toetsen niet aansluiten bij
hoe je de stof hebt behandeld”, “Mijn uitgangspunt is wel dat ik er vanuit ga dat anno
2011 de methode goed bruikbare toetsen geeft”, “Ook zijn veel methodetoetsen
vooral gericht op de reproductie van kennis”, “Moeizaam als je de actualiteit bij je
toetsen wilt betrekken”, “Daarom zijn methodetoetsen een uitkomst. Geeft vrijwel
nooit problemen”)
- de normering van toetsen wordt als lastig ervaren (“Is een toets goed als 2/3e van
de leerlingen een voldoende heeft?”, “Ook moeilijk te normeren”, “De normering van
tevoren maken. Ik kan het niveau van de leerlingen nog moeilijk bepalen en dat
maakt het normeren van een toets erg lastig”, “Je zou voor het evalueren van toetsen
42
meer met collega’s moeten samenwerken”, “Normering vertel ik niet altijd van
tevoren. Eigenlijk nooit zelfs”)
- leesvaardigheid is bij leerlingen in het algemeen een probleem en dat levert dan
ook problemen op bij toetsing (“Zowel technisch als begrijpend lezen is lastig. Is wel
een basisvoorwaarde”, “Beperkte woordenschat bij leerlingen, dus toetsen soms
toelichten”)
- het maken en nakijken van toetsen kost erg veel tijd (“Nieuwe toetsen maken kost
veel tijd”, “Er gaat veel tijd zitten in het maken van goede toetsen”,”Zelf opdrachten
maken is ook erg intensief en bovendien weet ik niet of ze op niveau zijn , dus laat ik
het er vaak bij zitten”, “Tot slot vind ik de nakijkbelasting van toetsen erg zwaar”)
- maak meer gebruik van de Elektronische Leeromgeving (ELO) Fronter om toetsen te
delen (“Samenwerking met collega’s via Fronter spaart tijd en levert betere toetsen
op”)
- zorg voor een goede vaststelling van begin- en eindsituatie (“Maak gebruik van
begin- en eindtoetsen. Daardoor is er ook beter te differentiëren”, “Elkaars toetsen
maken binnen bijv. zaakvakken en er commentaar op geven )
- de vakgroep moet meer worden ingeschakeld voor het maken en normeren van
toetsen (“maak gezamenlijke afspraken over normen en normering”, “Binnen de
vakgroep gemaakte toetsen uitwisselen om van elkaar te leren”)
- meer aandacht voor de analyse van toetsen en de uitkomsten ervan (“Ik analyseer
toetsen van verschillende cohorten om tot verfijning van toets en normering te
komen”, “Meer inzicht en vaardigheden toetsen. Dan moet je al snel op zoek naar
extra/alternatieve toetsen of zelf aan de slag om een toets te maken”, “Het klassikaal
bespreken van toetsen kost erg veel tijd en leerlingen zijn vaak niet geïnteresseerd”)
4.5 Uitvoering van de workshops Uit deze grote hoeveelheid gegevens kunnen een aantal thema’s worden
gedestilleerd (zie onderaan pagina 38). In een workshopsetting is hierover verder
doorgesproken met respondenten en is er een aanzet tot een plan van aanpak
verbetering toetsing gemaakt. De samenstelling van deze workshopgroep of
focusgroep is op verschillende manieren tot stand gekomen. In Drachten hebben
enkele collega’s zich aangemeld en zijn anderen gevraagd omdat ze een welkome
aanvulling waren in de zin van sekse, vakgroep, leeftijd en/of ervaring. Dat zorgde
voor de volgende samenstelling:
docente wiskunde docente economie docente Frans docent studio A (zorgleerlingen)
43
docent aardrijkskunde/Fries docent Duits docent biologie/scheikunde docent Nederlands Voor de andere locaties is de volgende methode gevolgd. Aan de leidinggevenden
van deze locaties werd gevraagd een twee- of drietal collega’s te vragen om mee te
werken aan het onderzoek. Selectiecriterium was daar of leidinggevenden van
mening waren dat deze collega’s een zinvolle bijdrage konden leveren aan de
verbetering van de kwaliteit van toetsing. Enkele leidinggevenden reageerden direct
en kwamen met enkele namen, anderen moesten er aan herinnerd worden. Daarna
is op basis van het totaal aan namen een groep van 8 collega’s samengesteld die qua
sekse, vakgroep en leeftijd en/of ervaring een redelijke afspiegeling vormen van de
hele school. In deze groep was dat wel lastiger, omdat de aangemelde collega’s
substantieel jonger waren en uit minder verschillende vakgroepen kwamen. Het zou
kunnen dat de noodzaak om zich bezig te houden met verbetering van het
toetsinstrumentarium bij jongere docenten sterker wordt gevoeld dan bij oudere. In
deze groep ontbraken docenten die zaakvakken geven. Daardoor werd de
samenstelling als volgt:
docent Assen natuurkunde/scheikunde docente Leeuwarden Nederlands docente Vondelpad 2 Nederlands docent Magnolia wiskunde/rekenen docente Vondelpad 3 Duits docent Vondelpad 1 Nederlands docent Zh/Mag muziek docente Vondelpad 1 wiskunde
Bij beide bijeenkomsten is dezelfde werkwijze gevolgd. Na het welkom heten werd
kort uitgelegd wat het doel van de avond was. Daarna werden de mensen gevraagd
om zaken te noemen op het gebied van toetsing die hen bezighielden. Deze zaken
werden op een flap-over (Drachten) en een whiteboard (Magnolia) genoteerd.
Daarna heeft de onderzoeker aangegeven welke hoofdthema’s hij uit de 40
vragenlijsten had gedestilleerd waarna werd bekeken in hoeverre de door de groep
benoemde onderwerpen overeen kwamen met de lijst van 9 onderwerpen.
Vervolgens kregen alle deelnemers een tweetal rolletjes Mentos met elk 5 snoepjes.
Deze tien snoepjes mochten worden verdeeld over de onderwerpen om zodoende
een top 4 te krijgen. Er is gekozen voor een top 4 omdat er dan vervolgens in
tweetallen kon worden gewerkt aan de plannen van aanpak. Uit de vragenlijsten van
40 collega’s werden de volgende punten gedestilleerd waaruit een keuze kon worden
gemaakt. Deze keuze is gemaakt door de onderzoeker en lijkt de grootste gemene
44
deler van de opmerkingen in het kwalitatief onderzoek in zich te bergen. De volgorde
is willekeurig.
1. Rol van de vakgroep 2. Gebruik van methode gebonden toetsen 3. Gebruik van Cito-toetsen (e.d.) 4. Normering van toetsen 5. Relatie eindtermen – examenprogramma’s 6. Hoe maak ik een goede toets/scholing 7. Analyse van eigen toetsing 8. Het toetsen van vaardigheden
9. Het gebruik van diagnostische toetsen De beide groepen slaagden er ogenschijnlijk zonder moeite in om zaken te noemen
die zij van belang achten als het gaat om toetsing op het Gomarus College. In de
bijlage worden alle suggesties genoemd. Na het benoemen van de eigen
toetsonderwerpen werd gezamenlijk bekeken in hoeverre de genoemde
onderwerpen overeen kwamen met bovengenoemde negen die de grootste gemene
deler vormen uit de opmerkingen bij het kwantitatieve deel van het onderzoek. Bij
beide groepen werden alle onderwerpen op één na gerangschikt bij de negen
hierboven genoemde. Beide groepen hielden één onderwerp over dat er niet onder
kon worden geschoven. In Drachten ging het om het vervolg na de analyse van
toetsen en op de Magnolia het onderwerp efficiënt toetsen.
Na het bespreken van de zelf ingebrachte onderwerpen werden op de tafels A4tjes
gelegd met de negen hoofditems daarop. Toegevoegd werd in beide groepen het
onderwerp dat niet onder te brengen was. Vervolgens mochten alle deelnemers elk
maximaal 10 snoepjes verdelen over de bladen op de tafels. Hier werden enkele
minuten voor uitgetrokken. Opvallend daarbij was dat mensen best wel moeite
hadden om tot een juiste verdeling te komen. Grote verschillen waren daarbij
zichtbaar. Sommigen gingen geheel hun eigen gang, anderen gingen met elkaar de
discussie aan en pasten de aantallen af en toe aan. Na drie minuten werd de
eindstand opgemaakt.
Uitkomsten Drachten
1 Normering van toetsen 14 2 Analyse van eigen toetsen 11 3 Hoe maak ik een goede toets/scholing 11 4 Vervolg na analyse van toetsing (zelf toegevoegd) 10 5 Gebruik van Cito-toetsen voor schoolvorderingen 10 6 Toetsen van vaardigheden 10 7 Relatie eindtermen/examenprogramma’s 5 8 Rol van de vakgroep 4 9 Gebruik van diagnostische toetsen 3 10 Gebruik van methode gebonden toetsen 2
45
Opvallend is dat de eigen inbreng van Drachten bij de top vier zit. Weliswaar samen
met twee andere onderwerpen die in eerste instantie tien snoepjes kreeg
toegewezen. De keuze hebben we daarna bepaald door een ieder nog twee snoepjes
te geven en deze over de drie onderwerpen die in eerste instantie tien punten kregen
te verdelen. Toen werd dit onderwerp eerste van de drie.
Uitkomsten Magnolia 1. Analyse van eigen toetsen 17 2 Normering van toetsen 13 3 Het toetsen van vaardigheden 13 4 Relatie eindtermen/examenprogramma’s 13 5 Hoe maak ik een goede toets/scholing 12 6 Rol van de vakgroep 10 7 Gebruik van Cito-toetsen voor schoolvorderingen 4 8 Het gebruik van diagnostische toetsen 3 9 Efficiënt toetsen (zelf toegevoegd) 3 10 Gebruik van methode gebonden toetsen 2
Een scherpe teller heeft gezien dat er hier 90 snoepjes zijn verdeeld. De
onderwijskundige heeft ook meegedaan in de toekenning van de punten bij de
onderwerpen. Bij de verdeling hier leek het een rol te spelen dat de collega’s elkaar
minder goed kenden. Er vond minder discussie plaats dan in Drachten. De keuzes zijn
hier sterker individueel bepaald. In hoeverre er een verschil is ontstaan doordat er
geen collega’s met zaakvakken aanwezig waren in de Magnoliagroep kan niet met
zekerheid worden gezegd.
Vergelijking uitkomsten mentossessie
Het is opvallend dat de nummers 1 en 2 in Drachten en Magnolia, weliswaar in
omgekeerde volgorde, het belangrijkst worden gevonden. De analyse van toetsen en
de normering ervan zijn beide als heel belangrijk aangemerkt. Ook het toetsen van
vaardigheden neemt in beide groepen een belangrijke plaats in. Evenals het thema:
hoe maak ik een goede toets en scholing. Er zit een behoorlijk verschil in de
beoordeling van het gebruik van Cito-toetsen voor schoolvorderingen. In Drachten
hoorde het bij de belangrijkste onderwerpen, op de Magnolia niet. Op de Magnolia
werd veel belang gehecht aan de relatie eindtermen/examenprogramma, waar dat in
Drachten niet het geval was. De reden hiervoor zou kunnen zijn dat meerdere
respondenten in de Magnoliagroep geen of beperkte ervaring heeft met
examenklassen, waar dat in de Drachtengroep bij vrijwel iedereen wel het geval was.
De Magnoliagroep hechtte meer waarde aan de rol van de vakgroep om die verder
uit te werken. Beide groepen hebben weinig behoefte om verder te werken aan een
plan voor methode gebonden toetsen en diagnostische toetsen.
46
Naast de acht leden van de focusgroep was er op de Magnolia ook nog een gast
aanwezig. Op verzoek van een leidinggevende was zij aanwezig, omdat door haar
leidinggevende er vanuit gegaan werd dat er een vervolg op deze studie zou komen,
waarbij ook de onderwijskundige zou worden ingeschakeld. Dat voor gereedkomen
van het onderzoek het belang van het onderwerp op deze wijze wordt onderstreept,
geeft moed voor het vervolg.
4.6 Uitkomsten plannen van aanpak In Drachten
1. Normering van toetsen: om te zorgen voor een juiste normering en de borging van
de resultaten laat dit tweetal 5 docenten van hetzelfde vak eerst individueel bij een
toets vastleggen wat de grens voldoende/onvoldoende is, wat de puntenverdeling
per onderdeel is en op basis waarvan die puntenverdeling zo is. Vervolgens gaat het
5-tal in overleg om te komen tot 1 correctiemodel, scores en normering. Deze toets is
dan het werkmodel/ijkpunt voor dat vak en dat niveau. Verantwoordelijk is de
vakgroep die uit haar midden een verslaggever aanwijst.
2. Analyse van eigen toetsen: Maak heldere afspraken over de hoeveelheid kennis,
inzicht en vaardigheden die er voor een bepaald vak getoetst moet worden op
bepaalde niveaus. Ga vervolgens na of deze afspraken bij alle vakken worden gehaald
bij bestaande toetsen. Pas de toetsen aan. Er wordt een voorzet gedaan voor de
beoordeling:
Kennis: T 60% moet voldoende zijn, H 70% moet voldoende zijn. V 80% moet
voldoende zijn. Inzicht: T 65% moet voldoende zijn, H 75% moet voldoende zijn, V
75% moet voldoende zijn
Men komt daarbij tot de volgende beoordeling, waarbij de vaardigheden buiten
beschouwing zijn gelaten:
Toetscijfer: (% kennis x cijfer kennis) + (% inzicht x cijfer inzicht)
100
3. Hoe maak ik een goede toets: Er moet een checklist komen waaraan een goede
toets moet voldoen. Groep heeft informatie gehad over RTTI van Docentplus (zie
voor uitleg hoofdstuk 5). Dat vraagt om scholing. Hoeft geen lang traject te zijn.
Vakgroep speelt hierin een belangrijke rol. Docenten blijven verantwoordelijk en
leggen verantwoording af bij MT en toetsing maakt onderdeel uit van de
beoordeling.
47
4. Vervolg na analyse van toetsing: er wordt een lans gebroken voor het
Basis/Herhaling/Verrijkingsstof (BHV) model. Als methode er niet in voorziet zelf
materiaal maken en uitgevers bewerken. Vooral uitwerken daar waar kennis en
inzicht wordt gestapeld (talen en exact). Maak de verrijkingsstof niet al te moeilijk,
maar vooral ook leuk. Analyseer goed waardoor iemand hoog of laag scoort.
Op de Magnolia:
1. Analyse van eigen toetsen: veel factoren kunnen van invloed zijn op de resultaten
van leerlingen bij een toets. Laat de toetsen beoordelen door je collega’s van de
vakgroep. Maak daarbij gebruik van een afvinklijstje. Dat zou RTTI kunnen zijn.
2. Normering van toetsen: Doel is om meer inzicht te krijgen in eigen toetsen. Pas
meetbaar bij eindexamen. Kennis rondom eindexamens moet worden vergroot.
Moet alles wat je doet worden getoetst. Toetsen goed uitwerken en tijdloos laten
zijn. Verantwoordelijkheid voor toetsen ligt heel breed.
3. Toetsen van vaardigheden: specifiek van Nederlands en muziek vanwege vak
docenten. Omschrijf vaardigheden per leerjaar en niveau. Kijk naar de eindtermen.
Duidelijk omschrijven voor leerlingen. Gaat het om proces of product. Toets je
individueel of per groep? Inventariseer wat je nodig hebt: vooral tijd en geld.
4. Relatie eindtermen/examenprogramma: doelstelling is examen halen. Stel
specifiek doorstroom eisen vast en ga daar strenger op beoordelen. Meetbaar in
toetsen/inhouden/vaardigheden. Taak van vakgroep. Wees niet te bang daar te veel
tijd aan te besteden.
4.7 Beoordeling proces en uitkomsten Het samenstellen van de workshopgroep had in Drachten veel minder voeten in de
aarde dan op de Magnolia. Het onderwerp was bekender in Drachten, men heeft
zichzelf kunnen aanmelden en de leidinggevende had alle belang bij een goed
onderzoek. De leden van de andere groep zijn gevraagd door hun leidinggevende om
zich beschikbaar te stellen. De leidinggevende had een afgeleid belang en dat zal voor
ieder verschillend in prioriteit zijn geweest. Dat bleek ook uit het feit dat de
aangemelde personen af en toe toch niet meededen toen het er op aankwam. Toen
moesten anderen worden gevraagd en was de verdeling over de verschillende
vakgroepen minder goed verdeeld. Een ander opvallend punt was dat de collega’s in
Drachten elkaar goed kenden en snel tweetallen maakten die aan de slag gingen. Op
de Magnolia was duidelijk dat men elkaar eerst wat beter wilde/moest leren kennen.
In Drachten is de tijd voor het maken van de plannen van aanpak vrijwel volledig en
48
intensief gebruikt, terwijl op de Magnolia een half uur voor de geplande eindtijd het
meeste wel op papier stond. Ook de gedetailleerdheid van de plannen is in Drachten
verder uitgewerkt dan op de Magnolia.
Uitkomsten van mentorssessie
Uitkomsten Drachten
1 Normering van toetsen 14 2 Analyse van eigen toetsen 11 3 Hoe maak ik een goede toets/scholing 11 4 Vervolg na analyse van toetsing (zelf toegevoegd) 10 Uitkomsten Magnolia 1. Analyse van eigen toetsen 17 2 Normering van toetsen 13 3 Het toetsen van vaardigheden 13 4 Relatie eindtermen/examenprogramma’s 13
Opvallend is dat de nummers 1 en 2, hoewel in omgekeerde volgorde bij beide
groepen hetzelfde zijn. Dit ligt ook in lijn met de uitkomsten van het kwantitatieve
onderzoek. Normering en analyse van eigen toetsen zijn de belangrijkste
onderwerpen. Opvallend is ook dat de voorgestelde verbeteringen van beide
workshops veel op elkaar lijken, maar dat die van Drachten wat verder zijn
uitgewerkt. In de plannen van aanpak worden hiervoor bruikbare suggesties gedaan.
Deelvraag 4: hoe moet de toetsing systematisch worden geborgd?
De borging van het systeem kan alleen maar plaatsvinden als er goede afspraken
worden gemaakt wat er wordt getoetst. In de bovenbouw gebeurt dat al grotendeels
door afspraken in een PTA (programma van toetsing en afsluiting). Het zou goed zijn
schoolbreed ook voor de onderbouw te komen tot vergelijkbare afspraken zodat bij
de doorstroming naar de bovenbouw duidelijk is dat leerlingen, van welke locatie
ook, vergelijkbaar zijn getoetst en beoordeeld.
Enkele malen wordt door de tweetallen gewezen naar de eindexamens waardoor een
zekere objectivering van resultaten is te geven. Deze examens vinden echter pas na
49
4, 5 of 6 jaar plaats. Men geeft aan dat het goed zou zijn om ook in de aanloop naar
de examens toe geregeld objectief vast te stellen wat de schoolvorderingen zijn. In
het basisonderwijs wordt al vele jaren gebruik gemaakt van het leerlingvolgsysteem
van het CITO. In het voortgezet onderwijs wordt dat nog niet breed toegepast.
50
4.8 Uitkomsten laaghangend fruit Aan de tweetallen die gewerkt hebben aan plannen van aanpak is gevraagd om op
een apart formulier ideeën aan de hand te doen die naar de mening van dat tweetal
gemakkelijk zijn uit te voeren, weinig kosten met zich meebrengen en wel een
verbetering aanbrengen in het proces van toetsing. Alle ideeën zijn opgenomen in
bijlage XII. Hieronder vermelden we een aantal van de ideeën en suggesties die bij de
doelstelling: het verbeteren van het toetsingsproces, kunnen worden gebruikt.
Het BHV-model is een model waar uitgebreid ervaring mee is opgedaan in het
basisonderwijs. Het zou goed zijn om collega’s van het voortgezet onderwijs daar op
bezoek te laten gaan om hen te inspireren en enthousiasmeren.
De elektronische leeromgeving (ELO) is heel goed bruikbaar om het BHV-model
verder handen en voeten te geven.
Het belang van goed functionerende vakgroepen kan niet voldoende worden
benadrukt. Vanuit het hele management moet hieraan meer aandacht worden
besteed. Ook op de locaties zou het goed zijn de vakgroepen op gezette tijden bij
elkaar te brengen om zich voor te bereiden op verbetering van het toetsproces.
Leg een databank aan met toetsen en correctiemodellen en normering. Bestaat er
een landelijke toetsenbank en kunnen/willen we daar gebruik van maken?
Woordenschatontwikkeling als onderdeel van het (algemeen) taalbeleid.
Taalcoördinator en vakdocent zijn verantwoordelijk om overige collega’s aan te
sturen.
Ga samen met alle collega’s in de vakgroep eindexamens analyseren.
Aansluiting onderbouw/bovenbouw zo spoedig mogelijk oppakken in de vakgroep.
Maak cijfers meer inzichtelijk voor ouders en leerlingen.
51
5 Conclusies, aanbevelingen en discussie
5.1 Conclusies:
In hoeverre de 16 deelnemers aan de workshop onderdeel waren van de steekproef
is niet bekend. Dan is het opvallend dat de items genoemd door de workshopleden
voor het overgrote deel vallen onder de negen items die zijn gedestilleerd uit het
eerder onderzoeksdeel. Er is geen sprake van toevallige fouten. Herhaling van deze
vraagstelling lijkt dus dezelfde resultaten op te leveren (Verhoeven, 2008).
Uit beide delen van het onderzoek zijn de volgende conclusies te trekken:
Op welke wijze vindt toetsing nu plaats? (deelvraag1)
Op het Gomarus College is er een grote mate van vrijheid bij individuele docenten als
het aankomt op toetsing. Er zijn wel verschillen per vakgroep (soms behoorlijk
voorgeschreven hoe te toetsen), maar de individuele vrijheid per docent is groot,
zeker als het aankomt op normering van toetsen.
Wat zijn organisatorische en didactische knelpunten? (deelvraag2)
Het maken van toetsen en normeringen wordt veelal gezien als een tijdrovend werk.
Het gebruik maken van methode gebonden toetsen gebeurt veel, maar wordt
verschillend beoordeeld. Er is betrekkelijk weinig overleg tussen collega’s over
toetsen. Normering van toetsen wordt als lastig ervaren. Nieuwe docenten voelen
zich wat dat betreft vaak in het diepe gegooid. Uitkomsten van toetsen worden wel
geanalyseerd, maar dat gebeurt weinig gestructureerd.
Welke verbeteringen kunnen worden aangebracht om de validiteit van toetsen te
vergroten? (deelvraag3)
Maak gezamenlijk afspraken over de normering van toetsen. Zorg voor een
afvinklijstje waaraan een goede toets moet voldoen. Maak meer gebruik van de ELO
om elkaar op de hoogte te houden/brengen van toetsmateriaal en de normering
hiervan. Zorg voor een goede vaststelling van begin- en eindsituatie.
Welke mogelijkheden zijn er om deze verbeterde toetsing te borgen? (deelvraag4)
Leg een databank aan met toetsen die dor meerdere collega’s zijn getest en
genormeerd. Maak gebruik van geijkte toetsen, bijvoorbeeld van het CITO om eigen
vorderingen mee te vergelijken. Zorg voor een heldere afspraak over gebruik van
kennisvragen, toepassingsvragen en inzichtvragen.
52
5.2 Aanbevelingen 1. Maak gebruik van een meetlat als de methode RTTI. Of een andere lijst waarmee
toetsen kunnen worden beoordeeld.
RTTI is een middel om scherp en transparant de vier te onderscheiden cognitieve
niveaus van leren in kaart te brengen. RTTI maakt de leerprocessen van leerlingen
inzichtelijk en werkt binnen de school als motor voor onderwijsontwikkeling.
Hiervoor is scholing van belang. RTTI werkt via de methode teach the teacher. Op
deze wijze wordt duidelijk of je toetsen passen bij de verschillende niveaus van
onderwijs.
2. Zorg voor analyse van de uitkomsten van toetsen en ga vervolgens werken met het
BHV-model (basisstof, herhalingsstof en verrijkingsstof). Zorg dat verrijkingsstof
uitdagend is maar ook leuk. De stof ervoor zit in bestaande methoden, kan zelf
verder worden ontwikkeld en kan via ICT beschikbaar komen/worden gesteld.
3. Er zullen gezamenlijk afspraken over normen moeten worden gemaakt. Er worden
enkele voorstellen gedaan, maar deze dienen breder besproken te worden. Toch is
het maken van schoolbrede afspraken hierin van belang om de onderlinge
vergelijkbaarheid van resultaten te vergroten. Het is opvallend dat geen van de
groepen aangeeft dat methodeonafhankelijke toetsen die landelijk worden gebruikt,
een goed instrument kunnen zijn om het werk van individuele leerlingen te
waarderen, de resultaten per klas en als school ook af te zetten tegen resultaten bij
anderen, om op deze wijze meer inzicht te krijgen in de opbrengsten van de
inspanningen die docenten en leerlingen zich getroosten om verder te komen. In het
basisonderwijs zijn de Cito-toetsen helemaal ingeburgerd, maar in het voortgezet
onderwijs nog maar mondjesmaat.
4. Zorg ervoor dat docenten in de onderbouw weet hebben van de doelstellingen
voor het eindexamenprogramma, maar ook dat bovenbouwdocenten weten welke
53
kerndoelen in de onderbouw eigen dienen te worden gemaakt. Duidelijke
verwachtingen kunnen helpen onderling onbegrip te verkleinen.
5. Toetsing wordt vaak ervaren als tijdrovend. Dat is het vaak ook, maar de
inspanning ervoor is alleen de moeite waard als er daarna ook een nadere analyse
van resultaten plaatsvindt en vervolgens de toetsing wordt verbeterd.
In de bijlage XII van het laaghangend fruit staan veel suggesties die redelijk
eenvoudig kunnen worden gerealiseerd. Als 16 mensen deze ideeën bij elkaar
kunnen brengen in ruim een uur, hoeveel andere suggesties zijn er dan te halen in
een team van bijna 250 docenten?
Het is duidelijk dat de eindverantwoordelijkheid voor het verbeterproces bij de
schoolleiding hoort te liggen. Zij hoort ook hierin het voortouw te nemen, maar dan
vooral in de voorwaardenscheppende sfeer. Het gaat dan om het organiseren van
scholing, het stimuleren van schoolbrede vakgroepen en het faciliteren van
medewerkers die hierin een belangrijke taak vervullen.
Het Gomarus College zal in het komende jaar dit belang moeten benadrukken door
het instellen van een stuurgroep toetsing die de vakgroepen stimuleert en
enthousiasmeert om het proces van toetsing hoog op de agenda te zetten en te
houden. De leerlingen op het Gomarus College hebben dat nodig en verdienen dat.
Het onderwijs verdient dat.
5.3 Discussie Inhoudelijk (eigen visie)
Vrijwel iedere docent toetst zijn leerlingen regelmatig om te zien wat zijn of haar
vorderingen zijn. In veel gevallen leidt dat tot het geven van een cijfer. Die komen op
een rapportage terecht en daarmee worden weer beslissingen genomen die voor de
leerlingen heel belangrijk zijn: overgaan naar de volgende klas, opstromen naar een
hoger niveau of afstromen naar een lager niveau. Als blijkt dat de cijfers lang niet
altijd een goede voorspeller zijn van het succes van leerlingen dan is het van groot
belang deze toetsing en becijfering nader te analyseren. Dat een nadere analyse tijd
kost is duidelijk, maar dat is wel de moeite waard. Je bent als docent bezig met het
kostbaarste bezit van mensen: hun kinderen.
De normering van toetsen moet door docenten in de richting van
leerlingen/studenten worden verantwoord. Leerlingen kunnen een rol spelen in het
verbeteren van toetsen. Docenten moeten niet te bang zijn om gebruik te maken van
hun kennis.
Om de autonomie van je school verder te vergroten is het van groot belang dat je
toetsing op orde is. Een goede verantwoording naar stakeholders: leerlingen,
54
ouders, inspectie zorgt er voor dat je jezelf serieus neemt, maar dat ook anderen
serieus met je omgaan.
Leerrendement
Voor ik begon met dit onderzoek was ik er van overtuigd dat een kwantitatief
onderzoek de beste informatie zou opleveren. De harde gegevens uit een dergelijk
onderzoek garanderen een duidelijk beeld dat niet voor andere uitleg vatbaar is. In
de loop van dit onderzoek is me gebleken dat uit een kwantitatief onderzoek
weliswaar eenduidige gegevens komen, maar dat vooral bij gesloten onderzoeken
het heel lastig is om de menselijke drijfveren goed helder te krijgen. Dan levert een
open vraag toch wel erg veel informatie op waar je verder mee kunt.
Een tweede punt is dat goed onderzoek iets is dat je niet op een achternamiddag
even uitvoert. Het kost tijd, zowel in de voorbereiding als in de uitvoering. Met name
als het onderzoek en betrouwbaar en valide moet zijn is dit voorwaarde, Aan de
andere kant heeft het me ook geleerd dat soms onderzoek misschien minder
betrouwbaar en valide is, maar dat het desondanks wel (zeer) bruikbaar kan zijn. Het
hoeft dus geen reden te zijn om er maar vanaf te zien.
Ik heb gemerkt en daar ben ik mijn hele studie al mee bezig om me dat meer eigen te
maken, dat mijn collega’s (samen) erg veel weten. Dat ik daar veel meer gebruik van
moet maken. Als 16 collega’s in een workshop van een ruim uur met zoveel ideeën
kunnen komen, wat schuilt er dan voor rijkdom in 250 collega’s op het hele Gomarus
College?
Methodologie
Er is erg veel informatie beschikbaar over toetsing. Een volgende keer zou ik meer in
willen zoomen op de praktijk op andere scholen. Daar is niet zo heel veel informatie
over te vinden, maar wel vrij gemakkelijk zelf bij elkaar te brengen. Je moet daarbij
meer gebruik maken van je netwerk in zowel het gereformeerd als het overige
onderwijs.
In de loop van het onderzoek is de focus verbreed. Was in eerste de focus vooral
gericht op het Gomarus College in Drachten, gedurende het onderzoek werd steeds
duidelijker dat er een stevige relatie ligt met de rest van het Gomarus College. In de
loop van de tijd werd ook door collega directeuren gevraagd om het beeld breder te
maken. Had ik dat van het begin af geweten, dan had ik minder gebruik gemaakt van
de collega’s in Drachten. Toch heeft die focus op Drachten niet een heel ander beeld
opgeleverd. Zowel het kwantitatief onderzoek als de focusgroepen leverden
grotendeels dezelfde beelden op. Ook zou ik waarschijnlijk het surveyonderzoek aan
alle docenten van het Gomarus College hebben voorgelegd, want het uitwerken van
die gegevens is me zeker niet tegengevallen. Gezien het aantal respondenten (40) is
55
het onwaarschijnlijk dat dat een heel ander beeld zou hebben opgeleverd. Ik zou de
open vraag aan het einde van het eerste deel van het onderzoek wat verder hebben
uitgebreid, om de antwoorden iets meer gestructureerd te krijgen.
In de loop van het onderzoek is duidelijk geworden dat aan de kwaliteit van toetsing
steeds meer waarde wordt gehecht. Dat geldt voor het management, maar ook voor
de docenten. Als de omstandigheden worden gecreëerd dat hiermee energiek aan de
slag kan worden gegaan, dan is de bereidheid daarvoor heel duidelijk aanwezig. Dit
wordt nog eens extra gestimuleerd door de aandacht die er vanuit politiek en
inspectie is voor de kwaliteit van het reken- en taalonderwijs. Hiervoor moeten vanaf
2014 examens worden afgelegd en mede daardoor is er veel interesse voor het
gebruik van (diagnostische) toetsen op dit gebied.
Een onderzoek als door mij gedaan kan natuurlijk ook gedaan worden dor een
onafhankelijk onderzoeker. Wat zijn dan de voordelen dat ik het heb gedaan?
In de eerste plaats is dat het feit dat er steeds opnieuw op allerlei plekken aandacht
is gevraagd voor deze zaak. Het Hawthorne-effect heeft zijn werk gedaan. Er is
aandacht voor en dat gaat een eigen leven leiden. In de tweede plaats is er sprake
van een kostenaspect, maar ik heb ook geleerd dat ik gebruik kan maken van
studenten die voor hun bachelor of master een onderzoek moeten doen. Daar maken
we meer gebruik van en daardoor is de interpretatie van onderzoeksgegevens steeds
vaker onderwerp van gesprek.
Tot slot
De verantwoordingsdrang naar binnen en buiten kan door het vervolg op dit
onderzoek een flinke slag maken. Van de positieve resultaten kunnen we als school
ook in de concurrentiepositie de vruchten plukken.
Als de onderzoeksvaardigheden van docenten worden vergroot is de kans reëel dat
deze vaardigheden ook bij leerlingen gaan toenemen. Dat is van groot belang,
immers er is ongelofelijk veel informatie beschikbaar, maar wanneer wordt
informatie kennis. Als we die slag maken wordt ons onderwijs beter.
We weten waar we mee bezig zijn moet het adagium zijn of nog beter worden. Dat
zorgt er voor dat we als school nog sterker staan in onze verantwoording.
Docenten moeten steeds meer zich er van bewust zijn en worden dat zij de dragers
zijn van onderwijskwaliteit. Niet de omstandigheden, maar de kwaliteit van het
personeel zal op de lange termijn ervoor zorgen dat leerlingen tot hun recht komen.
Dat vraagt voor sommige/veel docenten om een mindshift. Zij hebben deze
verandering in handen en kunnen die gebruiken als ze leren niet alleen goed te
onderwijzen, maar ook veel te leren.
56
Als je werkt op een gereformeerde school en je stelt je dienstbaar op in de richting
van de leerlingen, dan kan het niet anders of deze mindshift wordt in de komende
jaren volledig gerealiseerd. Ik hoop daar bij te zijn en er samen met mijn collega’s
leiding aan te geven. Leiding geven betekent dan in mijn optiek ruimte beschikbaar
stellen aan degenen die daar het voortouw in kunnen en willen nemen.
57
Literatuur Adam, S. (2004). Using Learning Outcomes, report for United Kingdom Bologna
Seminar 1-2 July, Edinburgh, Scotland.
Baarda, D.B. & Goede, M.P.M. de (2006). Basisboek Methoden en Technieken.
Groningen/Houten: Noordhoff Uitgevers.
Baarda, D.B., Goede, M.P.M. de & Teunissen, J. (2009). Basisboek Kwalitatief
Onderzoek. Groningen/Houten: Noordhoff Uitgevers.
Baart, A. (2001). Een theorie van presentie. Utrecht: Lemma.
Black, P. & William, D. (1998). Assessment and classroom learning. Assessment in
Education: Principles, Policy & Practice, 5 (1), 7-75.
Blok, H., Otter, M.E. & Roeleveld, J. (2002). Leerlingvolgsystemen: praktische lessen
uit onderzoek. Amsterdam: SCO-Kohnstamm Instituut.
Blok, H., Sleegers, P. & Karsten, S. (2006). Schoolzelfevaluatie in het basisonderwijs;
een samenvatting van het onderzoek rond Ziezo. Amsterdam: SCO-Kohnstamm Instituut.
Earl, L. & Katz, S. (2006). Leading schools in a data-rich world. Harnessing data for
schoolimprovement. Thousand Oaks, California: Corwin Press.
Frye, R. (1999) Assessment, Accountability and Student Learning Outcomes,
In: Dialogue Issue no. 2
Groot, A.D. de (1966). Vijven en zessen: cijfers en beslissingen: het selectieproces in
ons onderwijs. Groningen: Wolters.
Inspectie van het Onderwijs (2010). Onderwijsverslag 2008/2009. De staat van het
onderwijs. Den Haag: OCW.
Inspectie van het Onderwijs (2002). Veranderend toezicht. De Inspectie van het
Onderwijs en de Wet op het onderwijstoezicht. Den Haag: SDU.
Krüger, M. (2010). De schoolleider als leerling. Op weg naar onderzoekende scholen
en onderzoeksmatig leiderschap, lectorale rede, Penta Nova
Ledoux, G., Blok, H. & Boogaard, M. met medewerking van Krüger, M. (2009).
Opbrengstgericht werken; over de waarde van meetgestuurd onderwijs,
Amsterdam: SCO-Kohnstamm Instituut
Miyazaki, I. (1976). China's examination hell. New York: Weatherhill.
58
Moelands, H.A., & Sanders, P.F. (1996). Onderwijskundige meetinstrumenten. In: J.
Scheerens (red). Kwaliteitszorg in het onderwijs. Onderwijskundig
Lexicon. Deel Centrale Onderwijsthema’s. p.51-73. Alphen aan den Rijn:
Samson H.D. Tjeenk Willink.
Muynck, B. de (2002). Een theorie van de presentie / Andries Baart, Wapenveld, 52
(6) 31- 32
OESO-CERI (1993). Educational Research and Development: Trends, Issues and
Development. Paris
Onderwijsraad, (2006) Naar meer evidence based onderwijs, advies uitgebracht aan
de minister van OC&W, Den Haag: Artoos
Pol, van der N. (2011) Een interpretatie van kennis, gehaald van internet op 7 december
2011 http://skim.blogs.dmci.hva.nl/files/2011/04/Essay-Een-interpretatie-van-
de-waarheid-Nadine-van-der-Pol.pdf
Schoengen, M. (1911). Geschiedenis van het onderwijs in Nederland. Amsterdam.
Schoolgids Gomarus College (2010-2011)
Schotel, G. D. J. (1875). De academie te Leiden in de 16e, 17e en 18e eeuw. Haarlem:
Kruseman & Tjeenk Willink.
Swanborn, P.G. (2006) Interactieve Modelbouw, H8 in Basisboek Sociaal Onderzoek,
Boom: Amsterdam (P. 185-203)
Wilbrink, Ben (1995). Leren waarderen, de geschiedenis. Amsterdam: SCO-
Kohnstamm Instituut
Tomlinson, T. M. (1983) A Nation at Risk, towards Excellence for All, Washington DC:
US department of education
University of Warwick (2004). Course Specifications: Glossary of Terms to Course
Specification
http:/www.qualityresearchinternational.com/glossary/learningoutcomes.htm
University of Exeter (2004) TQA Manual, Learning and Teaching Definitions
http://www.ex.ac.uk/admin/academic/tls/tqa/modapp1.htm
Vries, de J., Faalangst bij leerproblemen Seminarium voor Orthopedagogiek,
Hogeschool van Utrecht, http://www.faalangst.nl/artikelen/artikel08.html
Verhoeven, N. (2008), Wat is onderzoek? Praktijkboek methoden en technieken voor
het hoger onderwijs, Middelburg, Boom onderwijs
59
Bijlagen I. Brief en vragenlijst Drachten
II. Brief overige locaties
III. Uitkomsten kwalitatief deel van kwantitatief onderzoek
IV. Brief samenstelling focusgroep Drachten
V. Brief samenstelling focusgroep Magnolia/overige locaties
VI. Planning focusgroep Drachten
VII. Planning focusgroep Magnolia/overige locaties
VIII. Genoemde onderwerpen focusgroep Drachten
IX. Genoemde zaken focusgroep Magnolia/overige locaties
X. Formulier Plan van Aanpak
XI. Formulier Laaghangend fruit
XII. Uitkomsten laaghangend fruit
60
Drachten, juni 2011
Beste collega’s,
Zoals jullie weten zijn Johan Hoekstra en ik bezig met de master
Onderwijskundig Leiderschap. We zitten nu in het derde van vier
semesters en een onderdeel van de studie is het maken van een
onderzoeksplan (3e semester) en het uitvoeren daarvan (4e
semester).
Er is in de studie veel aandacht besteed aan leiderschap en
opbrengstgericht werken. In het kader van opbrengstgericht werken
en het goed plaatsen van leerlingen op het meest bij hen passende
onderwijsniveau wil ik graag een actieonderzoek doen naar toetsing
op onze locatie. Om dat goed te kunnen doen heb ik gegevens nodig
die jullie kunnen leveren. Ik stel het zeer op prijs als jullie de
bijgevoegde vragenlijst over toetsing willen invullen. Het gaat
daarbij om jouw mening over dat onderwerp. Wil je voor de
beantwoording het vak in ogenschouw nemen waar je de meeste
lessen in geeft . Om de resultaten goed te kunnen gebruiken is het
belangrijk eerlijk antwoord op de vragen te geven.
De uitkomsten ga ik gebruiken om een groep samen te stellen die
een start gaat maken met de (verdere) verbetering van toetsing op
onze locatie. Daarvoor zal ik 8 collega’s vragen om hierin een
voortrekkersrol te vervullen. Als je je hierdoor aangesproken voelt,
wees dan vrij om je bij mij te melden. Ik wil graag een groep die uit
de vier verschillende vakgroepen bestaat
(talen/exact/zaakvakken/overige). Ook wil ik graag een mix van
ervaring en geslacht.
Ik hoop dat jullie je hierdoor aangesproken voelen. Graag ontvang
ik de vragenlijsten zo spoedig mogelijk terug, maar uiterlijk op
maandag 11 juli a.s. Het invullen van de vragenlijst kost je
maximaal 15 minuten. Bij een response van minimaal 25 zorg ik
voor gebak op de eerste schooldag van schooljaar 2011-2012.
In het verslag van dit eerste onderzoek zal niet herleidbaar zijn
waar de antwoorden vandaan komen. Je anonimiteit zal
gewaarborgd zijn. Aan het begin van het nieuwe schooljaar zal ik de
uitkomsten met jullie delen.
Vriendelijke groet,
David de Jong
61
VRAGENLIJST TOETSING GOMARUS COLLEGE DRACHTEN
Bij meerkeuze vragen graag het juiste antwoord omcirkelen
1. In welke vakgroep zit je hoofdvak?
a. exacte vakken
b. talen
c. zaakvakken
d. overige (creatieve vakken, gymnastiek, godsdienst e.d.)
2. Hoe ben en blijf je op hoogte van de kerndoelen/eindtermen?
a. door mijn opleiding/studie
b. via de uitgever
c. via internet
d. anders, namelijk
………………………………………………………………………………………………………………
……………………………………………………………………………………………………………..
e. niet van toepassing
3. Maak je voor je hoofdvak gebruik van een onderwijsmethode?
Ja Nee (naar vraag 7)
4. Heeft deze onderwijsmethode ook methodegebonden toetsen?
Ja Nee (naar vraag 7)
5. Maak je gebruik van deze toetsen?
Ja Nee (naar vraag 7) Soms
6. Wat is de reden dat je gebruik maakt van toetsen? Meerdere antwoorden mogelijk
a. om de vorderingen van de leerlingen vast te kunnen stellen
b. om te zien of je onderwijs effectief is geweest
c. om leerlingen te motiveren voor hun werk
d. anders, namelijk
………………………………………………………………………………………………………………
….………………………………………………………………………………………………………….
7. Bij de volgende beweringen graag aankruisen wat het meest van
toepassing is op jou(w toetsen) en je leerlingen
1. helemaal mee eens 2. mee eens 3.een beetje mee eens 4. een
beetje mee oneens 5. mee oneens 6. helemaal mee oneens
62
1 2 3 4 5 6
a. Voordat ik een toets maak heb ik
een duidelijk beeld van de doelstelling van die toets
b. Ik relateer de vragen aan de doelstellingen van het
onderwijsprogramma
c. Ik maak toetsen om de beginsituatie vast te stellen
d. Ik neem diagnostische toetsen af
e. Voor een grote toets neem ik
deeltoetsen af
f. Ik maak regelmatig gebruik van
meerkeuzetoetsen
g. De normering van de toets stel ik van tevoren vast
h. Ik bespreek een nieuwe toets van tevoren met collega’s
i. Ik vraag leerlingen om feedback over
een toets
j. Ik analyseer de uitkomsten van een
toets
k. Ik bespreek de resultaten van een
toets naderhand met de leerlingen
l. Ik stel een toets na afname bij
m. Ik weet bij de vragen van een toets op welke cognitieve niveaus
(reproductie, toepassen, inzicht) ze
liggen
n. Ik relateer toetsen aan het centraal
eindexamen (indien voor jouw vak van toepassing)
o. Ik laat een collega wel eens een
toets opnieuw nakijken
p. Ik heb een vaste normering voor
mijn toetsen
q. Ik hanteer verschillende normen
voor toetsen van VMBO-niveau en HV-
toetsen
r. Ik beoordeel iedere leerling bij een
toets op dezelfde wijze
s. Mijn toetsen zijn op iedere andere
school die dezelfde onderwijsmethode
hanteert te gebruiken
63
t. Ik besteed voldoende aandacht aan het verbeteren van de toetsen
u. Ik heb voldoende kennis om goede toetsen te maken
v. Ik heb voldoende kennis om toetsen
goed van een norm te voorzien
w. Extra scholing voor toetsing vind ik
gewenst
x. Ik heb te weinig tijd om goede toetsen te maken
8. Wil je hieronder aangeven welke knelpunten je bij het (maken
van) toetsen ervaart en ideeën vermelden wordt zeer op prijs
gesteld
………………………………………………………………………………………………………………
………………………………………………………………………………………………………………
………………………………………………………………………………………………………………
………………………………………………………………………………………………………………
………………………………………………………………………………………………………………
Hartelijk dank voor je medewerking
David de Jong
64
Drachten, juni 2011
Beste collega’s,
Sinds februari 2010 ben ik met 7 collega’s bezig met de master
onderwijskundig leiderschap. Als afsluiting van de studie worden we
geacht een masterscriptie te schrijven. Deze wil ik graag praktisch
en bruikbaar houden. Ik heb daarom gekozen voor onderzoek naar
de kwaliteit van toetsing op het Gomarus College in Drachten.
Na het eerste onderzoek zal ik binnen de vestiging Drachten
verdergaan met een kerngroep docenten om de toetsing op
toetsniveau verder te evalueren en verbeteren. Om te zien of de
situatie in Drachten vergelijkbaar is met de andere vestigingen leg
ik mijn vragenlijst ook voor aan een 8-tal docenten op de andere
vestigingen. Deze collega’s, waaronder jij, zijn geselecteerd op basis
van de eerste 8 docenten in alfabetische volgorde van een vestiging.
Mijn vraag: willen jullie deze vragenlijst invullen en of per mail of
per post naar mij terugsturen. In het verslag van dit eerste
onderzoek zal niet herleidbaar zijn waar de antwoorden vandaan
komen. Je anonimiteit zal gewaarborgd zijn.
Bij voorbaat dank.
Vriendelijke groet,
David de Jong
Gomarus College Eikesingel 62
9203 NZ Drachten
65
Uitkomsten kwalitatief deel van kwantitatief onderzoek
Het labellen is als volgt gedaan: ideeën in rood, problemen en knelpunten in paars en
uitgangspunten in het bruin.
1 Eenduidigheid, voor één uitleg vatbaar is een knelpunt 2 Leerlingen zelf meerkeuzevragen laten maken bevordert zeer hun leerprestaties en grip op de leerstof 3 Als leerlingen een toets slecht maken verwachten ze automatisch dat ze de toets over mogen doen. Hoe gaan we daar mee om? Moet 2/3 van een klas een voldoende hebben? Was je toets/onderwijs dan goed? 4 Valkuil is voetstoots uitgaan van kwaliteit methodegebonden toetsen. Een kritische blik blijft noodzakelijk. Meer evenwicht in de verschillende vaardigheden. Bij leesteksten zelf vragen laten bedenken. Maak gebruik van start- en eindtoets. Daardoor ook beter te differentiëren. Het plannen van alle toetsen binnen de school vraagt extra aandacht. Werkdruk bij leerlingen in sommige perioden zeer hoog. Toetsweken invoeren? Meer overleg binnen de talensectie! 5 Mijn uitgangspunt is toch wel, dat ik er vanuit ga dat anno 2011 de methode goed bruikbare toetsen geeft. Tekorten bij mij: eigen inzichtelijke vragen maken bij met name HV. 6 nvt 7 Nieuwe toetsen maken kost veel tijd. Klassikaal bespreken kost veel tijd en niet alle leerlingen zijn daarin geïnteresseerd. Nakijken blijft vervelend werk. Sommige leerlingen vinden een mondelinge toets prettiger en dat is wel eens lastig. 8 Voor mij is het van belang om zo te toetsen dat leerlingen met verschillende leerstijlen (Kolb) ze kunnen maken. Voor sommige onderwerpen is dat erg moeilijk, zodat naast toetsen ook opdrachten moeten worden ingeleverd. 9 Goed lezen is bij leerlingen een moeilijk punt. Zowel technisch als begrijpend lezen is lastig. Is wel een basisvoorwaarde. Beperkte woordenschat bij leerlingen, dus toetsen soms toelichten. 10 Normering van de toetsen. Bespreken van de toetsen met de leerlingen dat ze het nog wel leren. Differentiëren: sommige leerlingen kunnen minder aan, anderen veel meer, maar krijgen dezelfde toets- en lesstof 11 Het maken van een toets waarbij de normering een objectief beeld geeft vd vorderingen. Een toets moet een ontwikkeling ve leerling in beeld brengen. Niet dmv cijfers, maar één die past bij de persoonlijkheid vh kind. Ik denk meer aan ontwikkelingslijnen die passen bij ieder uniek kind. 12 We hebben als vakcollega's afgesproken dat we evenveel nadruk leggen op spreekvaardigheid, schrijfvaardigheid en grammatica. Tot nu toe is het zo dat één veel nadruk legt op het ene en de ander op het andere. We willen meer gelijkheid. Het lijkt me tijd om een toetsenweek aan het einde van het jaar te herintroduceren. Ik vind best moeilijk om aan het eind leerlingen te blijven motiveren. Sportdag kan wel 1 of 2 weken voor de laatste schooldag plaatsvinden. 13 Ik toets heel weinig, hooguit 2 (á3) keer per jaar in een klas. Hangt van de werkhouding van de klas af.
66
14 Een goede toets maken kost veel tijd. Ik heb meer beoordelingsmomenten met ander vaardigheden dan toetsen 15 Er gaat erg veel tijd zitten in het maken van goede toetsen. Daarom (vanwege tijd) zijn methodetoetsen een uitkomst. Het nadeel is alleen dat sommige methodetoetsen niet aansluiten bij de manier waarop je de leerstof hebt behandeld. Je wilt bijvoorbeeld de actualiteit in je lessen/toetsen betrekken. Ook zijn veel methodetoetsen (Pincode/Nieuw Nederlands) erg gericht op de reproductie van kennis en wil je ook wel wat meer inzicht en vaardigheden toetsen. Dan moet je al snel op zoek naar extra/alternatieve toetsen of zelf aan de slag om een toets te maken. 16 Samenwerking met collega's via Fronter spaart tijd en levert betere toetsen op 17 Binnen vakgroepen gemaakte toetsen uitwisselen om van elkaar te leren; elkaars toetsen maken binnen bijv. zaakvakken en er commentaar op leveren
1. Geeft vrijwel nooit problemen. De methode toetsen zijn tegenwoordig van prima niveau, toetsen alle leerstof en zijn goed na te kijken zonder dat het tijdrovend wordt. 2. Ik geloof niet dat ik knelpunten ervaar. Mijn toetsen zijn "eenvoudig" en eenduidig qua opzet. De ll weten wat ze kunnen verwachten aan vragen. Normering vertel ik niet altijd van tevoren, eigenlijk nooit zelfs. De methodegebonden toetsen zijn verschrikkelijk groot, niet leuk meer voor de ll om te maken en afschuwelijk voor mij om na te kijken. Ook moeilijk te normeren. Daarom werk ik meestal met deeltoetsen die ik zelf samenstel. 3. Vooral bij MC kun je vragen hebben of antwoorden die voor meerdere uitleg vatbaar zijn. Met name een B-toets met veranderde vragen en antwoorden op andere plekken heeft wel eens zulke vragen. Ik pas dat dan wel direct aan. Maar nieuwe toetsen blijven onverwachte dingen met zich meebrengen. ja/nee vragen hebben daar het meeste last van/ 5. Respondent verwijst naar bijlage, maar heb deze niet aangetroffen 6. Ik zou meer met de vakgroep willen ten aanzien van toetsen. De hoeveelheid tijd die je zou moeten nemen voor het vervaardigen van een correcte toets is bijna niet reëel en krijg je er dus niet voldoende tijd voor. Je zou voor het maken/evalueren meer met collega's moeten samenwerken. En trouwens, David. ik was degene die die RTTI met Adriaan heeft gedaan, vandaar wat merkwaardige kruisjes in bovenstaande tabel. Je ziet hier ook aan dat we nog niet zijn gestart, maar dat zal komend cursusjaar gebeuren. Ik heb hem daarom zo ingevuld als ik hem nu ervaar. Succes ermee! 7. De normering van tevoren maken. Ik kan het niveau van de leerlingen nog moeilijk bepalen en dat maakt het normeren van een toets heel lastig. Ik heb nog te weinig ervaring hiervoor. Ik geef nog maar één jaar les in het voortgezet. Dus ik hoop in mijn studie volgend jaar hier meer over te leren. 8. Als meerdere groepen eenzelfde toets moeten maken op verschillende tijdstippen kun je de normering pas na afloop (schooljaar) bijstellen, anders ongelijke behandeling. Cijfers moeten namelijk wel per keer ingevoerd worden 9. Ik gebruik overwegend toetsen van de methode. Af en toe kom je daarbij foutjes tegen. Die fouten herstel je voor een volgende toets. 11. Ik ben heel benieuwd of er een vervolg komt naar aanleiding van de uitkomsten van dit onderzoek. Ik vind toetsen maken best lastig en voel me soms wat zwemmen. Ik ervaar het als lastig dat de toetsen die de methode levert erg op het "te leren" gedeelte van de stof ingaan. Ik mis het toepassingsdeel. Ook geeft de methode geen normering. Die maak ik zelf, maar ik twijfel dan wel of ik goed “op niveau"zit. Als een toets erg goed gemaakt is pas
67
ik de normering aan. Ik reageer dan achteraf in plaats van me aan de voorgenomen normering te houden. Dit voelt niet altijd goed. De luister- en leestoetsen van de methode zijn erg gemakkelijk. Ik wijk daarom voor leestoetsen al vanaf klas2 uit naar oude examens (van een lager niveau) maar dat is bij luisteren heel lastig, omdat die niet op het internet staan. Aangezien we een nieuwe methode hebben moeten alle toetsen opnieuw gemaakt worden. Dit is best veel werk. Zelf opdrachten maken is ook erg intensief en bovendien weet ik niet of ze op niveau zijn, dus laat ik het er vaak bij zitten. Ook blijf ik het voor mijn vak Engels lastig vinden dat het examen bestaat uit het schrijven van een brief en een leestoets. De toetsen (vooral in klas 1 en 2) zijn vooral gericht op de behandelde stof en die is vaak wel te leren. Dit geeft wel eens een verkeerd beeld van wat de leerlingen nou echt van het Engels kunnen. Tot slot vind ik de nakijkbelasting van toetsen erg zwaar. Ik weet niet goed hoe ik met meerkeuze moet gaan werken bij mijn vak. Het blijft veel nakijken. Toetsen geven is vaak een heerlijk rustig uur, maar ze maken en nakijken is een verschrikking. 12. Zoals net al gezegd: ik heb de neiging toetsen te moeilijk te maken. Verder is er gewoon te weinig tijd om elke nieuwe toetsen + antwoorden te maken. Ik vind het dus lastig me te verplaatsen in het niveau van de leerlingen. Ik vraag van mezelf veel en doe dat dus ook een beetje van de leerlingen 14. De toetsen die de methode van 3GTL en 4GTL erbij levert zijn niet op niveau. Deze pas ik aan maar het kost ongelofelijk veel tijd 15. De methodegebonden toetsen zijn vaak niet RTTI-waardig. Om die reden maak ik regelmatig zelf toetsen. Tip voor de uitgever zeg maar:) 16. Waar mogelijk behandel ik leerlingen naar hun mogelijkheden en onmogelijkheden. Ik heb er dan ook totaal geen moeite mee om verschillende leerlingen met dezelfde scores verschillende te beoordelen. 18. Tijdsgebrek is het grootste struikelblok. Ik analyseer resultaten van verschillende cohorten om to verfijning van toets en normering te komen. Ik probeer steeds meer aan te sluiten bij het ERK 21. Bij het maken van toetsen ervaar ik weinig tot geen problemen tot nu toe. Bij de komende methode heb ik al gezien dat de toetskwaliteit erg laag is. Daar baal ik van. Ik wil dat een methode op een goed (examen) niveau kan en wil toetsen. Wel ervaar ik bij toetsen dat het bespreken ervan bij talen erg lastig is. Dat verloopt niet prettig en duurt lang. Juist omdat het minder prettig verloopt doe ik het ook minder, terwijl ik het wel een goed iets vind. Qua ideeën heb ik een tip voor Engels. In de kaderklassen (en dat kan ook in andere, maar dat heb ik tot nu toe nog niet gedaan) kijk ik een SO klassikaal na. De leerlingen kijken elkaars SO na. Dat scheelt mij werk(druk) en de leerlingen weten meteen hun cijfer, wat ze erg graag willen. Maar wat ik het belangrijkste vind is dat ik zie dat ze leren van hun gemaakte fouten en mijn manier van nakijken. Ik merk dat ze het prettig vinden om dit te weten en te zien. Ook merk ik dat het als een motivatie werkt voor de volgende keer om wel te leren. Ze vinden het namelijk niet leuk als een medeleerling ziet hoe slecht ze hebben geleerd.Of ze spreken af om met zijn allen een 10 te halen, want dat is voor hun ook gemakkelijker nakijken. Misschien een leuk idee voor wanneer je tijd over hebt. 22. Ik werk nu drie jaar in het onderwijs, het maken van een goede toets is moeilijk. Wat voor mij een duidelijke vraag is, kan voor een leerling helemaal niet duidelijk zijn. Elke vraag kan na afname aangepast worden, soms laat ik een vraag niet meetellen als de vraag niet eenduidig blijkt te zijn. Er is wel een groot verschil tussen Hv of kader en TL klassen.
68
Rubricering van de kwalitatieve opmerkingen
Proberen we om deze zaken onder de drie rubrieken onder te brengen, dan komen
we tot deze opsomming:
Ideeën:
- Laat leerlingen zelf hun meerkeuzevragen maken (2).
- Is een toets goed als 2/3e van de kinderen een voldoende heeft?
- Maak meer evenwicht voor verschillende vaardigheden.
- Maak gebruik van begin- en eindtoets. Daardoor ook beter te differentiëren.
-Toetsweken invoeren om werkdruk voor leerlingen te reguleren.
-Er moet meer overleg komen in de talensectie.
-Nabespreken van toetsen is van belang om het nog niet geleerde alsnog onder de knie te
krijgen.
-We hebben als vakcollega's afgesproken dat we evenveel nadruk leggen op
spreekvaardigheid, schrijfvaardigheid en grammatica. Tot nu toe is het zo dat één veel
nadruk legt op het ene en de ander op het andere. We willen meer gelijkheid.
-Het lijkt me tijd om een toetsenweek aan het einde van het jaar te herintroduceren.
Sportdag kan wel 1 of 2 weken voor de laatste schooldag plaatsvinden.
-Ik heb meer beoordelingsmomenten met ander vaardigheden dan toetsen .
-Je wilt bijvoorbeeld de actualiteit in je lessen/toetsen betrekken.
-Meer inzicht en vaardigheden toetsen. Dan moet je al snel op zoek naar extra/alternatieve
toetsen of zelf aan de slag om een toets te maken.
-Samenwerking met collega's via Fronter (elektronische leeromgeving – DdJ) spaart tijd en
levert betere toetsen op.
-Binnen vakgroepen gemaakte toetsen uitwisselen om van elkaar te leren
-Elkaars toetsen maken binnen bijv. zaakvakken en er commentaar op leveren.
-Mijn toetsen zijn "eenvoudig" en eenduidig qua opzet. De ll weten wat ze kunnen
verwachten aan vragen. Normering vertel ik niet altijd van tevoren, eigenlijk nooit zelfs.
-Daarom (omdat ik toetsen te eenzijdig vindt) werk ik meestal met deeltoetsen die ik zelf
samenstel .
- Ik zou meer met de vakgroep willen ten aanzien van toetsen.
69
-Ik wijk daarom (methodetoetsen te eenvoudig) voor leestoetsen al vanaf klas 2 uit naar
oude examens (van een lager niveau) maar dat is bij luisteren heel lastig, omdat die niet op
het internet staan.
-Ik analyseer resultaten van verschillende cohorten om tot verfijning van toets en normering
te komen.
-Ik probeer steeds meer aan te sluiten bij het ERK (Europees Referentiekader).
-Qua ideeën heb ik een tip voor Engels. In de kaderklassen (en dat kan ook in andere, maar
dat heb ik tot nu toe nog niet gedaan) kijk ik een SO klassikaal na. De leerlingen kijken elkaars
SO na. Dat scheelt mij werk(druk) en de leerlingen weten meteen hun cijfer, wat ze erg graag
willen. Maar wat ik het belangrijkste vind is dat ik zie dat ze leren van hun gemaakte fouten
en mijn manier van nakijken. Ik merk dat ze het prettig vinden om dit te weten en te zien.
Ook merk ik dat het als een motivatie werkt voor de volgende keer om wel te leren. Ze
vinden het namelijk niet leuk als een medeleerling ziet hoe slecht ze hebben geleerd. Of ze
spreken af om met zijn allen een 10 te halen, want dat is voor hun ook gemakkelijker
nakijken. Misschien een leuk idee voor wanneer je tijd over hebt.
Problemen en knelpunten:
-Eenduidigheid, voor één uitleg vatbaar is een knelpunt.
-Als leerlingen een toets slecht maken verwachten ze automatisch dat ze de toets
over mogen doen. Hoe gaan we daar mee om?
-Valkuil is voetstoots uitgaan van kwaliteit methodegebonden toetsen?
-Het plannen van alle toetsen binnen de school vraagt extra aandacht. Werkdruk bij
leerlingen in sommige perioden zeer hoog.
-Tekorten bij mij: eigen inzichtelijke vragen maken bij met name HV.
-Nieuwe toetsen maken kost veel tijd.
- Klassikaal bespreken kost veel tijd en niet alle leerlingen zijn daarin geïnteresseerd.
-Nakijken blijft vervelend werk.
-Sommige leerlingen vinden een mondelinge toets prettiger en dat is wel eens lastig.
-Voor sommige onderwerpen is dat (leerstijlen Kolb) erg moeilijk, zodat naast
toetsen ook opdrachten moeten worden ingeleverd.
-Goed lezen is bij leerlingen een moeilijk punt. Zowel technisch als begrijpend lezen is
lastig. -Beperkte woordenschat bij leerlingen, dus toetsen soms toelichten.
-Normering van de toetsen.
70
-Differentiëren: sommige leerlingen kunnen minder aan, anderen veel meer, maar
krijgen dezelfde toets- en lesstof.
-Het maken van een toets waarbij de normering een objectief beeld geeft van de
vorderingen.
- Ik vind best moeilijk om aan het eind leerlingen te blijven motiveren.
-Een goede toets maken kost veel tijd.
-Er gaat erg veel tijd zitten in het maken van goede toetsen.
-Het nadeel is alleen dat sommige methodetoetsen niet aansluiten bij de manier
waarop je de leerstof hebt behandeld.
-Ook zijn veel methodetoetsen (Pincode/Nieuw Nederlands) erg gericht op de
reproductie van kennis.
-Vooral bij MC kun je vragen hebben of antwoorden die voor meerdere uitleg vatbaar
zijn. Met name een B-toets met veranderde vragen en antwoorden op andere
plekken heeft wel eens zulke vragen. Ik pas dat dan wel direct aan.
-De normering van tevoren maken. Ik kan het niveau van de leerlingen nog moeilijk
bepalen en dat maakt het normeren van een toets heel lastig. Ik heb nog te weinig
ervaring hiervoor. Ik geef nog maar één jaar les in het voortgezet. Dus ik hoop in mijn
studie volgend jaar hier meer over te leren.
-Ik gebruik overwegend toetsen van de methode. Af en toe kom je daarbij foutjes
tegen. Die fouten herstel je voor een volgende toets.
-Aangezien we een nieuwe methode hebben moeten alle toetsen opnieuw gemaakt
worden. Dit is best veel werk. Zelf opdrachten maken is ook erg intensief en
bovendien weet ik niet of ze op niveau zijn, dus laat ik het er vaak bij zitten.
- Ook blijf ik het voor mijn vak Engels lastig vinden dat het examen bestaat uit het
schrijven van een brief en een leestoets. De toetsen (vooral in klas 1 en 2) zijn vooral
gericht op de behandelde stof en die is vaak wel te leren. Dit geeft wel eens een
verkeerd beeld van wat de leerlingen nou echt van het Engels kunnen.
-Tot slot vind ik de nakijkbelasting van toetsen erg zwaar.
- Ik weet niet goed hoe ik met meerkeuze moet gaan werken bij mijn vak. Het blijft
veel nakijken.
-Toetsen geven is vaak een heerlijk rustig uur, maar ze maken en nakijken is een
verschrikking.
71
-Verder is er gewoon te weinig tijd om elke nieuwe toetsen + antwoorden te maken.
-Ik vind het dus lastig me te verplaatsen in het niveau van de leerlingen.
-Deze(methodegebonden toets) pas ik aan maar het kost ongelofelijk veel tijd.
-Tijdsgebrek is het grootste struikelblok.
-Wel ervaar ik bij toetsen dat het bespreken ervan bij talen erg lastig is. Dat verloopt
niet prettig en duurt lang. Juist omdat het minder prettig verloopt doe ik het ook
minder, terwijl ik het wel een goed iets vind.
Uitgangspunten:
-Mijn uitgangspunt is toch wel, dat ik er vanuit ga dat anno 2011 de methode goed
bruikbare toetsen geeft.
-Voor mij is het van belang om zo te toetsen dat leerlingen met verschillende
leerstijlen (Kolb) ze kunnen maken.
- Zowel technisch als begrijpend lezen is lastig. Is wel een basisvoorwaarde.
-Een toets moet een ontwikkeling van een leerling in beeld brengen. Niet d.m.v.
cijfers, maar één die past bij de persoonlijkheid van het kind. Ik denk meer aan
ontwikkelingslijnen die passen bij ieder uniek kind.
-Ik toets heel weinig, hooguit 2 (á3) keer per jaar in een klas. Hangt van de
werkhouding van de klas af.
-Daarom (vanwege tijd) zijn methodetoetsen een uitkomst. Geeft vrijwel nooit
problemen.
-De methode toetsen zijn tegenwoordig van prima niveau, toetsen alle leerstof en
zijn goed na te kijken zonder dat het tijdrovend wordt.
-De methodegebonden toetsen zijn verschrikkelijk groot, niet leuk meer voor de
leerling om te maken en afschuwelijk voor mij om na te kijken.
-Ook moeilijk te normeren.
-Maar nieuwe toetsen blijven onverwachte dingen met zich meebrengen. ja/nee
vragen hebben daar het meeste last van.
-De hoeveelheid tijd die je zou moeten nemen voor het vervaardigen van een
correcte toets is bijna niet reëel en krijg je er dus niet voldoende tijd voor.
-Je zou voor het maken/evalueren meer met collega's moeten samenwerken.
72
-Als meerdere groepen eenzelfde toets moeten maken op verschillende tijdstippen
kun je de normering pas na afloop (schooljaar) bijstellen, anders ongelijke
behandeling. Cijfers moeten namelijk wel per keer ingevoerd worden.
-Benieuwd of er een vervolg komt?
-Zoals net al gezegd: ik heb de neiging toetsen te moeilijk te maken. Ik vraag van
mezelf veel en doe dat dus ook een beetje van de leerlingen.
-De toetsen die de methode van 3GTL en 4GTL erbij levert zijn niet op niveau.
-De methodegebonden toetsen zijn vaak niet RTTI-waardig (reproductie, toepassen 1
en 2, inzicht - DdJ) . Om die reden maak ik regelmatig zelf toetsen. Tip voor de
uitgever zeg maar:)
-Totaal geen moeite mee om verschillende leerlingen met dezelfde scores
verschillende te beoordelen.
-Bij de komende methode heb ik al gezien dat de toetskwaliteit erg laag is. Daar baal
ik van.
-Ik wil dat een methode op een goed (examen) niveau kan en wil toetsen.
-Elke vraag kan na afname aangepast worden, soms laat ik een vraag niet meetellen
als de vraag niet eenduidig blijkt te zijn. Er is wel een groot verschil tussen HV of
kader en TL klassen.
73
Uitkomsten plannen van aanpak
Hieronder een letterlijke weergave van de uitkomsten plannen van aanpak van de
beide locaties
Plannen van Aanpak Drachten
Hoe maak ik een goede toets/scholing. Doelstelling is het maken van een checklist
op grond waarvan je elke toets objectief kunt beoordelen. Hierbij externe
deskundigheid benutten (presentatie gehad in Assen over toetsen volgens RTTI-
systeem. Dat vraagt om scholing. Kennis in werkgroepjes van diverse samenstelling
uitwerken tot werkbare checklistjes. Vervolgens resultaten bij elkaar brengen en de
GGD eruit halen. Rol van de vakgroep is duidelijk: je kunt het niet alleen. De toetsen
die we gebruiken naast de checklist leggen en eventueel aanpassen. Het moet geen
keurslijf worden, maar een hulpmiddel. Het hoeft geen lang traject te zijn. Kan op
één studie(mid)dag. Evaluatie van de plannen houden op locatie en vakgroep niveau.
Vervolgens automatiseren. In beginsel blijven docenten verantwoordelijk. Zij leggen
verantwoording af aan directie en het wordt onderdeel van de beoordeling.
Vervolg na analyse toetsing. Nu worden cijfers vaak voor kennisgeving aangenomen.
Het zou beter zijn als je na een toets differentieert. Wie te laag heeft krijgt herhaling,
wie hoog heeft extra stof. Laag: op SO niveau hertoetsing. Hoog: uitdagende
opdracht, al of niet voor een cijfer. Als de methode er niet in voorziet, zelf maken.
Signaal naar de uitgever. Werk het vooral uit voor die vakken waar kennis gestapeld
wordt (taal, exact) Niet alles in één keer willen doen, maar verdelen (ook
bijvoorbeeld binnen de vakgroep) In de tijd zou het zo kunnen:
Jaar 1 in klas 1 H1 - 3 klaar maken In klas 2 H4 - 6
Jaar 2 in klas 1 H4 - 6 klaar maken In klas 2 H1 – 3
Jaar 3 en 4: idem voor klas 3 en 4
Eindverantwoordelijk eigenaar: de vakdocent, waarbij leidinggevende checkt of hij op
schema ligt. Opstarten in de vakgroep.
Mogelijke problemen: is er voldoende ruimte in je jaarleerstof om dit extra model
ruimte te geven? Kans: gooi het in de vakgroep en ontwikkel het samen. Signaal
geven naar de uitgever deze leerstof op te nemen in de werkboeken van de
methode. Misschien is er extra scholing nodig om goede herhaalstof voor de zwakke
leerling, maar vooral uitdagende leerstof voor de betere leerling te maken. Wat doet
de middenmoot, die de herhaling niet nodig heeft en voor wie de extra stof te
moeilijk is? Kans: maak de extra stof niet te moeilijk maar vooral leuk. Je kunt de
74
goede leerlingen inzetten om de zwakken te instrueren. Wel is het zaak om te
analyseren hoe het komt dat iemand extra laag of hoog scoort (goed leren of goed
spieken)
Analyse van eigen toetsen. We ontwikkelen een stappenplan aan de hand waarvan
de docent een toets checken kan of er genoeg kennis en inzicht aanwezig is. We
beoordelen of toetsen genoeg kennis en inzicht bevatten aan de hand waarvan
leerlingen adequaat naar niveau kunnen worden beoordeeld. In Talen, Science,
Zaakvakken en Creatieve vakken wordt het nieuwe plan besproken en vergeleken
met (bestaande) toetsen (eind februari). Dit mag van de collega’s worden gevraagd.
Omdat er kritischer gekeken wordt geeft de uitkomst een reëler beeld. In eerste
instantie kost het aardig wat tijd, later wat minder. Eindverantwoordelijk zijn de
voorzitters van de 4 vakgroepen.
Wat wil je testen?
Kennis: afhankelijk van vak en onderwerp tussen 40 en 60%
Inzicht: tussen 40 en 60 %
Vaardigheden: ongeveer 20% en een oordeel over de netheid van het werk
Welke stappen zijn er dan te maken?
a. kijk hoeveel kennis, inzicht en vaardigheden er in de toets zitten en vergelijk dit
met de richtlijnen
b. afwijken van de afspraak moet worden beargumenteerd
c. pas waar nodig de toets aan volgens de richtlijnen
d. Kennis T 60% moet voldoende zijn, H 70% moet voldoende zijn. V 80% moet
voldoende zijn Inzicht: T 65% moet voldoende zijn, H 75% moet voldoende zijn, V
75% moet voldoende zijn
Toetscijfer: (% kennis x cijfer kennis) + (% inzicht x cijfer inzicht)
100
Normering en toetsing. Hoe geef je een toets de juiste normering?
a. Wat is de grens voldoende/onvoldoende gekoppeld aan het niveau?
b. Hoe is de puntenverdeling binnen de toets?
75
c. Op basis waarvan is die puntenverdeling?
Het ijkpunt vastleggen, in overleg met meerder collega’s o.a. score →cijfer voor een
bepaald niveau
Overleg met collega’s uit hetzelfde vakgebied en niveau
1. 5 docenten vormen 1 overleg uit meerdere locaties
2. 1 docent levert *toets en antwoorden (*kan een methodetoets zijn)
3. alle 5 docenten maken bij deze toets een scoreblad en normering
4. deze bespreken in het overleg met als doel: te komen tot 1 correctiemodel, scores
en normering
5. Deze toets is dan het werkmodel/ijkpunt voor dat vak en dat niveau
Voorbereiding individueel kost ongeveer 1 uur. Het overlegmoment ongeveer 1,5
uur. Voor 1 persoon volgt dan nog een uur voor een eindverslag. Indien gewenst kan
dat voor andere toetsen worden herhaald. Eindverantwoordelijk schoolbreed is de
vakgroep die daarvoor 1 docent aanwijst, bijvoorbeeld de verslaggever. Op locatie is
het de hoofddocent van een vak
Plannen van Aanpak Magnolia
Normering van toetsen. Doel: verantwoorden normering toetsen. Wanneer normeer
je? (van tevoren, achteraf, flexibel, statisch, normering per docent, opwaardering)
Meetbaar bij eindexamen. Sectie- en vakgroepoverleg heeft kennis nodig van het
eindexamen. Wat is van belang (qua toetsing) voor het examen? Moet je alles
toetsen wat je doet? Toetsen moeten goed uitgewerkt zijn en tijdloos.
Verantwoordelijkheid bij vakdocent, locatiedirecteur, sectie, vakgroep.
Analyse van eigen toetsen. Doel: meer inzicht krijgen in eigen toetsen. Als je
achteraf je toets wilt analyseren (als de leerlingen de toets hebben gemaakt) kom je
het probleem tegen dat veel factoren van invloed zijn op het werk (motivatie,
tijdsdruk, het is een momentopname. Toetsen laten beoordelen door
collega’s/vakgroep. Daardoor meer inzicht in de vorm van de toets. Maak bij het
bekijken van een toets gebruik van een afvinklijstje (RTTI, zit alles erin?) Wat zegt een
cijfer. Verantwoordelijkheid ligt bij individuele docent/vakgroep
76
Relatie eindtermen en examenprogramma’s. Doelstelling is examen halen. Specifiek:
vaststellen van doorstroom eisen naar de bovenbouw en daar op toetsen. Zwaarder
beoordelen. Nadruk op leggen in de les. Per leerjaar-leerstroom- Gomarusbreed.
Meetbaar in toetsen/inhoud/vaardigheden. Het moet gebeuren in de vakgroep. Daar
moet meer tijd voor worden ingeruimd. Wees dan niet al te bang voor lesuitval. Denk
om bezoldiging vakgroepvoorzitter. Eigenaar is directie die er ook interesse voor
moet hebben.
Toetsen van vaardigheden. Specifiek het toetsen van vaardigheden muziek en
Nederlands (zingen, spelen, ontwerpen, luisteren, lezen, schrijven, spreken)
Omschrijf de vaardigheden per niveau, per leerjaar. Kijk naar de eindtermen. Maak
duidelijke omschrijving voor leerlingen. Hoe toets je vaardigheden? Proces en/of
product (toets, werkstuk, presentatie)? Per groep of individueel? Wat is er nodig?
Muziekinstrumenten, goede ruimte, afgezonderde ruimte, geld. Nederlands: tijd
77
Samenstellen focusgroep Toetsing op Gomarus College Drachten
Geachte collega’s,
In het kader van mijn onderzoek naar de kwaliteit van toetsing op het Gomarus College heb
ik kort voor de zomervakantie een vragenlijst aan alle collega’s voorgelegd. Ook heb ik
dezelfde vragenlijst voorgelegd aan een aselecte steekproef van de overige vestigingen. Ik
heb de gegevens verwerkt en ik wil nu graag met twee focusgroepen nader spreken over de
kwaliteit van toetsing. Met een groep uit Drachten en één van de overige vestigingen wil ik in
eerste instantie in een bijeenkomst van 1,5 tot 2 uur spreken over hoe de kwaliteit van
toetsing op het Gomarus College (verder) kan worden verbeterd en hoe die verbetering kan
worden geborgd. Ik nodig jou hier graag voor uit. Er worden 8 collega’s vanuit Drachten
uitgenodigd. Dat gebeurt op basis van aanmelding op eerder vragen van mij, maar ook
kijkend naar verschillende vakgroepen, ervaring, verdeling man/vrouw. Aan het begin van de
bijeenkomst zal ik kort de uitkomsten van het onderzoek voorleggen. Nadere voorbereiding
voor het gesprek is niet nodig. Tijdens het gesprek zullen we inzoomen op mogelijke
verbeteringen in het toetsproces en de borging van het toetsproces.
Deze bijeenkomst wordt gehouden op donderdagmiddag 24 november a.s van 15.00 tot
maximaal 17.00. Het gesprek zal worden opgenomen en naderhand worden uitgewerkt.
Jullie ontvangen een exemplaar van deze uitwerking waar je eventuele onjuistheden in aan
kunt geven. De gegevens worden vervolgens door mij uitgewerkt door middel van het
labellen van ideeën en zullen worden verwerkt tot een advies aan het directieoverleg van het
Gomarus College om schoolbreed tot een verbetering te komen.
Graag hoor ik van je of je deze datum beschikbaar bent en mee wilt werken. Het is mogelijk
dat er nog een tweede bijeenkomst moet worden belegd wanneer de bijeenkomst daar
aanleiding toe geeft. Deze vraag zal jullie dan worden voorgelegd.
Graag ontvang ik (liefst per mail) een bevestiging van je medewerking. Ik weet dat enkelen
ook al door Johan zijn gevraagd voor een week eerder, maar we willen beiden graag optimale
uitkomsten. Vandaar!
Bij voorbaat dank voor je medewerking en in afwachting van je reactie,
Hartelijke groet,
David de Jong
78
Samenstellen focusgroep Toetsing op Gomarus College overige vestigingen
Geachte collega’s,
In het kader van mijn onderzoek naar de kwaliteit van toetsing op het Gomarus College heb
ik kort voor de zomervakantie een vragenlijst aan alle collega’s van het Gomarus College in
Drachten voorgelegd. Ook heb ik dezelfde vragenlijst voorgelegd aan een aselecte steekproef
op de overige vestigingen. Ik heb de gegevens verwerkt en ik wil nu graag met twee
focusgroepen nader spreken over de kwaliteit van toetsing. Met een groep uit Drachten en
één van de overige vestigingen wil ik in eerste instantie in een bijeenkomst van 1,5 tot 2 uur
spreken over hoe de kwaliteit van toetsing op het Gomarus College (verder) kan worden
verbeterd en hoe die verbetering kan worden geborgd. Ik nodig jou hier graag voor uit. De
focusgroep van de overige vestigingen zal bestaan uit ongeveer 7 personen. Indien mogelijk
van iedere vestiging één docent. Ik heb aan de directies gevraagd om een aantal namen dor
te geven die men geschikt acht om over dit onderwerp door te spreken. Liefst drie namen
per locatie zodat ik een evenwichtige groep kan samenstellen op basis van vakgroepen,
ervaring en man/vrouw verdeling. De collega’s zullen aan het begin van de bijeenkomst
worden geïnformeerd over de resultaten van het onderzoek. Verdere voorbereiding is niet
noodzakelijk. Tijdens het gesprek zullen we inzoomen op mogelijke verbeteringen in het
toetsproces en de borging van het toetsproces.
Deze bijeenkomst wordt gehouden op maandagavond 28 november van 20.00 uur tot
maximaal 22.00 uur op het Gomarus College locatie Magnolia in Groningen. Het gesprek zal
worden opgenomen en naderhand worden uitgewerkt. Jullie ontvangen een exemplaar van
deze uitwerking waar je eventuele onjuistheden in aan kunt geven. In het uiteindelijke
verslag zal de informatie niet op personen te herleiden zijn. De gegevens worden vervolgens
uitgewerkt door middel van het labelen van ideeën en zullen worden verwerkt tot een
advies aan het directieoverleg van het Gomarus College om schoolbreed tot een verbetering
te komen.
Graag hoor ik van je of je deze datum beschikbaar bent en mee wilt werken. Het is mogelijk
dat er nog een tweede bijeenkomst moet worden belegd wanneer de eerste bijeenkomst
daar aanleiding toe geeft. Deze vraag zal jullie dan worden voorgelegd. Het kan zijn dat niet
iedereen die zich beschikbaar stelt ook wordt uitgenodigd vanwege de gemengde
samenstelling van de groep (verschillende vakgroepen, ervaring en man/vrouw verdeling)
Bij voorbaat dank voor je medewerking en in afwachting van je reactie,
Hartelijke groet,
David de Jong
79
Planning focusgroepen
Donderdag 24 november in Drachten
Deelnemers: V wiskunde V economie V Frans M studio A M aardrijkskunde/Fries M Duits M biologie/scheikunde M Nederlands Tijdstip: 16.45 – 18.45 Klaarzetten: Computer (presentatie Kwaliteit van Toetsing 24/11 op stick) IPad met opname apparatuur Flap-over met stiften Groepszetting van 8 personen 4 groepen van 2 personen Formulieren voor plan van aanpak (5) Formulieren laaghangend fruit Cadeau voor medewerking
80
Planning focusgroepen
Maandag 28 november in Groningen (Magnolia)
Deelnemers: M Assen natuurkunde/scheikunde V Leeuwarden Nederlands V Vondelpad 2 Nederlands M Magnolia wiskunde/rekenen V Vondelpad 3 Duits M Vondelpad 1 Nederlands M Zh/Mag muziek V Vondelpad 1 wiskunde Tijdstip: 20.00 – 22.00 Klaarzetten: Computer (presentatie Kwaliteit van Toetsing 24/11 op stick) IPad met opname apparatuur Flap-over met stiften Groepszetting van 8 personen 4 groepen van 2 personen Formulieren voor plan van aanpak (5) Formulieren laaghangend fruit Cadeau voor medewerking
81
Genoemde zaken bij focusgroep Drachten op 24 november 2011
Goede vraagstelling
Vaststelling beginniveau
Wat toetsen (inhoud)
Wat moeten ze aan het eind kunnen?
Kennis/inzichtverdeling
Normering vooraf?
Correctiemodel en accepteren antwoorden
Ontwikkelingen volgen
Vaardigheden/kennis/cognitief
Voorbereiding op toetsen (les)
Hoeveel tijd voor een toets?
Wat doe je met de resultaten?
82
Genoemde zaken bij focusgroep Magnolia op 28 november 2011
Toetsing naar examens toe
Dekkend toetsen, alles wat is geleerd
Methode toetsen (kwaliteit)
Gebruik van RTTI
Verschillende vormen van toetsen
Efficiënt toetsen
Aansluiting onderbouw/bovenbouw
Verschil in toetsing/leerling-kenmerken
Andere toetsing bij onderwijsvernieuwing
Normering – weging
Aantal toetsen/herkansingen
Resultaten onvoldoende; cijfer … en dan
Terugkoppeling naar leerlingen
Wat moeten ze weten
Toets is ook procesbewaking
83
Plan van Aanpak Kwaliteit van Toetsing
Drachten/Groningen
Onderwerp:
Deelnemers:
Doelstelling:
Specifiek:
Meetbaar:
Actief:
Realistisch:
Tijdgebonden:
Eindverantwoordelijk eigenaar:
84
Laaghangend Fruit Kwaliteit van Toetsing
Ideeën die kunnen worden gerealiseerd op korte termijn en tegen geringe kosten
Onderwerp:
Doelstelling:
Termijn:
Verantwoordelijk:
85
Uitkomsten Laaghangend Fruit
Drachten
Laaghangend fruit
Vervolg na analyse toetsing
Komen tot een eenvoudig BHV-model
Bewustwording van het feit dat er meer uit je toetsing te halen is
1e jaar: bezoek basisschool – vo-school waar ze werken met differentiatiemodel
Enthousiasmeren van de vakgroep
2e jaar: scholing aanbieden voor implementatie van het BHV-model
Verantwoordelijk: directie voor bezoekregeling op basisscholen en druk op
vakgroepen
ELO Fronter is voor implementatie BHV-model goed bruikbaar
Vakgroepen binnen locatie nieuw leven inblazen, voorzitter aanstellen
Analyse van toetsen willen we graag van de grond krijgen. Eind februari regelen.
Verantwoordelijkheid eerst bij directie, later bij voorzitters zaakvakken, taal, creatief
en science
Inventariseren wat er op CITO-gebied is. Presenteren aan het team. Plan van aanpak
maken voor: Hoe maak ik een goede toets? Zaken uit de vakgroepen terugkoppelen
naar de APV
Toets + correctiemodel + scoreblad + norm voor het nakijken van leerlingenwerk
vastleggen en je er aan houden
Leg één toets map aan met toets, correctiemodel en normering voor een heel
leerjaar. Doel: je hebt je eigen databank, je kunt een mede vakdocent hiermee
helpen als hij/zij een volgend schooljaar deze jaargroep heeft
In hoeverre is het mogelijk gebruik te maken van een landelijke toetsenbank. Iets om
te onderzoeken.
86
Magnolia
Laaghangend fruit
1. Schoolbrede toetsing. Doel bewaken en borgen doorlopende leerlijnen. Op het
eerstvolgende vakgroepoverleg. Verantwoordelijkheid bij vakgroep en team- of
locatieleider.
2. Woordenschatontwikkeling. Doel is een beter begrip van begrippen. Direct van
start door taalcoördinator/vakdocent
3. analyse van toetsen → delen met collega’s. Meer inzicht krijgen in de eigen manier
van toetsing.
4. vaststelling doorstroom eisen onderbouw/bovenbouw. Met alle docenten
examens bekijken om te constateren wat er eigenlijk getoetst wordt.
5. Betere aansluiting onderbouw/bovenbouw. Zo spoedig mogelijk mee beginnen. In
de brede vakgroep.
6. Maak cijfers inzichtelijk voor ouders. Betere communicatie. Verantwoordelijkheid
bij ICT en directie.