Verantwoord Meten In Het Gezondheidszorgonderwijs

196
VERANTWOORD METEN IN HET GEZONDHEIDSZORGONDERWIJS HANDBOEK VOOR DE BEOORDELING VAN LEERRESULTATEN Keuze van de juiste toetsvorm Praktische voorbeelden Nieuwe ontwikkelingen Kwaliteitsbewaking J.G.M. Schotten W.C.L. Robroek

Transcript of Verantwoord Meten In Het Gezondheidszorgonderwijs

Page 1: Verantwoord Meten In Het Gezondheidszorgonderwijs

VERANTWOORD METEN IN HET GEZONDHEIDSZORGONDERWIJS

HANDBOEK VOOR DE BEOORDELING VAN LEERRESULTATEN

Keuze van de juiste toetsvormPraktische voorbeeldenNieuwe ontwikkelingenKwaliteitsbewaking

J.G.M. SchottenW.C.L. Robroek

Page 2: Verantwoord Meten In Het Gezondheidszorgonderwijs

Dit handboek vormt de afsluiting van een samenwerkingsproject van de VOVB (Vereniging vanOpleidingsinstituten voor Verplegende en verzorgende Beroepen) en het Cito Instituut voor Toetsontwikkelingvoor de ontwikkeling van toetsen voor opleidingen voor de verpleging en (zieken)verzorging. Dit project werdmede gefinancierd door ministerie van Volksgezondheid, Welzijn en Sport.

Page 3: Verantwoord Meten In Het Gezondheidszorgonderwijs

VERANTWOORD METEN IN HET GEZONDHEIDSZORGONDERWIJS

HANDBOEK VOOR DE BEOORDELING VAN LEERRESULTATEN

J.G.M. SchottenW.C.L. Robroek

Met medewerking van:G.J.J.M. StraetmansA.M.A. StolkD. TarenskeenJ. van WeerenC.G.M. Liebrand

Page 4: Verantwoord Meten In Het Gezondheidszorgonderwijs

© 1997 Bohn Stafleu Van Loghum, Houten

Alle rechten voorbehouden. Niets van deze uitgave mag worden verveelvoudigd, opgeslagen in eengeautomatiseerd gegevensbestand, of openbaar gemaakt, in enige vorm of op enige wijze, hetzijelektronisch, mechanisch, door fotokopieën, opnamen, of enige andere manier, zonder voorafgaandeschriftelijke toestemming van de uitgever.Voorzover het maken van kopieën uit deze uitgave is toegestaan op grond van artikel 16B Auteurswet1912j° het Besluit van 20 juni 1974, St.b. 351, zoals gewijzigd bij Besluit van 23 augustus 1985, St.b.471 en artikel 17 Auteurswet 1912, dient men de daarvoor wettelijk verschuldigde vergoedingen tevoldoen aan de Stichting Reprorecht (Postbus 882, 1180 AW Amstelveen). Voor het overnemen van(een) gedeelte(n) uit deze uitgave in bloemlezingen, readers en andere compilatiewerken (artikel 16Auteurswet 1912) dient men zich tot de uitgever te wenden.

ISBN 90 313 24272D/1997/3407/025

Bohn Stafleu Van LoghumDe Molen 773995 AW Houten

Kouterveld 21831 Diegem

Page 5: Verantwoord Meten In Het Gezondheidszorgonderwijs

1 Uitgangspunten

Het voor u liggende handboek over evaluatie in het onderwijs is gebaseerd op twee uitgangspunten.Het eerste uitgangspunt is ’de aansluiting bij de praktijk’: in toenemende mate is er in het onderwijsbelangstelling voor praktische vaardigheden, zowel beroepsspecifieke als algemene vaardigheden. Degedachte daarachter is dat leerlingen daardoor beter zijn voorbereid op de eisen die er vanuit het beroepen de maatschappij aan hen gesteld worden. Wanneer opleidingen daar serieus werk van willen maken,heeft dat consequenties voor het hele didactische proces: de doelstellingen, de onderwijsleersituaties enderhalve ook de toetssituaties moeten beter aansluiten bij de praktijk(vaardigheden). In dit handboekwordt aangesloten bij Romiszowski, die in zijn de visie sterk de nadruk legt op vaardigheden.Dit leidt vanzelf tot het tweede uitgangspunt, ’de gezamenlijkheid’: wanneer deze wijzigingendoorgevoerd moeten worden, moeten alle verantwoordelijkheidsniveaus binnen de opleiding dit dragen.De aansluiting bij de praktijk zal in eerste instantie geïmplementeerd/gerealiseerd moeten worden opcurriculumniveau, maar vanuit dat niveau zal dat gevolgen hebben voor het managementniveau(facilitering en organisatie van het hele proces) en voor wat in dit handboek genoemd wordt hetuitvoeringsniveau (onderwijs en toetsing, didactiek en evaluatie).De problematiek van het verantwoord meten van leerresultaten wordt in dit handboek vanuit deze tweeuitgangspunten benaderd. Dat betekent dat er naast een bespreking van de noodzakelijke voorwaardenvoor verantwoord meten veel aandacht zal worden besteed aan het meten van vaardigheden.

De functie van het handboek is het bevorderen van de toetsdeskundigheid. Het maakt docenten bewustvan de noodzaak om verschillende doelen te toetsen met verschillende toetsvormen.Op curriculumniveau moet dit tot uiting komen in de onderwijs- en examenregeling.Voor het uitvoeringsniveau worden vervolgens de nodige handreikingen gegeven. Voor de kennistoetsenen de meeste vormen van vaardigheidstoetsen zijn de richtlijnen voldoende uitgewerkt om zelf totconstructie over te gaan. Voor die vormen van vaardigheidstoetsen waarvan de constructie te complexis (zoals computersimulaties), kunnen de richtlijnen gebruikt worden om de op de markt aangebodentoetsen te screenen of om in onderhandeling met een toetsconstructeur een eisenpakket op tafel te leggen.Voor alle vaardigheidstoetsen geldt echter dat het vaststellen van de kwaliteit ervan arbeidsintensief isen veel expertise vereist op het gebied van de psychometrie.

Het zich bewust zijn van de zin en noodzaak van verantwoord meten en beoordelen is een essentiëleschakel in het gehele systeem van kwaliteitszorg, een noodzakelijke voorwaarde op de weg naarkwaliteitsbewaking en -verbetering.

1

Page 6: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 1

1.1 Aansluiting bij de praktijk

1.1.1 Het model ’didactische analyse’: geen gesloten model

Om de plaats van meten in het onderwijsleerproces aan te geven, wordt vaak gebruik gemaakt van hetmodel ’didactische analyse’ (Van Gelder, 1971).Dit model is in afbeelding 1 terug te vinden in het gestippelde kader:

In afbeelding 1 staan respectievelijk leerdoelen, beginsituatie, onderwijsleersituatie en meten/beoordelen

afb. 1 - Externe invloeden op het onderwijsleerproces

genoemd. In paragraaf 2.2 zal dit model uitgebreider besproken worden. Eerst wordt nu besproken welkeexterne factoren invloed uitoefenen op de verschillende onderdelen van het model. Deze wordenaangegeven door de grote pijlen in de afbeelding.

1.1.2 De input vanuit de beroepspraktijk in het model

Uiteraard is dit model geen gesloten systeem. Vanuit de beroepswereld en vanuit de maatschappij wordeneisen gesteld, die invloed hebben op de verschillende onderdelen van dit model.Allereerst drukt de beroepspraktijk een belangrijk stempel op de eindtermen en leerdoelen van hetonderwijs. Het gaat immers om beroepsonderwijs; er worden mensen opgeleid om in de beroepspraktijkte functioneren. Telkens wanneer het beroep zich ontwikkelt, zullen de toeleverende opleidingen daaropmoeten inspelen. Scholen zullen steeds optimaal moeten aansluiten bij de beroepspraktijk, niet alleendoor bij het formuleren van eindtermen uit te gaan van taak- en functieanalyses, maar ook door hetonderwijsleerproces zo in te richten dat er een naadloze overgang is van theorie naar praktijk. Ditbetekent onder meer dat de beroepspraktijkvorming niet alleen in de beroepsbegeleidende leerweg(’werken/leren’) maar ook in de beroepsopleidende leerweg (’leren/stage’) een belangrijke plaats zalkrijgen.

2

Page 7: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitgangspunten

Voor toetsen geldt diezelfde eis van aansluiting bij de praktijk. Traditioneel is men bij het meten enbeoordelen van leerresultaten vaak in eerste instantie gericht op het meten van cognitieve vaardigheden(het kunnen herkennen en benoemen van zaken), hetgeen dan veelal plaatsvindt in de vorm vanschriftelijke toetsen. Dat is ook wel te verklaren: het maken van toetsen voor cognitieve vaardighedenis relatief eenvoudiger dan het ontwikkelen van kwalitatief goede instrumenten of procedures voor hetmeten van praktische vaardigheden. Het op een eenduidige en objectieve manier vaststellen van prestatiesvan leerlingen op het gebied van praktische vaardigheden (bijv. communicatieve vaardigheden) is zekergeen eenvoudige zaak. In het gezondheidszorgonderwijs worden de praktijkvaardigheden van leerlingengewoonlijk beoordeeld door een functionaris van de arbeidsorganisatie (praktijkbegeleider). Ondanks devaardigheid die de meesten van hen hebben in het beoordelen van praktijkvaardigheden, is het oordeelnog steeds gebaseerd op de individuele (en vaak subjectieve) opvatting van de beoordelaar. Vaak weetde leerling nauwelijks op welke criteria hij beoordeeld wordt en in een aantal gevallen hanteert de enebeoordelaar andere maatstaven dan de andere.

In dit handboek wordt daarom uitvoerig ingegaan op de verschillende vaardigheden die een leerling zichgedurende de opleiding eigen moet maken, de wijze waarop deze getoetst kunnen worden en detoetsvormen die daarvoor het meest geschikt zijn.

1.1.3 De input vanuit de maatschappij in het model

Ook de maatschappij stelt zijn eisen aan het individu. Wil men als volwaardig burger in de zich steedssneller veranderende maatschappij functioneren, dan is het noodzakelijk dat men daarvoor voldoende istoegerust. Steeds meer ontstaat het besef dat de maatschappij vraagt om, wat wel genoemd wordt,algemene vaardigheden: geen kant-en-klare kennis, maar instrumentele en strategische vaardigheden, dieeen persoon in staat stellen zich aan te passen aan veranderingen in beroep en maatschappij.Deze vaardigheden krijgen in steeds meer examenprogramma’s en eindtermendocumenten een plaats enhet onderwijs bezint zich op methoden om deze vaardigheden systematisch te onderwijzen en vervolgensook te toetsen.Dat brengt ons op een andere duidelijke invloed vanuit de maatschappij: om de waarde van diploma’ste kunnen garanderen, moeten bepaalde minimumeisen gesteld worden aan de toetsen en examens dierecht geven op een diploma. Dit ’civiel effect’ kan op verschillende manieren verkregen worden,namelijk door middel van:– centrale examens, waarbij alle opleidingen op hetzelfde moment hetzelfde examen afnemen;– landelijke examens, waarbij opleidingen de keuze hebben om op een bepaald moment aan een

centraal geconstrueerd examen mee te doen;– visitaties, waarbij opleidingen eens in de zoveel tijd doorgelicht worden op alle aspecten uit het

didactisch model;– externe legitimering, waarbij alle opleidingen een vastgesteld deel van hun toetsing ter controle aan

een onafhankelijke instelling moeten voorleggen.Op welke wijze dit civiel effect gewaarborgd wordt, is over het algemeen onderworpen aan wettelijkeregelingen. Voor het beroepsonderwijs in het algemeen vormen deWEB (Wet Educatie en Beroepsonder-wijs) en deWHW (Wet Hoger onderwijs en Wetenschappelijk onderzoek) hiervoor het belangrijkstekader. Daarnaast heeft de sector Gezondheidszorg per december 1997 specifiek te maken met de WetBIG (Beroepen in de Individuele Gezondheidszorg), waarin onder andere voor de verschillendeberoepsgroepen de vereiste bekwaamheid wordt aangegeven.

1.1.4 Aansluiting van de kwalitatieve en kwantitatieve uitstroom bij de behoefte van het werkveld

Een ander aspect waaraan zowel het beroepsveld als de maatschappij groot belang hecht, is deaansluiting van de uitstroom bij de behoefte van het werkveld, niet alleen in kwalitatieve maar ook in

3

Page 8: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 1

kwantitatieve zin. Uiteraard hebben ook de leerlingen er baat bij wanneer ze enerzijds adequaat wordentoegerust voor het beroep dat ze willen gaan uitoefenen en anderzijds gewild zijn op de arbeidsmarktvanwege hun specifieke deskundigheid. Opleidingstrajecten moeten leiden tot die kwalificaties waaraanbehoefte is. Deze afstemming zal veelal regionaal moet plaatsvinden, in overleg tussen werkgevers enopleiders.In dit verband is het relevant te melden dat men steeds meer uitgaat van brede kwalificaties, waardoorafgestudeerden op meer plaatsen inzetbaar zijn.

1.1.5 Aansluiting van verschillende opleidingen op elkaar: modulen en certificaateenheden

In opleidingen wordt tegenwoordig hoe langer hoe meer gewerkt met modulen en certificaateenheden.Dit zijn zelfstandige leereenheden waarvoor de leerling wordt toegelaten als hij aan een beginvoorwaardevoldoet en die wordt afgesloten met een toets. Een voldoende resultaat is vaak voorwaarde voor toelatingtot een volgende module. Een certificaateenheid heeft een dusdanige omvang, dat de leerling die eenvoldoende resultaat bereikt heeft op de toets een certificaat ontvangt.Soms is dit werken met modulen alleen een manier om lesinhouden te ordenen en volgen alle leerlingenvan een bepaald leerjaar gezamenlijk de modulen. Vaak is het echter ook een manier om individueleleerlingen in de gelegenheid te stellen een eigen leerroute te kiezen. Niet in de laatste plaats biedt hetvoordelen bij het instromen van leerlingen uit andere opleidingen of bij het (her)plaatsen van leerlingendie enige tijd uit het onderwijsproces zijn geweest.Door de vereiste beginsituatie voor de betreffende module eenduidig vast te leggen, kan getoetst wordenof leerlingen die aan deze module willen deelnemen aan de gestelde beginvoorwaarde voldoen.Ook in het gezondheidszorgonderwijs zal deze modulering in de nabije toekomst een steeds belangrijkerrol gaan spelen. Op de gevolgen van modulering voor de organisatie van toetsing en afsluiting wordtnader ingegaan in paragraaf 6.2, waar het optimale gebruik van een opgavenbank wordt besproken.Een andere belangrijke reden voor het moduleren van opleidingen is het beperken van de ongekwalifi-ceerde uitstroom: ook leerlingen die niet de hele opleiding afmaken, zullen een aantal eenheden hebbenafgesloten en daarvoor een certificaat hebben ontvangen. Zo staan zij niet langer met lege handen op dearbeidsmarkt.

1.2 Een gezamenlijke verantwoordelijkheid

Een project ’verantwoord meten’ kan niet enkel en alleen gerealiseerd worden op het niveau van deindividuele docent. Een bepaalde docent kan natuurlijk best zorgen voor een kwalitatief goede toetsingvan zijn leerlingen, maar als de toetsresultaten door anderen op de verkeerde manier wordengeïnterpreteerd of belangrijke beslissingen worden genomen op basis van andere gegevens, is het nut vanzijn inspanningen erg beperkt. Bovendien is het zaak om door intercollegiale screening of het aanstellenvan een toetsdeskundige of toetscommissie de kwaliteit van de beoordelingen te bewaken: legt elkedocent dezelfde normen aan, berijdt iemand niet steeds dezelfde stokpaardjes etc.Van verantwoord meten kan alleen sprake zijn als bij de invoering ervan rekening wordt gehouden methet opleidingssysteem als geheel. Als docenten geen faciliteiten geboden worden voor de ontwikkelingof aanschaf van nieuwe toetsvormen, mag men geen hooggespannen verwachtingen koesteren over heteffect van bijvoorbeeld een cursus ’het kiezen van de juiste toetsvorm’ of ’toetsontwikkeling’. Als deinspanningen op het gebied van verantwoord meten kans van slagen willen hebben, is een samenhangendbeleid daarom noodzakelijk.In dat beleid zijn drie niveaus aanwijsbaar waarop beslissingen worden genomen:– managementniveau;– curriculumniveau;– uitvoeringsniveau.

4

Page 9: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitgangspunten

Afhankelijk van het niveau waarop men functioneert, kan de aard van de beslissingen of uitsprakenechter verschillen. Men heeft behoefte aan specifieke informatie om op grond daarvan specifiekeconclusies te kunnen trekken. De vragen die men beantwoord wil zien op grond van dezelfdemeetgegevens, zijn vaak verschillend. In de volgende paragrafen wordt hierop nader ingegaan.

1.2.1 Managementniveau: facilitering (procesbeheersing/procesinrichting)

Op dit niveau wordt in globale zin de functie van verantwoord meten vastgelegd en worden devoorzieningen getroffen die nodig zijn voor het uitvoeren van de geplande activiteiten. Voor hetmanagement spelen bijvoorbeeld vragen als:– Wegen de investeringen (van geld en menskracht) op tegen de opbrengsten (kosten/baten-analyse)?– Hoe is de kwaliteit van onze instelling in vergelijking met andere opleidingen?– Met welke gegevens kan ons beleid naar buiten toe (bijv. ministerie) verantwoord onderbouwd

worden?– Komt het rendement van het binnenschools leren overeen met de afspraken die met de zorginstellin-

gen daarover gemaakt zijn? Hoe goed is de inzetbaarheid van de leerlingen in de zorginstellingen?

Op managementniveau richt men zich op de randvoorwaarden en de beleidskeuzen. Ook zal een aantalvoorzieningen getroffen moeten worden om een verantwoorde toetsing mogelijk te maken. Voorbeeldenvan aandachtspunten op dit niveau zijn:– De opleiding moet een duidelijke visie op meten en beoordelen ontwikkelen en deze visie moet zich

vertalen in toetsingsbeleid door directie en bestuur.– Meten en beoordelen zijn belangrijke instrumenten bij kwaliteitsbepaling en -bewaking door het

management. Er moeten daarom maatregelen, beslissingen en faciliteiten vanuit het managementworden gecreëerd waardoor de interne kwaliteitszorg gestalte krijgen.

– Toetsing hoort bij het takenpakket van de docent, maar voor het opzetten en in uitvoering nemen vaneen systeem van verantwoord meten is een dermate grote tijdsinvestering nodig dat bepaaldedocenten daarvoor gedeeltelijk vrijgeroosterd zullen moeten worden.

– Door te toetsen komt informatie beschikbaar. Tenzij die wordt opgeslagen in een toegankelijkadministratiesysteem, zal die informatie vluchtig van aard zijn. Er zal daarom nagedacht moetenworden over het ontwerp van een dergelijk systeem en over het beheer daarvan.

– Vernieuwingen of veranderingen op het gebied van verantwoord meten moeten, om kans van slagente hebben, gedragen worden door het merendeel van de medewerkers. De acceptatie zal gemakkelij-ker verlopen als de medewerkers goed op de hoogte zijn van de motieven, de uitvoeringsproceduresen de implicaties voor het eigen functioneren.

– Bij welke instantie, hoe en waartegen (bijv. tegen de beoordeling zelf of tegen de wijze waaropgetoetst is, e.d) kan de leerling in beroep gaan? Welke procedure volgt de beroepsinstantie bij hetafwikkelen van een beroep en wie stelt die werkwijze vast?

1.2.2 Curriculumniveau: aansturing

Ten aanzien van het curriculum spelen vragen als:– Hoe effectief is het gegeven onderwijs (onderwijsmethode, hulpmiddelen etc.)?– Voldoet het binnenschools leren aan de eisen van de zorginstellingen?– Sluit het onderwijs voldoende aan bij de leerdoelen en bij de beginsituatie van de leerlingen?– Met welke gegevens kan de kwaliteit van het gegeven onderwijs aangetoond worden aan

bijvoorbeeld directie en bestuur?

5

Page 10: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 1

Op curriculumniveau houdt men zich onder meer bezig met de voorwaarden voor en de onderlingeafstemming van de toetsen. Op dit niveau moeten (tenzij dit in de onderwijs- en examenregeling al isvastgelegd) afspraken gemaakt worden over bijvoorbeeld:– Curriculumopbouw:

. Hoe wordt de doorstroming van leerlingen in de opleiding geregeld (bijv. jaarklassensysteem,studiepuntensysteem)? Wie bepaalt deze regeling?

. Welke vakken of studieonderdelen zijn voorwaardelijk voor andere vakken of studieonderdelen?

. Kunnen vrijstellingen gegeven worden voor bepaalde studieonderdelen? Wat zijn daarvoor decriteria en wie stelt die vast?

– Onderwijs- en examenregeling:. Welke vakken of studieonderdelen moeten worden getoetst? En op welke momenten?. Op welke wijze worden de verschillende onderdelen getoetst (schriftelijk of mondeling;

kennistoets of vaardigheidstoets; werkstuk; etc.)?. Wat is de geldigheidsduur van toetsresultaten, certificaten e.d.?. Is er een officieel afsluitend examen? Hoe wordt dat vormgegeven en wat zijn de consequenties

van een onvoldoende resultaat?. Wie bepaalt wanneer de toetsmomenten zijn, hoeveel herkansingen er zijn en wat de gevolgen

zijn van ’niet halen’ van de laatste herkansing?– De functie van toetsen:

. Wat is de functie van toetsen op de verschillende momenten: diagnostisch, evaluerend ofcertificerend?

. Hoe kunnen de toetsresultaten benut worden bij de curriculumevaluatie?– Normering en cijfergeving:

. Hoe moeten toetsscores gewaardeerd worden (hoe wordt de cesuur vastgesteld)? Wie bepaalt dat?

. Hoe worden de toetsresultaten weergegeven (cijferschaal van 1 tot 10 of voldoende-onvoldoende-goed)?

– Kwaliteitsbewaking:. Hoe en wanneer (bij elke toets of alleen bij afsluitende toetsen) moet de kwaliteit van toetsen

onderzocht worden?– Administratie:

. Hoe worden toetsresultaten geadministreerd, voor hoe lang en wie hebben toegang tot dieadministratie?

– Constructieprocedures:. Wie dragen zorg voor de ontwikkeling van toetsen op grond waarvan belangrijke beslissingen

genomen worden over leerlingen?. Wie bewaakt het proces van de toetsontwikkeling?. Wie voert het onderzoek uit naar de kwaliteit van de vervaardigde toetsen en op welke wijze?

Hoe wordt daarover gerapporteerd en aan wie? Welke acties worden ondernomen als achteraf(nadat ze zijn afgenomen) blijkt dat toetsen onvoldoende kwaliteit hadden?

1.2.3 Uitvoeringsniveau: constructie/aanschaf, afname/verwerking, beoordeling

De deskundigheid van docenten beperkt zich niet tot het geven van lessen en het begeleiden vanleerlingen, maar richt zich ook op het formuleren van doelstellingen, het kiezen van toetsvormen, hetmeten van leerresultaten en het uiteindelijk op een zo verantwoord mogelijke wijze beslissingen nemenop grond van deze leerresultaten. Zoals in paragraaf 1.2.2 duidelijk is te lezen, worden op curriculumni-veau, in overleg tussen docenten en management, de benodigde kaders vastgesteld. Docenten die zichmet de uitvoering bezighouden, zullen vooral geïnteresseerd zijn in zaken als:– Hebben de leerlingen de gestelde leerdoelen bereikt?– Zijn er bepaalde leerlingen die remediërend onderwijs nodig hebben?

6

Page 11: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitgangspunten

– Voldoen de leerlingen aan de minimum-eisen om aan een bepaalde cursus of module deel te nemen?

Op uitvoeringsniveau zullen zij zich daarom moeten bezighouden met de volgende aspecten vanverantwoord meten en beoordelen:– Wanneer aan een toets grote consequenties voor de leerlingen zijn verbonden (al dan niet een

certificaat), moet die toets aan bepaalde minimale kwaliteitseisen voldoen. Welke eisen zijn dat enhoe kan daaraan voldaan worden?

– Wanneer een toets vooral een diagnostische functie heeft, spelen weer andere eisen een rol. Wanneerlevert zo’n toets waardevolle en bruikbare informatie op?

– Hoe kunnen bepaalde toetsvormen het beste geconstrueerd worden? Welke stappen zijn er teonderscheiden en welke fouten moeten er vermeden worden?

1.3 Leeswijzer

In het inleidende hoofdstuk 1 is met name de opzet van het handboek uitgelegd: voor de indeling vanhet handboek is aansluiting gezocht bij de toenemende aandacht voor vaardigheden vanuit beroep enmaatschappij. Verder wordt betoogd dat verantwoord meten een zaak is van alle verantwoordelijkheidsni-veaus binnen een opleiding. In de verdere hoofdstukken worden deze uitgangspunten nader uitgewerkt.In hoofdstuk 2 wordt besproken wat onder meten en beoordelen wordt verstaan en wat de plaats vanmeten en beoordelen in het didactisch proces is. Ook de verschillende functies van toetsen wordenbeschreven.Omdat een kwalitatieve uitspraak (een beoordeling) over de meetgegevens pas verantwoord is als erzekerheid bestaat over de juistheid van deze gegevens, zal in hoofdstuk 3 worden ingegaan op dekwaliteitseisen met betrekking tot meten en beoordelen.In hoofdstuk 4 passeren de verschillende toetsvormen heel kort de revue. De volgorde waarin dit gebeurt,is bepaald door de mate waarin de respectieve toetsvormen aansluiten bij de praktijk. Bovendien wordenvan elke toetsvorm de sterke en zwakke punten genoemd, zodat op basis van dit hoofdstuk een keuzegemaakt kan worden voor de meest geschikte toetsvorm.In de daaropvolgende hoofdstukken worden de beslissingen en activiteiten op de drie verantwoordelijk-heidsniveaus beschreven.In hoofdstuk 5 is dat allereerst het curriculumniveau. Met de gegevens uit hoofdstuk 4 moet men op datniveau komen tot het opstellen van een onderwijs- en examenregeling. Wanneer het toetsplan isuitgewerkt, moet op het uitvoeringsniveau allereerst gewerkt worden aan de constructie of aanschaf vande benodigde toetsen.Hoofdstuk 6 geeft in de vorm van stroomdiagrammen algemene richtlijnen voor de constructie. Hierbijwordt om een aantal redenen onderscheid gemaakt tussen enerzijds kennistoetsen en anderzijdsvaardigheidstoetsen.Deze algemene richtlijnen worden in hoofdstuk 7 voor de meeste toetsvormen uitgewerkt tot specifiekerichtlijnen, vuistregels en concrete voorbeelden. Voor een aantal andere toetsvormen wordt volstaan metaanwijzingen voor het beoordelen van de kwaliteit.Hoofdstuk 8 bevat richtlijnen voor de afname van de toetsen en de verwerking van de resultaten.In het afsluitende hoofdstuk 9 worden de beslissingen en voorzieningen op managementniveaubeschreven: welke maatregelen moeten er getroffen worden om te zorgen dat verantwoord meten eenvast onderdeel wordt en blijft van het totale opleidingsproces.

7

Page 12: Verantwoord Meten In Het Gezondheidszorgonderwijs

2 De plaats van meten en beoordelen in het didactisch proces

Meten speelt een belangrijke rol in veel activiteiten die kenmerkend zijn voor ’het onderwijs’.Curriculumevaluatie, school- en beroepskeuze, examinering, voortgangsbewaking: op al deze gebiedenwordt gemeten om verantwoord beslissingen te kunnen nemen over leerlingen, het onderwijzendpersoneel, curricula en opleidingen.

In het onderwijsleerproces vervult toetsing een centrale rol. Toetsing voorziet in de informatiebehoeftevan docenten die ontstaat als er beslissingen moeten worden genomen om het onderwijsleerprocesoptimaal te laten verlopen. In het onderwijsleerproces worden op verschillende momenten vragen gesteldwaarop met behulp van toetsen een bevredigend antwoord gegeven kan worden. Zodra de doelstellingenvan een stuk onderwijs bepaald zijn, komt de vraag op waar het onderwijs een aanvang moet nemen (devraag naar de beginsituatie). Tijdens het onderwijsleerproces moet op gezette momenten gecontroleerdworden of de leerlingen voldoende vorderingen maken. Als bijsturing noodzakelijk mocht zijn, kan ditplaatsvinden in het leerproces (de leerling verandert zijn leeractiviteiten) en/of in het onderwijsproces(de docent past de instructietactiek en/of -strategie aan). Na afloop van de instructieperiode dientvastgesteld te worden of leerlingen de beoogde kennis en vaardigheden hebben verworven.

In paragraaf 1.1 kwam het model van Van Gelder al ter sprake om te laten zien op welke wijze hetonderwijsleerproces beïnvloed wordt of moet worden door invloeden van buitenaf. In dit hoofdstukworden de verschillende onderdelen van het didactisch model aan de orde gesteld: aan welke eisenmoeten de eindtermen/doelstellingen voldoen, hoe kun je daar je onderwijsleersituatie op afstemmen,welke gevolgen moet dat hebben voor je toetsing, wat zijn de tegenstrijdigheden tussen de verschillendeeisen?Vervolgens wordt ingegaan op de terugkoppeling van de meetgegevens naar informatie voor deverschillende verantwoordelijkheidsniveaus, zoals deze in paragraaf 1.2 aan de orde kwamen: in eersteinstantie geeft het feedback aan de leerling en de docent, in tweede instantie (bij vergelijking tussenklassen of bij herhaalde meting) feedback over het curriculum en in laatste instantie (vergelijking metandere scholen, rendementsgegevens) feedback op managementniveau.Alvorens daartoe wordt overgegaan, zal eerst kort worden aangegeven wat onder meten en beoordelenwordt verstaan.Het hoofdstuk wordt afgesloten met een bespreking van de verschillende functies die toetsen kunnenhebben.

2.1 Meten en beoordelen: een begripsbepaling

Vaak worden de termen ’meten’, ’toetsen’, ’evalueren’ en ’beoordelen’ naar willekeur door elkaargebruikt. Daarom is het goed om deze begrippen kort nader toe te lichten.De begrippen ’meten’ en ’toetsen’ zijn in feite gangbare synoniemen en kunnen worden omschreven als:het systematisch en op objectieve wijze vaststellen van (studie- of leer)resultaten; een toets is hetmeetinstrument; het eindresultaat van meten is een score (het aantal goede antwoorden of verrichtingen,al dan niet gewogen).

8

Page 13: Verantwoord Meten In Het Gezondheidszorgonderwijs

De plaats van meten en beoordelen in het didactisch proces

De begrippen ’beoordelen’ en ’evalueren’ mogen (althans in het kader van onderwijs-/leerresultaten) ookals synoniemen worden opgevat en kunnen worden omschreven als: het systematische proces vanverzamelen, analyseren en interpreteren van de bij meting verkregen gegevens teneinde vast te stellenin welke mate de gestelde (leer)doelen zijn bereikt. Dit proces impliceert het toekennen van een(waarde)oordeel aan een meetresultaat op grond waarvan (onderwijskundige) beslissingen genomenworden. Schematisch kan deze samenhang aldus worden weergeven:

BEOORDELEN = METEN + WAARDEREN + BESLISSEN

Meten en beoordelen zijn processen die in elkaars verlengde liggen: een kwalitatieve uitspraak kan pasgedaan worden nadat er een kwantitatieve uitspraak is gedaan. Dus eerst meten en pas dan beoordelen.Daarbij moet men zich ook realiseren dat meten en beoordelen gewoonlijk geen eenmalige activiteitenzijn die klaar zijn zodra er een kwalitatieve uitspraak gedaan is. Meten en beoordelen vormen een minof meer continu proces waarbij vaak op meerdere momenten gemeten en beoordeeld wordt.Zoals de titel van het handboekVerantwoord meten in het gezondheidszorgonderwijswordt aangegevendat van de hierboven genoemde begrippen, het meten centraal staat: welke plaats heeft meten in hetonderwijsproces, aan welke eisen moeten goede meetinstrumenten voldoen en hoe kunnen goedemeetinstrumenten geconstrueerd worden. Dit wil overigens niet zeggen dat aan de andere zaken(waarderen en beslissen)geen aandacht zal worden besteed.

2.2 Het didactisch proces: de relatie tussen leerdoelen, beginsituatie, onderwijsleersituatie entoetsing

In paragraaf 1.1 werden de externe invloeden op het model ’didactische analyse’ besproken. Hieronderwordt nader ingegaan op het model zelf.

afb. 2 - Het model ’Didactische Analyse’

De leerdoelenzijn concretiseringen (operationalisaties) van de eind- of tussentermen van de opleidingen geven aan wat de leerling gedurende de onderwijsleerperiode moet leren: kennis en vaardigheden enleerinhouden.

9

Page 14: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 2

De beginsituatieheeft betrekking op de vraag naar het niveau van de leerling aan het begin van deopleiding of aan het begin van een module: ’Op welk niveau moet de docent aansluiten met zijnonderwijsproces? Wat weet de leerling al? Welke vaardigheden beheerst hij al?’

Om de leerdoelen te bereiken, moet er – rekening houdend met de beginsituatie – een reeks vanactiviteiten worden gepland. Dit speelt zich af in deonderwijsleersituatiewaarin vragen aan de ordekomen als: ’Welke leerstof past bij de leerdoelen? Welke didactische werkvormen kunnen er het bestegebruikt worden? Welke hulpmiddelen zijn zinvol in het onderwijsleerproces? Welke leeractiviteitenmoeten ontplooid worden?’

Hetmeten/beoordelenten slotte heeft betrekking op het vaststellen in hoeverre de leerdoelen bereikt zijn.Er is dus een duidelijke relatie tussen de leerdoelen en de meting van studieresultaten: aan de hand vande leerdoelen wordt gemeten wat de ’opbrengst’ is van het onderwijsleerproces.Tevens is er een voortdurende terugkoppeling van meten/beoordelen naar de onderwijsleersituatie: demeetgegevens kunnen relevante informatie opleveren over het gegeven onderwijs, de leeractiviteitenetcetera.

2.3 De functie van toetsen

De functie van meten in het didactisch proces kan rechtstreeks worden afgeleid uit de plaats van metenten opzichte van de beginsituatie, de onderwijsleersituatie en de leerdoelen, zoals beschreven in de vorigeparagraaf.Toetsen vindt plaats vóór of na een stukje onderwijs. Hierbij moet dan gedacht worden aan de kleinstmogelijke onderdelen die binnen een onderwijsprogramma te onderscheiden zijn en die beginnen metof afgesloten worden met een toets. Het kan hierbij gaan om een lesuur, een module of een cursus.In tabel 1 wordt weergegeven hoe toetsmomenten en toetsfuncties onderling samenhangen.

tabel 1 - Toetsmomenten en toetsfuncties

moment doel(en) functie(s)

vooraf • Meten of het beginniveau van de leerling(en)voldoende is voor het onderwijsprogramma.

selectie / plaatsing

• Meten welke leerdoelen voor welke leerlingenhaalbaar zijn.

classificatie

• Meten welk leertraject voor welke leerlingen hetmeest geschikt is.

interne differentiatie

achteraf • Meten wat de vorderingen van de leerling zijnen of remediëring gewenst is.

diagnosticering / remediëring

• Meten wat de kwaliteit of het rendement van hetgegeven onderwijs is.

curriculumevaluatie

• Meten of de leerling het vereiste kennis- envaardigheidsniveau heeft bereikt.

selectie / certificering

Uit de tabel blijkt dat toetsen verschillende functies kunnen hebben. Afhankelijk van de toetsfunctieworden bepaalde eisen aan de meting gesteld (zie tabel 23 op blz. 60). De belangrijkste functies c.q. demeest voorkomende toepassingen van toetsing zijn in de tabel geaccentueerd: toetsing vindt vooral plaats

10

Page 15: Verantwoord Meten In Het Gezondheidszorgonderwijs

De plaats van meten en beoordelen in het didactisch proces

na (een deel van) het onderwijsprogramma. In enkele stroomdiagrammen wordt een en ander verderverduidelijkt.De rechthoek hieronder stelt een onderwijsprogramma in algemene zin voor. Het kan daarbij gaan omde leerstof van een hoofdstuk in een leerboek, een oefening, een module van een paar weken of zelfsom een complete cursus. De pijl links verwijst naar de leerlingen die met het programma gaan beginnenen de pijl rechts verwijst naar de leerlingen die het programma hebben doorlopen:

afb. 3 - Stroomdiagram van onderwijsprogramma

2.3.1 Selectiemiddel voor plaatsing

Wanneer een toets voorafgaand aan een bepaald onderwijsprogramma wordt afgenomen met het doel debeste kandidaten te selecteren (selectie bij de poort), zal het schema er aldus uitzien:

afb. 4 - Selectie bij de poort

Op grond van de toetsresultaten wordt beslist wie wel en wie niet met het programma mag starten. Vanbelang is hier dat afgewezen kandidaten bij de planning van het onderwijs geen rol meer spelen. Zeworden eenvoudig niet tot het programma toegelaten en daar blijft het bij, ook al krijgen ze allerleiadviezen.Voorbeelden:– Een farmaceutisch bedrijf in Frankrijk biedt een groot Nederlands ziekenhuis voor een aantal

personeelsleden een nascholingscursus aan op een van de Franstalige eilanden in het Caraïbischgebied. Van de directie mogen alleen diegenen intekenen die over voldoende kennis van het Fransbeschikken. Dit wordt door een taleninstituut door middel van een toets vastgesteld.

– In veel landen wordt op basis van een toelatingsexamen beslist wie tot een universiteit wordttoegelaten en wie niet.

Plaatsingstoetsen, zoals dergelijke instrumenten wel worden genoemd, kunnen op verschillende manierenworden ingezet en verschillende doelen dienen.In de bovenstaande voorbeelden worden ze gebruikt om een antwoord te geven op de vraag of deleerlingen over de voorwaardelijke kennis en vaardigheden beschikken om aan een cursus, module ofopleiding deel te nemen c.q. in hoeverre de leerlingen de doelstellingen van de te volgen cursus, module,opleiding al hebben bereikt (bijv. door een eerdere module of opleiding). Het gaat hierbij om eenabsolute norm.Men kan plaatsingstoetsen echter ook gebruiken als men wil nagaan welke leerlingen de meeste kansvan slagen hebben in een vervolgopleiding. In dat geval is er sprake van een relatieve norm. Dit doetzich bijvoorbeeld voor als slechts een beperkt aantal plaatsen beschikbaar is in de vervolgopleiding.

11

Page 16: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 2

2.3.2 Classificatie of externe differentiatie

Een variant hierop waarbij met onderwijs aan alle leerlingen rekening wordt gehouden, is de volgende:

afb. 5 - Classificatie van leerlingen

De toetsresultaten worden gebruikt om te beslissen wie voor het ene dan wel het andere onderwijspro-gramma in aanmerking komt. Van belang is dat met beide programma’s verschillende doelstellingenworden nagestreefd (X en Y in het stroomdiagram). Kandidaten die naar programma A mogen, behalenandere leerresultaten dan kandidaten die programma B gaan volgen. Deze procedure wordt classificatiegenoemd. Ook spreekt men wel van ’externe differentiatie’, omdat een bepaalde groep leerlingen vande oorspronkelijke groep wordt afgezonderd.Voorbeelden:– Na het doorwerken van een hoofdstuk in het leerboek wordt op basis van een toets beslist wie de

leerstof volledig beheerst en derhalve met verrijkingsstof mag beginnen en wie herhalingsstof enextra oefeningen nodig heeft.

– Na selectie van geschikte leerlingen voor de nascholingscursus biedt de directie de overigegegadigden een cursus van één dag in Nederland aan waar het verhaal van een ’ingevlogen’medewerker van het Franse bedrijf door een tolk wordt vertaald.

2.3.3 Interne differentiatie

Een derde vorm is de interne differentiatie. Door middel van een toets wordt beslist wie het ene of hetandere onderwijsprogramma mag gaan volgen, echter zonder dat daarbij andere leerresultaten wordennagestreefd. Beide programma’s hebben dezelfde doelstellingen.Het is echter heel goed mogelijk dat de ene onderwijsmethode meer geschikt is voor de ene groep danvoor de andere. Beslissend is echter dat op het eind van de rit dezelfde eisen worden gesteld, mendezelfde verwachtingen heeft etcetera. In afbeelding 6 staat het bijbehorende stroomdiagram:

afb. 6 - Interne differentiatie

12

Page 17: Verantwoord Meten In Het Gezondheidszorgonderwijs

De plaats van meten en beoordelen in het didactisch proces

Bij de volgende varianten wordt een toets pas na afloop van het onderwijsprogramma afgenomen. Dezevorm van toetsing komt het meeste voor. De toetsuitslag geeft aan of, en in hoeverre de kandidaten deleerstof daadwerkelijk onder de knie hebben. Zo’n afsluitende toets kan zoals gezegd verschillendefuncties hebben.

2.3.4 Feedbackfunctie voor de individuele leerling: diagnostisch

De eerste vorm van toetsing achteraf is gericht op terugkoppeling naar de individuele leerling en heefteen diagnostische functie. Een consequente doorvoering hiervan kan worden gevonden bij beheersingsle-ren of ’mastery learning’. Leerlingen met scores van meer dan bijvoorbeeld 80% hebben het programmamet succes doorlopen en kunnen verder met het volgende leerstofgedeelte. De anderen dienen de leerstofvanaf een bepaald punt te herhalen, totdat iedereen of bijna iedereen de stof beheerst. Vaak echter zalde leerstof op een iets andere wijze worden aangeboden omdat mogelijk de eerdere instructie bijsommige leerlingen onvoldoende resultaat opleverde. In dat geval is er sprake van remediëring enontstaat een stroomdiagram dat sterk lijkt op dat van afbeelding 6.

afb. 7 - Een diagnostische toets

Wanneer toetsing plaatsvindt ter afsluiting van een relatief klein deel van het curriculum met alsbelangrijkste oogmerk informatie te krijgen over de vorderingen van de leerlingen, spreekt men vandiagnostische toetsen (of formatieve toetsen). Dergelijke toetsen worden op gezette tijden tijdens hetonderwijsleerproces afgenomen om de vorderingen van de leerlingen te kunnen volgen en bijtijdsmaatregelen te kunnen nemen ingeval van vertraging of achterstand.Het belang van dit soort toetsen is de feedbackfunctie. Leerlingen kunnen uit de toetsuitslag preciesaflezen waar hun lacunes zitten. Voorwaarde is daarbij wel dat de toetsuitslag voldoende gedetailleerdis (dus alleen het toekennen van een cijfer of het aantal behaalde scorepunten is ten enenmaleontoereikend).In het ideale geval is de toets zodanig geconstrueerd dat aanknopingspunten voor remediëring(individueel of als groep) van het onderwijsleerproces direct afgeleid kunnen worden uit de ’gemiste’vragen of opdrachten, dat wil zeggen de fouten die individueel of groepsgewijs opvallend vaak ofstelselmatig gemaakt worden. Maar: formatieve toetsen zijn verre van gemakkelijk te construeren,aangezien elk fout antwoord van de leerling ’vertaald’ moet kunnen worden in een aanwijsbare lacune(in kennis, denken of dergelijke). Indien uit een formatieve toetsing blijkt dat een groot aantal leerlingenbepaalde doelen nog niet beheerst, is dit een signaal voor de docent om de gehanteerde onderwijsstrate-gie aan een kritisch onderzoek te onderwerpen en zo nodig te wijzigen.Formatieve toetsen zeggen dus niet alleen iets over de vorderingen van de leerlingen (’wat weten ze(nog) niet?’), maar kunnen ook zeer nadrukkelijk informatie geven over het onderwijsleerproces (’welkeonderwerpen moeten opnieuw of anders besproken worden’; ’hoe effectief is de manier van lesgeven?’;’zijn de doelen correct afgestemd op het niveau van de groep?’ etc.). Deze functie komt in de volgendeparagraaf aan de orde.

13

Page 18: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 2

2.3.5 Feedbackfunctie voor het onderwijsleerproces (opleider): evaluerend

Toetsen geven echter niet alleen informatie over de leerlingen, maar ook over het gegeven onderwijs.Vanuit het resultaat van een of (vaak) meer toetsen wordt gekeken hoe het gegeven onderwijs bij deleerlingen is overgekomen. Bij dit evaluerend gebruik van toetsing staat de kwaliteit of het rendementvan het onderwijs centraal.

afb. 8 - Curriculumevaluatie

2.3.6 Selectiemiddel voor afsluiting: certificerend

Het bekendste voorbeeld van een afsluitende toets is wel het examen. Na een compleet onderwijspro-gramma of certificaateenheid wordt een toets voorgelegd. De belangrijkste functie van zo’n toets is hetcertificeren van succesvolle leerlingen.

afb. 9 - Certificering

De afgewezen leerlingen kunnen over het algemeen een herkansing doen. Wanneer ze ook daarvoorzakken, zijn er verschillende mogelijkheden:– ze verlaten de school en proberen op de arbeidsmarkt aan de slag te komen;– ze stromen door naar een eenvoudiger onderwijstype om op dat niveau een certificaat te behalen;– ze doen (een deel van) het onderwijsprogramma over om zo alsnog te trachten voor het examen te

slagen.In afbeelding 9 is alleen de stroom van succesvolle leerlingen aangeduid.Met behulp van summatieve toetsen (ook wel selectieve toetsen genoemd) wordt aan het einde van eencursus, module of opleiding nagegaan of en zo ja in welke mate de leerlingen het vereiste kennis- envaardigheidsniveau hebben bereikt, c.q. de leerdoelen hebben bereikt. De uitslag van een summatievetoets bepaalt gewoonlijk of leerlingen een (deel)certificaat of diploma mogen ontvangen en mogendoorstromen naar het vervolgonderwijs (vervolgcursus of volgende module).

14

Page 19: Verantwoord Meten In Het Gezondheidszorgonderwijs

De plaats van meten en beoordelen in het didactisch proces

2.4 Eisen voor de formulering c.q. de concretisering van eindtermen/leerdoelen als voorwaardevoor een verantwoorde toetsing en beoordeling

2.4.1 Het ontwikkelen van eindtermen vanuit de kwalificatiestructuur

Eindtermen vormen de uitwerking van een kwalificatiestructuur en geven ook inhoud aan diekwalificatiestructuur. Door middel van de eindtermen worden de verschillende (deel)kwalificatiesverduidelijkt en concreet gemaakt.In het beroepsonderwijs is de beroepskwalificatie van primair belang. Dat betekent echter niet dat eralleen eindtermen zullen bestaan die van het beroepsprofiel zijn afgeleid. De kwalificatiestructuur richtzich op een drievoudige kwalificatie:– de beroepskwalificatie;– de maatschappelijke en culturele kwalificatie;– de doorstroomkwalificatie.De ontwikkeling van eindtermen voor de beroepskwalificatie geschiedt op basis van de beroepsprofielen.Bij de ontwikkeling van eindtermen voor de doorstroomkwalificatie zal gekeken moeten worden naarde instroomeisen en instroomprofielen van het vervolgonderwijs. De eindtermen die gericht zijn op demaatschappelijke en culturele kwalificatie moeten ontleend worden aan het functioneren als burger inde samenleving en als werknemer in het bedrijfsleven.Eindtermen hebben een belangrijke functie voor het onderwijs. Het moeten hanteerbare beschrijvingenzijn van kennis, inzicht, vaardigheden en attitudes, met voldoende indicaties voor de inrichting van hetonderwijs en de examinering.Eindtermen zullen over het algemeen geen uitwerking geven van voorwaardelijke kennis envaardigheden. Voor de daadwerkelijke vormgeving van het onderwijs en de toetsing bestaat behoefte aaneen concretisering van de eindtermen. Derhalve zal een analyse moeten plaatsvinden om het traject datvoert naar de eindtermen vorm te geven: welke tussenstappen zijn er te onderscheiden? Het resultaat vandeze analyse zijn de leerdoelen. In paragraaf 2.4.3 worden de eisen beschreven waaraan de formuleringvan leerdoelen moet voldoen. Eerst wordt in paragraaf 2.4.2 ingegaan op het gebruik van een taxonomiebij het in kaart brengen van eindtermen en leerdoelen.

2.4.2 Taxonomie

Een taxonomie is een hiërarchisch classificatiesysteem voor het formuleren en ordenen van eindtermenen leerdoelen. In de loop van de tijd zijn verschillende taxonomieën bedacht, die onderling veelovereenkomsten vertonen. In elke taxonomie is bijvoorbeeld een gedragscomponent en een inhoudscom-ponent te onderscheiden.In dit handboek wordt de taxonomie van Romiszowski (1981) gehanteerd. De reden hiervoor is dat indeze taxonomie een duidelijk accent ligt op vaardigheden. Bovendien wordt zijn indeling in hetgezondheidszorgonderwijs inmiddels vaak gehanteerd.Romiszowski onderscheidt allereerst kennis en vaardigheden. Onder kennis verstaat hij ’informatieopgeslagen in de hersenen’; iemand heeft kennis of heeft die niet. Kennis vormt de basis voorvaardigheden. Vaardigheden zijn acties die iemand uitvoert om een bepaald doel te bereiken;vaardigheden ontwikkelen zich door ervaring en oefening, iemand kan dus in meer of mindere mate overeen bepaalde vaardigheid beschikken. Het niet volmaakt beheersen van een vaardigheid kan betekenendat iemand alle delen kan uitvoeren, maar op een lager niveau van precisie of productiviteit.In het beroepsonderwijs wordt steeds meer uitgegaan van het goed kunnen functioneren in deberoepspraktijk. De leerling moet bepaalde beroepsvaardigheden kunnen uitoefenen. Voor het juistuitvoeren heeft hij ook kennis nodig; kennis is voorwaardelijk.

15

Page 20: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 2

KennisIn tabel 2 is weergegeven op welke wijze kennis door Romiszowski wordt opgesplitst.

tabel 2 - Het kennisdomein volgens Romiszowski

kennis

feitelijk

feiten

concrete feiten

verbale informatie

feitelijke systemen

procedures

ketens

discriminaties

algoritmen

begripsmatig

begrippen

concrete begrippen

abstracte begrippen

begrippensystemen

principes

natuurprincipes

handelingsprincipes (heuristieken)

regelsystemen

Bij feitelijke kennis gaat het om herinneren of herkennen van feiten of procedures. Bij feiten gaat hetom objecten, gebeurtenissen, namen e.d. Bij procedures richt de kennis zich op de juiste handelwijze ineen specifieke situatie.Er is sprake van begripsmatige kennis wanneer er inzicht aan te pas komt. Hierbij kan een onderscheidworden gemaakt in begrippen en principes. Bij begrippen gaat het om min of meer abstracte klassen,zoals (van concreet naar abstract) ’rood’, ’kleur’ en ’fysieke eigenschappen’. Bij principes gaat het omhet kennen van regels die onze handelingen kunnen sturen of veranderingen kunnen verklaren.

VaardigheidRomiszowski onderscheidt vier soorten vaardigheden:– cognitieve vaardigheden: het toepassen van kennis, het controleren en benutten van de geestelijke/in-

tellectuele vermogens;– psychomotorische vaardigheden: het uitvoeren van fysieke, motorische handelingen, gebruikmakend

van kennis en inzicht;– reactieve vaardigheden: het hanteren van emoties, aandacht hebben voor, (beroeps)houding tonen,

handelen overeenkomstig een waardensysteem;– interactieve vaardigheden: het hanteren van sociale en communicatieve aspecten in de dagelijkse

omgang met anderen, tijdens overleg en bij samenwerking.

Voor elke categorie wordt door Romiszowski vervolgens een onderscheid gemaakt in reproductieve enproductieve vaardigheden. Het kenmerk van reproductieve vaardigheden is dat ze min of meergeautomatiseerd verlopen; leerdoelen zijn reproductief als ze verwijzen naar vaardigheden die eenleerling volgens een vaststaande procedure, een duidelijk voorschrift of protocol uitvoert. In een nieuwesituatie kan de leerling deze vaardigheid min of meer vanzelf reproduceren.Het kenmerk van productieve vaardigheden is dat er een creatieve, planmatige aanpak voor nodig is.Leerdoelen zijn productief als ze verwijzen naar vaardigheden die de leerling in een nieuwe situatie moetuitvoeren zonder dat daarbij teruggevallen kan worden op een vaste procedure of vast handelingsvoor-

16

Page 21: Verantwoord Meten In Het Gezondheidszorgonderwijs

De plaats van meten en beoordelen in het didactisch proces

schrift. De leerling moet in dit geval geleerde principes en strategieën kunnen toepassen in een nieuwesituatie. Een nadere uitwerking is te vinden in tabel 3.

Een reproductieve vaardigheid kan een productieve vaardigheid worden zodra de leerling de vaardigheidmoet kunnen toepassen in een nieuwe situatie waarin hij de geleerde principes niet zonder meer – minof meer automatisch – kan gebruiken. In dergelijke situaties moet hij een appèl doen op meerdereverworven vaardigheden.Voorbeelden:Het injecteren van een patiënt is in principe een reproductieve psychomotorische vaardigheid. Maar ditkan veranderen in een productieve vaardigheid als de patiënt die geïnjecteerd moet worden zeer agressiefgedrag vertoont en als dit voor de leerling een nieuwe situatie is waarin hij onvoldoende houvast heeftaan vaste handelingsvoorschriften.Hetzelfde geldt voor de in principe reproductieve vaardigheid ’wassen en aankleden van een patiënt’.Bij een patiënt met hevige spasmen zou het weleens een productieve vaardigheid kunnen zijn.

Het grote voordeel van een indeling als die van Romiszowski is dat men daarmee een soms complexe

tabel 3 - Vaardigheden volgens Romiszowski

reproductieve vaardigheden productieve vaardigheden

cognitieve vaardigheden berekenen wanneer een infuusflesvervangen moet worden

een verpleegplan opstellen

psychomotorische vaardigheden bloeddruk meten in een routine-situatie

een injectie toedienen

reactieve vaardigheden aandacht geven aan de patiënt zelfverwerkelijking

interactieve vaardigheden goede manieren hebben leiderschap

taak goed kan analyseren. Hierdoor wordt helderder welke vaardigheden vereist zijn voor het uitvoerenvan die taak. Ook bij het concretiseren van eindtermen in leerdoelen biedt een taxonomie houvast.

2.4.3 Leerdoelen

Een leerdoel is pas echt een leerdoel als een verschil kan worden waargenomen tussen leerlingen die hetdoel hebben bereikt en leerlingen voor wie dat (nog) niet het geval is. Zo’n verschil biedt een eersteaanzet voor toetsontwikkeling. Leerdoelen kunnen alleen gerealiseerd worden als valt na te gaan of zebereikt zijn, dus ieder leerdoel moet precies gedefinieerd worden. Wat niet precies kan wordenbeschreven, is lastig te verantwoorden, nog moeilijker te onderwijzen en onmogelijk te toetsen!

Een toetsbaar leerdoel is constateerbaar en meetbaar. ’Constateerbaar’ wil zeggen dat kan wordenwaargenomen of een leerling het leerdoel heeft bereikt. ’Meetbaar’ houdt in dat de mate waarin hetleerdoel is bereikt, kan worden gekwantificeerd. Dat wil zeggen in een waarde kan worden uitgedrukt,bijv.: 1 = bereikt, 0 = niet bereikt, ½ = gedeeltelijk bereikt; 10 punten = geheel bereikt, 8 punten = voor80% bereikt, etcetera.Het formuleren van een leerdoel op een zodanige manier dat bereiken ervan constateerbaar is, heetconcretiseren. Het zodanig formuleren van een leerdoel dat de mate van realisatie meetbaar is, heetoperationaliseren. Concretiseren en operationaliseren worden wel in één woord samengevat metspecificeren.

17

Page 22: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 2

Voor de specificatie van leerdoelen gelden enkele algemene regels:

1 Omschrijf een leerdoel als resultaat van een leerproces, dus als een leereffect.

Voorbeeld: ’Voorkomen en bestrijden van doorliggen bij bedlegerige patiënten’ (als resultaat van deopleiding) en niet: ’De verpleegkundige doordringen van de noodzaak om doorliggen bij bedlegerigepatiënten te voorkomen en te bestrijden’ (deze formulering heeft immers betrekking op hetinstructieproces).

2 Geef onder elk leerdoel een representatief aantal voorbeelden van wat de leerling moet kunnen alshij het leerdoel heeft bereikt.

’representatief’ wil hier zeggen: als het profiel van de leerling beantwoordt aan de voorbeelden, heefthij het gestelde leerdoel bereikt.

Voorbeeld: ’Zorgt stelselmatig voor een gladde en droge onderlaag bij bedlegerige patiënten’.

3 Begin iedere formulering met een werkwoord dat een waarneembaar gedrag aanduidt.

Dus niet: ’De leerling dient in staat te zijn om getallen van twee cijfers op te tellen’, maar: ’Teltgetallen van twee cijfers op’; al het andere is overbodig.En ook niet: ’Beheerst de regels van het optellen van meercijferige getallen’. Hierbij wordt nietmeteen duidelijk, hoe die beheersing moet blijken. Denkbaar is bijvoorbeeld dat de leerling die regelszelf zou moeten formuleren!

Werkwoorden of werkwoordelijke omschrijvingen die een waarneembaar gedrag aanduiden, zijnbijvoorbeeld: aanwijzen, beschrijven, berekenen, citeren, definiëren, de verschillen aangeven tussen,een onderscheid maken tussen, een verklaring geven van, een voorbeeld geven van, noemen, noteren,opsommen, opstellen (bijv. van een grafiek). Bij het definiëren van beroepsvaardigheden worden inde regel werkwoorden gebruikt die naar observeerbare handelingen verwijzen.

4 Vermeld de voorwaarden/omstandigheden waaronder het gedrag vertoond moet worden.

5 Noem de normen waaraan het gedrag moet voldoen.

Voorbeeld: ’Typt [waarneembaar gedrag]een geschreven concept over in WP 5.1[voorwaarden/om-standigheden: de tekst wordt in geschreven vorm aangeboden en als tekstverwerker moet WP 5.1gebruikt worden]met minimaal 100 aanslagen per minuut waarbij maximaal 5 fouten per getyptepagina mogen worden gemaakt[norm]’.

Voorbeeld: ’Geeft aan welke zuigelingen niet gebaad mogen worden’. In deze vorm is het leerdoelwel erg open; moet de leerling een sluitende opsomming van alle mogelijke en denkbare gevallenleveren? Alternatief:

’Geeft aan welke zuigelingen wel en welke niet gebaad mogen worden, gegeven de volgendeaandoeningen[volgt een lijst die de voorwaarden/omstandigheden preciseert waaronder het gewenstegedrag – aangeven wel of niet – vertoond moet worden]’.

18

Page 23: Verantwoord Meten In Het Gezondheidszorgonderwijs

De plaats van meten en beoordelen in het didactisch proces

Een leerdoel dat volgens de regels 1 t/m 5 geformuleerd is, heeft het karakter van een taakomschrij-ving.

Andere voorbeelden:

’Noemt 6 van de 10 verschillen tussen ziekte A en ziekte B als vermeld in het leerboek (p. 316 -321).’

’Voert bij 90% van de patiënten een venapunctie zodanig uit, dat 1) de patiënt niet meer pijn heeftdan nodig is en 2 het buisje zich met bloed vult.’

6 Splits complexe taakomschrijvingen uit, waardoor ze overzichtelijker worden.

Dus niet: ’Maakt een onderscheid tussen vier toedieningswijzen van injecties naar werkingsduur,injectieplaats, opnamesnelheid en gevaar’, maar:1 Noemt vier toedieningswijzen van injecties.1.1 Geeft daarbij het orgaan aan, waar de injectievloeistof het eerst terechtkomt.1.2 Rangschikt de toedieningswijzen naar werkingsduur/opnamesnelheid.1.3 Noemt per toedieningswijze twee risico’s voor de patiënt.

2.4.4 Het toetsen van kennis en vaardigheden

Ook bij de toetsconstructie is het zinvol gebruik te maken van de taxonomie van Romiszowski. Dat geldtzeker als het gaat om meetinstrumenten of beoordelingsprocedures ten behoeve van meer complexetaken. Door het vooraf analyseren van de leerdoelen en de kennis- en vaardigheidscomponenten waaruitdeze leerdoelen bestaan, verkrijgt men een goed beeld van de complexiteit van de taak.Een (sterk vereenvoudigd) voorbeeld maakt dit duidelijk:Er moet een observatielijst ontwikkeld moet worden voor de taak ’begeleiden van een patiënt metAIDS’.De eerste stap om de complexiteit van de taak in beeld te krijgen, zal bestaan uit het analyseren van devaardigheden die in deze taak aan de orde zijn.Dit kan leiden tot de volgende vaardigheden:– cognitieve vaardigheden;– reactieve vaardigheden;– interactieve vaardigheden.De volgende fase zal zijn om iedere vaardigheid nader te analyseren.Dit kan leiden tot een verdere verfijning van cognitieve vaardigheden in de vorm van:. toepassen van kennis en inzicht in de aandoening;. toepassen van kennis en inzicht in stervensbegeleiding;Deze cognitieve vaardigheden vormen in de uitvoering van de taak de voorwaarde voor de anderevaardigheden.Voor de reactieve component kan dit de volgende deelvaardigheden opleveren:. kunnen hanteren van eigen emoties en die van de patiënt;. aandacht hebben voor de patiënt en diens emoties en gevoelens;. beroepshouding tonen;. handelen volgens een waardensysteem;Voor de interactieve component kunnen de deelvaardigheden er als volgt uitzien:. kunnen communiceren met de patiënt en diens relaties;. voorlichting kunnen geven aan de patiënt en diens relaties.Indien zinvol zou men de deelvaardigheden nog verder kunnen analyseren.

19

Page 24: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 2

Door op deze wijze een taak uiteen te rafelen in deelvaardigheden, daarbij desgewenst ook nog aan tegeven of het gaat om reproductieve of om productieve vaardigheden, verkrijgt men een gestructureerdelijst met observatiepunten.Het is dan vervolgens aan de inhoudsdeskundigen om vast te stellen of de observatiepunten tezamen detaak ’dekken’ (validiteitsvraag) en of elk observatiepunt even zwaar weegt in de beoordeling etcetera.Hierop wordt in dit hoofdstuk verder niet ingegaan.

Uit dit voorbeeld wordt duidelijk dat de meeste taken in de beroepssituatie bestaan uit verschillendevaardigheden of, zoals dat ook wel genoemd wordt, een ’mix van componenten’ (Dochy, 1995).In het begin van de opleiding of module hebben taken vaak betrekking op één soort vaardigheid (meestalcognitief of psychomotorisch). Naarmate de opleiding vordert, worden de taken complexer en staan detaken dichter bij de werkelijke praktijk; de taken omvatten dan vaak meer dan één vaardigheid. Daarbijis het vaak moeilijk aan te geven welke component het grootste stempel drukt op de taak.

2.5 Ordeningsmogelijkheden voor toetsvormen

In dit handboek wordt een scala aan toetsvormen gepresenteerd, worden aanwijzingen gegeven voor deconstructie of aanschaf en worden eisen geformuleerd waaraan toetsen moeten voldoen. Het belangrijkstepunt is misschien echter wel de keuze voor een bepaalde toetsvorm. Welke toets uit de hele scala is opwelk moment in het didactische proces nu het meest geschikt? Op deze vraag wordt in deze paragraafvanuit twee verschillende invalshoeken een eerste antwoord gegeven.

2.5.1 Aansluiting bij de leerdoelen: de ’fit’

Als na analyse duidelijk is uit welke inhoud en vaardigheden een taak bestaat en de leerdoelen daarmeeduidelijk geworden zijn, moet vervolgens de passende toetsvorm worden gekozen. De toetsvorm wordtbepaald door de eindtermen/leerdoelen. De mate waarin de toets past bij de beschreven doelstellingenwordt wel de ’fit’ genoemd (P. Cras in Kessels & Smit, dl. 10).Uit oogpunt van validiteit (zie par. 3.3) is het van belang dat de toets meet wat men beoogt te meten.Het gewenste gedrag moet door de toets worden uitgelokt.Als de leerling blijkens de leerdoelen een cognitieve vaardigheid moet beheersen, bijvoorbeeld hetkunnen uitleggen van een procedure, zal de toetsvorm zodanig moeten zijn dat de leerling dezevaardigheid ook daadwerkelijk kan tonen. In zo’n geval zal dan van een schriftelijke toets of eenmondelinge opdracht worden gebruikt. Als de leerling moet tonen dat hij een bepaalde handeling correctkan uitvoeren, zal hem in de toets ook de opdracht gegeven moeten worden om deze handeling uit tevoeren.

In het kader van het beoordelen van toetsen wordt wel een viertal ’fits’ onderscheiden.1 Perfect fit: de uitvoering van de toetsopdracht levert de gewenste informatie op over de prestaties

van de leerling. Het is goed mogelijk op basis daarvan uitspraken te doen over het beheersen vande leerdoelen.Voorbeeld:Doelstelling: Een anamnesegesprek kunnen voeren met een volwassen patiënt.Toetsvorm: In een vooraf bepaalde zorgsituatie de leerling een anamnesegesprek laten voeren met

een patiënt.2 Fair fit : de uitvoering van de toetsopdracht levert met enige beperking (door de toetsopdracht zelf

en/of door de situatie waarin wordt getoetst) informatie op over de prestaties van de leerling.Uitspraken over het beheersen van de leerdoelen kunnen met enig voorbehoud worden gedaan.Voorbeeld:Doelstelling: Een anamnesegesprek kunnen voeren met een volwassen patiënt.

20

Page 25: Verantwoord Meten In Het Gezondheidszorgonderwijs

De plaats van meten en beoordelen in het didactisch proces

Toetsvorm: In een rollenspel, waarin een medeleerling de rol van patiënt speelt, de leerling eenanamnesegesprek laten voeren met ’de patiënt’.

3 Conditional fit: de uitvoering van de toetsopdracht levert informatie op over het beheersen van voorde leerdoelen noodzakelijke voorwaarden. Dit is echter een onvoldoende basis om uitspraken te doenover het daadwerkelijk beheersen van de leerdoelen.Voorbeeld:Doelstelling: Een anamnesegesprek kunnen voeren met een volwassen patiënt.Toetsvorm: De leerling schriftelijk of mondeling laten beschrijven waaruit de voorbereiding,

uitvoering en afhandeling van een anamnesegesprek bestaat.4 Misfit: de uitvoering van de toetsopdracht levert informatie op waarmee op geen enkele wijze

uitspraken gedaan kunnen worden over het beheersen van de leerdoelen. De validiteit van de metingis in dit geval dus slecht.Voorbeeld:Doelstelling: Een anamnesegesprek kunnen voeren met een volwassen patiënt.Toetsvorm: De leerling een schriftelijke toets voorleggen over communicatiemodellen.

Het zal duidelijk zijn dat in principe steeds naar een perfect fit dient te worden nagestreefd.Opgemerkt dient ook te worden dat de grens tussen perfect fit en fair fit niet altijd even scherp tetrekken is: het kan zijn dat de rol door de medeleerling dermate goed gespeeld wordt dat er een situatieontstaat die in feite als perfect fit aan te merken is.

2.5.2 Aansluiting bij de beroepspraktijk: de representativiteit

In de vorige paragraaf is betoogd dat de keuze van de toetsvorm bepaald wordt door de leerdoelen diemen wil meten. Een schriftelijke toets met open vragen kan een perfect fit betekenen als men alsdoelstelling heeft de cognitieve vaardigheden te meten met betrekking tot bepaalde leerinhouden.Dezelfde toets zal een misfit zijn als men als doelstelling heeft de leerling zijn psychomotorische en/ofreactieve of interactieve vaardigheden te laten tonen met betrekking tot die leerinhouden.Dit betekent dat er over de geschiktheid van een toetsvorm alleen maar een uitspraak kan worden gedaanin relatie tot de leerdoelen die de toets moet meten.

Zolang de leerdoelen één bepaalde vaardigheid bevatten, bijvoorbeeld de cognitieve vaardigheid, kan ereen duidelijke uitspraak gedaan worden over de best passende toetsvorm. Dat wordt aanzienlijkingewikkelder naarmate leerdoelen meer vaardigheden omvatten. Dat brengt ons op de tweedeinvalshoek: de mate van representativiteit van de toets voor de praktijksituatie.De representativiteit van een toets wordt bepaald door de volgende twee eigenschappen: omvattendheiden natuurgetrouwheid.Deomvattendheidvan een toets wordt groter naarmate meer verschillende taaksituaties (die wel allemaaleen beroep doen op dezelfde vaardigheden) worden aangeboden. Het wordt daardoor meer verantwoordom uitspraken te doen over taaksituaties die niet in de toets zijn opgenomen.Met natuurgetrouwheidwordt bedoeld de mate waarin de taaksituatie een afspiegeling is van detaakuitvoering in een reële werksituatie.Hoe groter de representativiteit van de toets, des te groter de rechtvaardiging om op basis van detoetsprestatie uitspraken te doen over de competentie van leerlingen.

Om duidelijk te maken hoe de ’fit’ (of mate van validiteit) en de representativiteit zich tot elkaarverhouden, worden in afbeelding 10 beide begrippen geïllustreerd. De verticale pijlen geven de relatietussen leerdoelen en toetsvorm (de ’fit’). De horizontale pijl geeft de mate van representativiteit aan. Inde loop van een bepaalde leereenheid (bijv. een module) of van de gehele opleiding verschuiven de

21

Page 26: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 2

leerdoelen van ’theorie’ naar ’praktijk’ of – anders gezegd – van ’overwegend cognitief’ (aan delinkerkant) naar ’een mix van vaardigheden’ (aan de rechterkant).De werkelijke beroepspraktijk wordt in de loop van de opleiding dus steeds meer benaderd. De takenworden derhalve ook complexer.De toetsen die op deze leerdoelen betrekking hebben, verschuiven op overeenkomstige wijze: de verticalepijlen moeten voor een ’perfect fit’ loodrecht naar beneden lopen.

afb. 10 - Evaluatie van het onderwijs

In het begin van de leereenheid of opleiding hebben de toetsen voornamelijk betrekking op de theorie/decognitieve vaardigheden. Deze toetsen zijn meestal weinig representatief voor de praktijksituatie enmeten meestal voorwaardelijke kennis en inzicht.Aan het eind van de leereenheid of opleiding heeft de toetsing betrekking op alle relevante vaardighedendie de leerling volgens de leerdoelen in de praktijksituatie moet beheersen. De toetsing vindt dan zonatuurgetrouw en volledig mogelijk plaats.Anders gezegd: de toetsing loopt gedurende de opleidingsfase van ’laag representatief’ via ’gemiddeldrepresentatief’ naar ’hoog representatief’.Zolang het meetinstrument meet wat het moet meten (de leerinhoud en de vaardigheid die in het leerdoelbeschreven staan), is de toets valide en is er sprake van een perfect fit.

Representativiteit als indelingsprincipe voor de toetsvormen in dit handboekOp basis van het uitgangspunt van representativiteit (de relatie tussen de toetsvorm en de beroepsprak-tijk) is een indeling van toetsvormen tot stand gekomen zoals weergegeven in tabel 4 (zie ookStraetmans, 1994).

22

Page 27: Verantwoord Meten In Het Gezondheidszorgonderwijs

De plaats van meten en beoordelen in het didactisch proces

representativiteit

tabel 4 - Indeling toetsvormen naar representativiteit

omschrijving voorbeelden

laag niet natuurgetrouw, meestal éénvaardigheid

• toetsen met gesloten vragen• toetsen met open vragen• casustoetsen• potlood-en-papier-toetsen

gemiddeld matig natuurgetrouw, vaak meerdan één vaardigheid

• computersimulatie, beeldplaat• simulator• skill sample test

hoog hoog tot zeer hoog natuurge-trouw, integratie van vaardighe-den

• patiëntsimulatie• work sample test / praktijktoetsing op de werkplek

In het handboek worden de toetsvormen gepresenteerd van laag representatief naar hoog representatief.In principe moet gekozen worden voor een toetsvorm die wat representativiteit betreft perfect aansluitbij de betreffende leerdoelen c.q. het voorafgaande onderwijs. Om verschillende redenen, die in devolgende hoofdstukken aan de orde komen, moeten soms concessies worden gedaan ten aanzien van dituitgangspunt. Dat betekent over het algemeen dat genoegen moet worden genomen met een toetsvormdie iets minder representatief is dan het leerdoel. Door nu de toetsvormen te rangschikken naarrepresentativiteit kan een optimaal compromis gevonden worden tussen wat enerzijds wenselijk enanderzijds haalbaar is.

23

Page 28: Verantwoord Meten In Het Gezondheidszorgonderwijs

3 Kwaliteitseisen voor de toets als meetinstrument

De beslissingen die genomen worden op grond van de meting van leerresultaten hebben vaakvérstrekkende consequenties voor de leerlingen. Zij hebben dan ook recht op kwalitatief goedemeetinstrumenten en beoordelingsprocedures. Ook moeten zij zich op een adequate manier kunnenvoorbereiden op de meting. Dit impliceert dat zij een duidelijk beeld moeten hebben van wat er van henverwacht wordt.Daarbij is het ook van belang zich te realiseren dat het studiegedrag van leerlingen in het algemeen sterkgestuurd wordt door toetsing (examens, toetsen en beoordelingsprocedures): wat niet getoetst wordt,wordt nauwelijks geleerd. Dit heeft rechtstreeks consequenties voor het onderwijs.Dat daarmee een zware verantwoordelijkheid ligt bij ’de toetsing’ (het meetinstrument, de proceduresen de constructeurs hiervan) moge duidelijk zijn. Het is dus een absolute noodzaak dat het meetinstru-ment en de beoordelingsprocedures zélf voortdurend onderwerp van kwaliteitszorg zijn. Vragen als: ’Hoevalide en hoe betrouwbaar zijn de gegevens van de toets of de beoordelingsprocedure?’, ’Weet deleerling van tevoren wat er van hem verwacht wordt?’ en ’Hoe aanvaardbaar zijn de beslissingen voorde leerlingen, de opleiding, de overheid, de maatschappij?’ zijn terecht gestelde vragen in het kader vaneen verantwoorde meting. Als externe instanties, zoals ministerie of zorginstellingen, zich een oordeelwillen vormen over de kwaliteit van de opleiding, zal de wijze waarop deze opleiding gestalte geeft aanhet toetsingsbeleid en de kwaliteitseisen die daaraan gesteld worden een belangrijk element in debeoordeling van de kwaliteit van de opleiding zijn.

In dit hoofdstuk wordt ingegaan op de belangrijkste kwaliteitseisen die aan een examen, toets ofbeoordelingsprocedure gesteld worden.In paragraaf 3.1 wordt eerst ingegaan op de objectiviteit van metingen.Vervolgens komt in paragraaf 3.2 het begrip betrouwbaarheid aan de orde. Daarbij wordt tevens ingegaanop het schatten van de (standaard)meetfout.Daarna wordt in paragraaf 3.3 het begrip validiteit besproken.In paragraaf 3.4 wordt aandacht besteed aan de kwaliteitseisen: efficiëntie, transparantie, aanvaardbaar-heid en specificiteit.Vervolgens wordt in paragraaf 3.5 ingegaan op het spanningsveld tussen betrouwbaarheid, validiteit enefficiëntie.Ten slotte wordt in paragraaf 3.6 een aantal aandachtspunten gepresenteerd ter verhoging van de kwaliteitvan een meetinstrument of beoordelingsprocedure.

3.1 Objectiviteit

Objectiviteit betekent beoordelaarsonafhankelijkheid. Een meting is objectief als de prestaties van deleerlingen – ongeacht de beoordelaar of de beoordelingssituatie – steeds hetzelfde beoordeeld ofgewaardeerd worden.Maar zolang er mensen betrokken zijn bij het beoordelen, is er altijd sprake van een zekere mate vansubjectiviteit. Om die reden wordt objectiviteit ook wel opgevat als intersubjectiviteit oftewel de matewaarin twee of meer (per definitie subjectieve) beoordelingen met elkaar overeenstemmen.

24

Page 29: Verantwoord Meten In Het Gezondheidszorgonderwijs

Kwaliteitseisen m.b.t. de toets als meetinstrument

Door objectiviteit van een beoordeling te omschrijven als intersubjectiviteit ontstaat er een mogelijkheidom de mate van objectiviteit te bepalen. Door twee of meer beoordelaars onafhankelijk van elkaar eenbeoordeling te laten uitvoeren en te bepalen hoe de resultaten daarvan onderling correleren, is deobjectiviteit vast te stellen. Men spreekt in dit geval ook wel van interbeoordelaarsbetrouwbaarheid.Men kan op dezelfde wijze ook de objectiviteit verhogen: door de toetsprestaties van leerlingen doorminimaal twee beoordelaars te laten beoordelen en de beoordelaars vervolgens de uitkomsten hiervanmet elkaar te laten vergelijken en bespreken, kan een zekere mate van overeenstemming tussen debeoordelaars worden bereikt. De invloed van een mogelijk subjectief oordeel van een individuelebeoordelaar wordt op deze wijze ’geneutraliseerd’.Deze manier is met name geschikt voor het verantwoord beoordelen van prestaties van leerlingen opopen vragen (lang antwoord) of bij het beoordelen van praktische vaardigheden, omdat hierbij in hetalgemeen minder gemakkelijk sluitende antwoordmodellen te maken zijn en de kans op interpretatiever-schillen tussen de beoordelaars dus groter is.

In zijn algemeenheid is er over objectiviteit een aantal uitspraken te doen:– Objectiviteit is geen ’hard gegeven’, maar een intentie om subjectieve elementen in de beoordeling

zoveel mogelijk uit te schakelen en daarmee de ’eerlijkheid’ in de beoordeling van de prestaties vanleerlingen te bevorderen.

– De objectiviteit van een beoordeling neemt toe indien de beoordelaar gebruikmaakt van voorafopgestelde antwoordmodellen, beoordelingsprocedures of -protocollen en deze bij elke leerling opeenzelfde wijze hanteert. Men noemt dit ook wel ’standaardisatie’ van de beoordelingsprocedure.

– Alleen als de verwerking van de prestaties van leerlingen op een toets via een volledig gestandaardi-seerde procedure (bijv. door de computer) wordt verricht, is er sprake van een volledige objectiviteit.Er komt immers geen beoordelaar meer aan te pas: de toetsprestaties van de leerlingen worden allevolgens dezelfde maatstaven beoordeeld op basis van vooraf vastgestelde criteria (sleutels,antwoordmodellen, procedures).

– Naarmate de beoordelingssituatie complexer is, is het moeilijker eenduidige beoordelingsmodellente ontwikkelen en is de kans op subjectiviteit dus groter. Het verdient daarom aanbeveling – zekerbij het toetsen van praktische vaardigheden – om ervoor te zorgen dat de te beoordelen praktijksitua-tie overzichtelijk en hanteerbaar is (zijn) voor de beoordelaar. Een praktijkopdracht die qua omvangbeperkt is en waarin de te beoordelen vaardigheden helder zijn voor alle betrokkenen, biedt eengrotere kans op objectiviteit dan een veel ruimere opdracht.

– Naarmate de te beoordelen vaardigheden meer concreet en direct waarneembaar zijn, is de kans opeen objectieve uitspraak van de beoordelaar groter.Beoordelaars zullen eerder tot eenzelfde oordeel over de prestatie van een leerling komen als het gaatom instrumenteel-technische vaardigheden (bijv. het kunnen verwisselen van een infuus) dan bij hetbeoordelen van sociale of communicatieve vaardigheden.

– Wanneer in een kort tijdsbestek meerdere leerlingen moeten worden beoordeeld op eenzelfdevaardigheid of in een gelijksoortige beoordelingssituatie, kan de objectiviteit geschaad wordendoordat de beoordelaar de prestaties van de leerlingen onbewust met elkaar vergelijkt (volgorde- ofsequentie-effect). In dat geval voegt de beoordelaar in feite – naast de aanwezige protocollen ofantwoordmodellen – nog een ’eigen’ beoordelingscriterium toe. In paragraaf 8.2 worden suggestiesgegeven om dergelijke beoordelaarseffecten te minimaliseren.

– De objectiviteit van een meetinstrument of van een beoordelingsprocedure speelt een nietonbelangrijke rol bij de betrouwbaarheid van het meetinstrument. Hierover gaat de volgendeparagraaf.

25

Page 30: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 3

3.2 Betrouwbaarheid

Het doel van meten en beoordelen van leerresultaten van leerlingen is zo zuiver mogelijk vast te stellenof de leerling de beoogde leerdoelen beheerst. De toetsprestaties van de leerling (goed of slecht) moetendaarbij ook werkelijk aan deze leerling toegeschreven kunnen worden en niet aan diverse omliggendefactoren. Voorbeelden van factoren die de toetsprestaties (onbewust en onbedoeld) beïnvloeden, zijn depatiëntensituatie, de te krappe tijd voor de toetsopdracht, het gokken van antwoorden of het niet-gestandaardiseerd zijn van een toetssituatie.Ook een subjectieve beoordeling van de toetsprestaties door de beoordelaar is een factor die debetrouwbaarheid van de meting schaadt. Immers: de ene beoordelaar zal dan tot een andere uitspraakkomen over de leerresultaten van de leerling dan zijn collega.

Bij betrouwbaarheid gaat het om vragen als: ’Zijn de uitkomsten van de meting gelijk als deze wordtverricht door verschillende personen?’ of ’Als we deze toets overmorgen weer afnemen, zijn detoetsresultaten dan hetzelfde?’ of ’Zijn de toetsprestaties van de leerling gelijk ongeacht depatiëntensituatie?’.

De betrouwbaarheid van een meetinstrument geeft aan de mate waarin het meetinstrument consistent isbij het meten: de mate waarin de meetresultaten nauwkeurig en reproduceerbaar (d.w.z. vrij vanmeetfouten) zijn.Het zal duidelijk zijn dat de meting zuiverder en de toetsuitslag dus betrouwbaarder is naarmate deinvloed van bovengenoemde factoren op de toetsing geringer is.

3.2.1 Schatting van de betrouwbaarheidscoëfficiënt

De betrouwbaarheid van een toets wordt meestal uitgedrukt in een correlatiecoëfficiënt. Dat is een maatvoor de relatie tussen twee reeksen getallen (bijv. tussen de scores op toets A op tijdstip X en de scoresop dezelfde toets op tijdstip Y). De betrouwbaarheid van toets A, uitgedrukt in een correlatie-coëfficiënt,kan variëren van 0 tot 1. Een correlatie van 0 wil zeggen dat er geen enkel verband is tussen de scoresop de tijdstippen X en Y. Dat kan alleen voorkomen als de scores op basis van toeval aan de leerlingenzijn toegekend. Zo’n toets is uiteraard niet informatief met betrekking tot de hoeveelheid kennis dieleerlingen bezitten. Als de correlatie 1 bedraagt, zijn de scores op tijdstip Y perfect te voorspellen vanuitde scores op tijdstip X. (Hierbij is het niet noodzakelijk dat de scores op tijdstip X en Y identiek zijn.Wél moet de rangorde van leerlingen op basis van hun toetsscores identiek zijn.) Toets A meet dan meteen maximale nauwkeurigheid. Beide extreme waarden zijn, zoals gezegd, echter alleen in theoriebereikbaar!

Voor het uitdrukken van de betrouwbaarheid van een toets in de vorm van een correlatiecoëfficiënt, ishet een vereiste dat men beschikt over twee reeksen toetsscores die bij dezelfde leerlingen verzameldzijn. Deze twee reeksen kunnen op verschillende manieren tot stand gekomen zijn:– door herhaalde afname van de toets;– door de afname van een paralleltoets (d.i. een gelijkwaardige versie van de originele toets);– door de toets te verdelen in twee helften (bijv. een deel van een toets bestaande uit opgaven met

even volgnummers en een deel bestaande uit opgaven met oneven volgnummers), de zogenaamde.splitsingsmethode.

Deze methoden zijn te herkennen in afbeelding 11 (Drenth en Sijtsma, 1990). In dit overzicht is ook eenvierde methode opgenomen, die gebaseerd is op de covarianties tussen alle individuele items: de interne-consistentie-methode.

26

Page 31: Verantwoord Meten In Het Gezondheidszorgonderwijs

Kwaliteitseisen m.b.t. de toets als meetinstrument

afb. 11 - Methoden voor betrouwbaarheidsschatting

Test-hertest-methodeDe leerlingen krijgen twee keer dezelfde toets voorgelegd met een bepaald interval tussen beidetoetsafnamen. Vervolgens wordt de correlatie berekend tussen de resultaten van de eerste en de tweedeafname.Aan deze methode kleven echter bezwaren. De leerlingen herinneren zich wellicht nog antwoorden dieze bij de vorige afname gegeven hebben of profiteren misschien op een andere manier van de eerdereervaring. Daarbij is het niet duidelijk of alle leerlingen in gelijke mate van deze ’oefensituatie’ profiteren.Een praktisch bezwaar van deze methode is bovendien dat het meestal aan tijd zal ontbreken omleerlingen twee keer dezelfde toets te laten maken. Deze methode wordt om die reden niet naderuitgewerkt.

Parallelvorm-methodeBij eenzelfde groep leerlingen worden op dezelfde dag of met een bepaald tijdsinterval tussen beideafnamen, twee paralleltoetsen afgenomen. Vervolgens wordt de correlatie berekend tussen detoetsresultaten op de eerste toets en die op de paralleltoets.Deze methode komt aan enkele methodologische bezwaren van de test-hertest-methode tegemoet. Tochwordt er in dit handboek geen uitwerking aan gegeven omdat ook deze methode een groot beroep doetop extra tijdsinvestering van zowel docent als leerlingen.

SplitsingsmethodeDeze methode is bruikbaar in de onderwijspraktijk omdat leerlingen geen extra toets hoeven te makenen docenten geen extra tijd hoeven te investeren in de constructie van een paralleltoets. De tweescorereeksen die nodig zijn om een schatting te maken van de betrouwbaarheid, worden op kunstmatigewijze ontleend aan één afname. De opgaven waaruit de toets bestaat, worden verdeeld over tweetoetsgedeelten (bijv. de ene toets bevat alle even vraagnummers en de andere toets bevat alle onevenvraagnummers). Vervolgens kan de correlatie tussen beide delen van de toets berekend worden.De totale toets moet in dit geval wel voldoende beoordelingspunten bevatten om nog twee ’bruikbare’toetsgedeelten over te houden.Het belangrijkste probleem van deze methode schuilt echter in de wijze waarop de toetsopgaven verdeeldworden over de twee delen; de bedoeling is dat de twee delen beschouwd kunnen worden alsparalleltoetsen. Elke wijze van opdeling leidt echter tot een (iets) andere betrouwbaarheidsschatting. Voordit probleem bestaat een oplossing, die tegenwoordig bekendstaat als de interne-consistentie-methode.

27

Page 32: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 3

Interne-consistentie-methodeDeze methode verdeelt de toets niet echt in twee delen, maar levert een schatting op van de gemiddeldebetrouwbaarheid van alle mogelijke manieren om de toets te verdelen in helften.De betrouwbaarheid die op deze manier geschat wordt zegt iets over de interne consistentie van de toets.Interne consistentie verwijst naar het antwoordpatroon van de leerlingen.In tabel 5 is een volledig consistent antwoordpatroon te zien (een ideaal-situatie!).

tabel 5 - Intern consistent antwoordpatroon

opgavenleerlingen moeilijkheidsgraad

opgaven1 2 3 4 5 6

1 1 1 1 1 1 0 .84

2 1 1 1 1 0 0 .66

3 1 1 1 1 0 0 .66

4 1 1 1 0 0 0 .50

5 1 1 0 0 0 0 .33

toetsscore 5 5 4 3 1 0

De moeilijkheidsgraad van de opgaven is hier aangeduid met de p-waarde, d.i. het percentage leerlingendat deze opgave goed heeft gemaakt: hoe lager de p-waarde, hoe moeilijker de vraag voor deze groepleerlingen was.Het antwoordpatroon in dit schema geeft geen aanleiding om twijfels te uiten over de kwaliteit van detoets. Dat zou anders zijn als bijvoorbeeld leerling 2 (een goede leerling) op opgave 2 (een relatiefgemakkelijke vraag) een fout antwoord had gegeven of als leerling 5 (een leerling met een lagetoetsscore) een correct antwoord op opgave 4 (een relatief moeilijke vraag) had gegeven.Als dit soort onlogische antwoordpatronen veel voorkomt, zal de betrouwbaarheid van de toets laag zijn.

Het bepalen van de interne consistentie vergt vele berekeningen en is bij grote aantallen leerlingen alleenhaalbaar als men de beschikking heeft over een computerprogramma. Indien de scoring geautomatiseerdis, wordt vaak ook de interne consistentie standaard berekend. De output vermeldt dan ofwel de KR-20of coëfficiënt alpha. Coëfficiënt alpha (α) is wiskundig equivalent aan de KR-20 en wordt gebruiktingeval de antwoorden niet dichotoom gescoord kunnen worden met 0 (fout) en 1 (goed).De formule voor het berekenen van alpha luidt als volgt:

Hier is n het aantal items in de toets, si2 de variantie van een item en st

2 de variantie van de totale toets.Omdat bij een dichotoom gescoorde vraag de variantie van een item (si

2) gelijk is aan pi(1−pi), kangebruik worden gemaakt van een eenvoudiger formule, de KR-20:

28

Page 33: Verantwoord Meten In Het Gezondheidszorgonderwijs

Kwaliteitseisen m.b.t. de toets als meetinstrument

In deze formule is pi het percentage leerlingen dat item i juist heeft beantwoord. (1−pi is dan dus hetpercentage leerlingen dat datzelfde item fout heeft beantwoord). Deze formule gaat ervan uit dat alleitems een gelijke standaarddeviatie bezitten.

Als er sprake is van een toets waarvan alle items ongeveer een gelijke moeilijkheidsgraad hebben, kaneen schatting verkregen worden van de hoogte van KR-20 met behulp van een formule die bekendstaatals KR-21:

Hierbij is Mp de gemiddelde p-waarde voor alle items.

KR-21 geeft een onderschatting van KR-20. Die onderschatting wordt ernstiger naarmate de opgavenin de toets meer variëren in moeilijkheidsgraad.

Betrouwbaarheid van beslissingenTot nu toe is steeds uitgegaan van de toets- of itemscores als basis voor het schatten van detoetsbetrouwbaarheid. Het is ook mogelijk de betrouwbaarheid te schatten met als uitgangspunt debeslissingen die naar aanleiding van de toetsscores genomen worden. Het gaat dan om beslissingen alszakken vs. slagen, onvoldoende vs. voldoende of niet-beheerser vs. beheerser.Voor dit type betrouwbaarheid moet een toets twee keer aan dezelfde leerlingen worden afgenomen (ofer moeten twee parallelversies worden afgenomen). De proportie consistente beslissingen is een maatvoor de beslissingsbetrouwbaarheid van de toets.

tabel 6 - Beslissingsconsistentie bij herhaalde toetsafname

tweede afname

voldoendeonvoldoen-

de

eersteafname

voldoende(a)

consistentebeslissing

(b)inconsisten-te beslissing

a + b

onvoldoen-de

(c)inconsisten-te beslissing

(d)consistentebeslissing

c + d

a + c b + d N=a+b+c+d

De beslissingsbe-trouwbaarheid wordt berekend door:

29

Page 34: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 3

De interpretatie van deze proportie is eenvoudig. Een proportie van 0.80 betekent dat over 80% van deleerlingen bij de tweede afname dezelfde beslissing is genomen als bij de eerste afname. En dus dat erbij 20% van de leerlingen een inconsistente beslissing is genomen.

3.2.2 Meetfouten

Als een persoon wordt opgemeten om te bepalen wat zijn lengte is, zal de nauwkeurigheid van diemeting niet perfect zijn. Dit komt tot uiting als niet één keer maar meer keren wordt gemeten: de eerstekeer levert bijvoorbeeld 183,5 cm op, de tweede keer 183,3 cm, etcetera. De ware score kan echter nietbepaald worden: het is een theoretische waarde.De Groot (1975) definieert de ware score als de gemiddelde score die een leerling zou halen wanneerdeze de toets onder alle mogelijke omstandigheden zou maken, aangenomen dat geen leereffecten ofvermoeidheidsverschijnselen zouden optreden.

Elke toetsscore is opgebouwd uit een ’ware score’ en een ’meetfout’. De ware score is datgene waar hetom gaat (de mate waarin de leerdoelen werkelijk beheerst worden); de meetfout is de onzuiverheidwaarmee gemeten wordt.De meetfout kan de toetsscore ten onrechte hoger of lager doen zijn. Naarmate de verhouding tussen demeetfout en de ware score ongunstiger wordt, neemt de kans op het nemen van verkeerde beslissingenover leerlingen toe.

De meetfout kan veroorzaakt worden door– het meetinstrument zélf en/of– de eigenschappen van de leerling en/of– de omstandigheden tijdens de toetsafname en/of– (interpretatie)verschillen bij de correctoren.

Het meetinstrument zélfveroorzaakt onnauwkeurigheid in de metingen als het extreem gemakkelijke ofmoeilijke opgaven of opdrachten bevat: opgaven die niemand kan beantwoorden of die iedereen kanbeantwoorden; opdrachten die niemand kan uitvoeren of iedereen kan uitvoeren. Het is dan niet meerduidelijk wat er gemeten wordt. Met andere woorden, er wordt onvoldoende gediscrimineerd(onderscheid gemaakt) tussen ’goede’ en ’zwakke’ leerlingen. Normaliter is immers te verwachten datrelatief moeilijke vragen of opdrachten met name door de ’goede’ leerlingen goed beantwoord ofuitgevoerd worden. Als dat stelselmatig niet het geval is, is er reden te twijfelen aan het meetinstrumentzélf.Een tekort aan toetsopgaven of observatiepunten is een andere bron van onnauwkeurigheid: de invloedvan elke toetsvraag of elk observatiepunt op de uitslag van de totale meting is dan relatief erg hoog.Door meer meetpunten in een toets of opdracht op te nemen, neemt de kans op meetfouten af (en dusde meetnauwkeurigheid toe) of – anders gezegd – door meer meetpunten op te nemen wordt de invloedvan de meetfout op de totale toetsbeoordeling kleiner.Dit pleit dus voor een langere toets en/of voor meer (relevante) beoordelingscriteria in een observatielijst.Daarbij moet uiteraard rekening gehouden worden met de hanteerbaarheid van de toets (een te langetoets of een te lange lijst van beoordelingscriteria is niet meer hanteerbaar).

Ook de eigenschappen van de leerlingkunnen onnauwkeurigheid in de meting veroorzaken. Het gaathier dan om eigenschappen die in feite niets met de beheersing van de leerdoelen te maken hebben maarniettemin van invloed kunnen zijn op de toetsprestatie: een leerling die last heeft van examenvrees zalwaarschijnlijk onder zijn niveau presteren. Ook minder stabiele eigenschappen zoals gemoedstoestandof gezondheid kunnen de toetsprestatie negatief beïnvloeden.

30

Page 35: Verantwoord Meten In Het Gezondheidszorgonderwijs

Kwaliteitseisen m.b.t. de toets als meetinstrument

Onnauwkeurigheid in de metingen kan ook veroorzaakt worden doorde omstandigheden tijdens detoetsing. Lawaai in de naaste omgeving, slechte toetsinstructies, slechte verlichting of ventilatie zijnvoorbeelden van storende beïnvloeding van de meetnauwkeurigheid. Zij dragen bij aan de meetfout endaarmee aan de onbetrouwbaarheid van de beslissingen die genomen worden op grond van detoetsprestaties. Ook als leerlingen in de gelegenheid zijn om bijvoorbeeld ’af te kijken’ of ’te spieken’zal de toetsscore geen goede indicatie zijn voor de mate van beheersing van de leerdoelen.

Zoals ook al aangegeven is in paragraaf 3.1 (objectiviteit) kan onnauwkeurigheid van de meting ten slotteook veroorzaakt worden door(interpretatie)verschillen van correctorenof beoordelaars. Als tweecorrectoren of beoordelaars tot een duidelijk afwijkend oordeel komen over eenzelfde prestatie van eenleerling, is de meting niet consistent: afhankelijk van degene die beoordeelt kan de uitspraak over destudieresultaten verschillen.Ook indien eenzelfde beoordelaar een toets of een praktijkopdracht diverse keren achter elkaar moetbeoordelen (van verschillende leerlingen) is de beoordeling ervan vaak inconsistent (sequentie-effect).De toetsprestaties van een leerling op een toets of bij een opdracht kan dus zowel positief als negatiefbeïnvloed worden door de corrector of beoordelaar.Bij meerkeuzevragen speelt dit probleem niet omdat het antwoord van tevoren vastligt en er (ingeval vanmechanische verwerking) geen interpretatie aan te pas komt.Bij open vragen (lang-antwoord), praktijkopdrachten of dergelijke speelt dit subjectiviteitsprobleem echterwel degelijk.In het voorgaande blijkt dat de betrouwbaarheid van een meting door velerlei factoren (meetfouten)beïnvloed kan worden en niet met zekerheid aan te geven is. De betrouwbaarheid kan echter wel geschatworden. Voor deze schatting bestaan verschillende methoden (zie par. 3.2). Het uiteindelijk resultaat iseen getal als maat voor de betrouwbaarheid van de meting.

Hoe hoog de betrouwbaarheid voor een specifiek meetinstrument moet zijn is moeilijk aan te geven. Debetrouwbaarheid wordt immers door een aantal factoren beïnvloed, zoals bijvoorbeeld toetslengte: hoelanger de toets, des te minder kans op toevalstreffers en des te hoger de betrouwbaarheid. Maar aan delengte van de toets moeten soms aanzienlijke concessies gedaan worden in verband met de hanteerbaar-heid. Het zou dan onredelijk zijn om een vaste hoogte voor de betrouwbaarheid te hanteren.Ook de consequenties voor de leerlingen kunnen een rol spelen bij de vraag wat een aanvaardbarebetrouwbaarheid is. Als die consequenties gering zijn, mag genoegen worden genomen met een lagerebetrouwbaarheid dan wanneer die consequenties ’zwaar’ zijn.Afhankelijk van het doel van het meetinstrument moet men dus een afweging maken welke hoogte vande betrouwbaarheid wel of niet meer acceptabel is. Hier ligt dus een taak voor bijvoorbeeld eentoetsingscommissie van de opleiding.

3.2.3 De standaardmeetfout

In principe kan bij elke meting de betrouwbaarheid geschat worden. Dit betekent dat ook de meetfoutgeschat kan worden.De schatting van de meetfout wordt de standaardmeetfout genoemd. Deze wordt evenals debetrouwbaarheid uitgedrukt in een getal en wordt berekend met behulp van de toetsbetrouwbaarheid.De standaardmeetfout geeft een schatting van de te verwachten grootte van de afwijkingen van detoetsscores van de ene op de andere meting. Of, anders gezegd: de standaardmeetfout geeft de meetfoutaan die ’in doorsnee’ bij meting met een bepaalde toets verwacht mag worden.Met de standaardmeetfout kan een interval berekend worden rondom elke individuele toetsscorewaarbinnen met een bepaalde zekerheid de ware score van de betreffende leerling zal liggen. Hoe kleinerde standaardmeetfout, des te dichter ligt de toetsscore in de buurt van de ’ware’ score.

31

Page 36: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 3

Verondersteld mag worden dat de toetsscores bij herhaalde meting normaal verdeeld zullen zijn rondomde gemiddelde score. Het beeld ziet er dan uit zoals weergegeven in afbeelding 12.

afb. 12 - Normaalverdeling van toetsscores bij herhaalde meting

Er is sprake van een normale verdeling wanneer de grafiek symmetrisch klokvormig is. De spreiding(standaarddeviatie) van die herhaalde metingen bij dezelfde persoon is dan de standaardmeetfout. Met70% zekerheid ligt de ware score van de leerling tussen zijn toetsscore min één standaarddeviatie (−1SD) en zijn toetsscore plus één standaarddeviatie (+1 SD).

In de praktijk is het uiteraard niet mogelijk om een toets zo vaak bij een en dezelfde leerling af te nemendat de standaarddeviatie voor die leerling berekend kan worden.Wanneer de toets bij een groep leerlingen is afgenomen, kan de standaardmeetfout (SE) echter geschatworden met behulp van de betrouwbaarheid (rXX’ ) en de standaarddeviatie van de toets (St):

Voor het berekenen van de betrouwbaarheid kan gebruik worden gemaakt van de hiervoor beschrevenformules (α of KR-20). De formule voor de standaarddeviatie luidt:

Hierbij is n het aantal items in de toets, xi de score op item i en X de gemiddelde score.

In de volgende afbeeldingen wordt het verband tussen toetsscore (het cijfer), ware score (de vaardigheid)en standaardmeetfout nader uitgewerkt voor drie leerlingen (A, B en C).Bij de standaardmeetfout is altijd sprake van een bandbreedte rondom een bepaalde waarde.Uitgaande van een bepaalde toetsscore (bijv. 6,5) en een standaardmeetfout (bijv. 2,5: een vrijonnauwkeurige meting) kun je met 70% zekerheid zeggen dat de ware score zal liggen tussen 6,5 − 2,5en 6,5 + 2,5. De vaardigheid van de leerling ligt op de bepaalde cijferschaal dus tussen 4 en 9. Ditbetekent derhalve dat drie leerlingen, die allemaal een 6,5 halen, toch aanzienlijk kunnen verschillen invaardigheid. Deze situatie is weergegeven in afbeelding 13.

32

Page 37: Verantwoord Meten In Het Gezondheidszorgonderwijs

Kwaliteitseisen m.b.t. de toets als meetinstrument

afb. 13 - Hetzelfde cijfer, verschillende vaardigheid:bandbreedte rondom de toetsscore

De ’klokken’ geven aan dat de kans dat de ware score in de buurt van de toetsscore ligt het grootst is.Het kan echter niet uitgesloten worden dat de ware scores aan de rand van de klok liggen.Dezelfde situatie (dezelfde toets en dezelfde leerlingen) kan ook benaderd worden vanuit de ware scoresvan de leerlingen. Nu is de standaardmeetfout weergegeven als een bandbreedte rondom de werkelijkevaardigheid van elke leerling (afb. 14).

afb. 14 - Hetzelfde cijfer, verschillende vaardigheid:bandbreedte rondom de ware scores

Gegeven de standaardmeetfout van 2,5 op de toets, zal elke leerling met 70% zekerheid een cijfer halendat in ieder geval ligt tussen een bepaald minimum en maximum. Leerling A heeft een vaardigheid van5 en zal dus in 70% van de metingen uitkomen op een toetsscore tussen 2,5 en 7,5. Leerling B (die eenvaardigheid heeft van 6) zal 7 van de 10 keer scoren tussen 3,5 en 8,5 en C (ware score 7) krijgt voorde toets een cijfer tussen 4,5 en 9,5. Afhankelijk van de omstandigheden, die voor de een gunstig envoor de ander ongunstig kunnen zijn, kunnen ze echter alle drie op een 6,5 uitkomen.Wanneer de toets en toetssituatie echter verbeterd worden, zal dat tot gevolg hebben dat de margeswaarbinnen onze drie leerlingen zullen scoren, aanzienlijk smaller zullen worden en elkaar zelfs nietmeer overlappen. De drie leerlingen zullen in deze situatie (afb. 15) dus niet meer hetzelfde cijfer kunnenhalen.

33

Page 38: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 3

afb. 15 - Een betrouwbare toets: kleine standaardmeetfout

De toetsscore zal nooit helemaal samenvallen met de ware score, maar door de standaardmeetfout teverkleinen (oftewel door de betrouwbaarheid te verhogen) kunnen met grotere zekerheid uitsprakenworden gedaan over de competentie van de leerlingen. Zeker wanneer aan de meting grote consequentieszijn verbonden, is het dus zaak om de betrouwbaarheid van de meting nauwlettend in de gaten tehouden.

Vanuit eenbesliskundige benaderingkunnen immers bij het trekken van conclusies twee verschillendefouten gemaakt worden:1 De leerling wordt op grond van de toetsscore beoordeeld als incompetent terwijl hij in feite

competent is (zgn. false negative);2 De leerling wordt op grond van de toetsscore beoordeeld als competent terwijl hij dat in feite niet

is (zgn. false positive).Beide soorten fouten zijn te herkennen in tabel 7.

tabel 7 - Foute conclusies op basis van een toetsafname

competentie

voldoende onvoldoende

toetsafname

voldoende(a)

terecht geslaagd(b)

false negatives

onvoldoende(c)

false positives(d)

terecht gezakt

In het eerste geval wordt de leerling ten onrechte de (vergunning tot) uitoefening van een bepaalde taakof vaardigheid ontzegd. Of hij mag niet doorstromen naar een volgend studieonderdeel.In het tweede geval krijgt de leerling ten onrechte toestemming bepaalde taken uit te voeren of wordthij ten onrechte toegelaten tot een volgend studieonderdeel.Veel opleiders vinden de tweede fout ernstiger dan de eerste en proberen daarom het aantal falsepositives (leerlingen die ten onrechte als competent worden beoordeeld) te beperken door de score diebehaald moet worden om te slagen ’flink op te schroeven’. De keerzijde van deze maatregel is dat hetaantal false negatives (leerlingen die ten onrechte als incompetent worden beoordeeld) drastisch zoukunnen stijgen.

34

Page 39: Verantwoord Meten In Het Gezondheidszorgonderwijs

Kwaliteitseisen m.b.t. de toets als meetinstrument

De enige manier om zowel het aantal false positives als het aantal false negatives te beperken is dooreen systematische en zorgvuldige constructie de validiteit van de toets zo hoog mogelijk te doen zijn endoor een goede meet- en beoordelingsprocedure de betrouwbaarheid optimaal te laten zijn.

De docent moet zich realiseren dat de toetsscore van een leerling geen ’keihard gegeven’ is, maar eenindicatie (een schatting) voor diens beheersingsniveau op een bepaalde meting. ’Harde consequenties’verbinden aan een eenmalige meting zou dan ook een gevaarlijke zaak kunnen zijn en relativeren is dusgeboden.In de praktijk komt het er gewoonlijk op neer dat bij een toets met een zeer lage betrouwbaarheid enhoge standaardmeetfout, de normering aangepast wordt. In dat geval legt men de cesuur (grens voorzakken of slagen) meestal wat lager.

3.3 Validiteit

De validiteit van een meetinstrument is de mate waarin instrument aan zijn doel beantwoordt. Validiteitis echter geen kenmerk van een meetinstrument zelf maar van de beslissing die op grond van demeetgegevens wordt genomen. Een toets kan immers zeer valide zijn voor het ene doel en ’invalide’voor het andere doel. Bij validiteit gaat het dus om de afstemming van het instrument op de leerdoelen.Om een valide beslissing te kunnen nemen, moet er een optimale relatie zijn tussen het meetinstrumenten de vaardigheid die in het leerdoel aangegeven is.Als men bijvoorbeeld wil weten of een leerling een bepaalde handeling kan uitvoeren, moet men hemeen opdracht geven waarin hij kan laten zien hoe hij de handeling uitvoert en geen schriftelijke toetsgeven om de handeling te beschrijven. Dus als gemeten en beoordeeld moet worden of de leerling instaat is op professionele wijze een injectie te geven, moet de opdracht gegeven worden om een injectiete geven. Als er – hetgeen niet ongebruikelijk is – aan de leerling gevraagd zou worden te beschrijvenhoe hij een en ander zou doen, geeft zijn antwoord immers geen enkele garantie geeft dat hij hettoedienen van een injectie als vaardigheid ook werkelijk beheerst. Het enige dat men dan kanconcluderen is of de leerling het in theorie weet. Men meet een cognitieve vaardigheid in plaats van debedoelde psychomotorische vaardigheid.Het zal duidelijk zijn dat het van belang is dat degene die het meetinstrument ontwikkelt dan wel degenedie gebruikmaakt van een bepaald meetinstrument zich vooraf goed rekenschap geeft welke leerdoelenhij nu eigenlijk precies wil toetsen. Hij moet daarbij tevens vaststellen of het in het instrument gevraagdegedrag in overeenstemming is met deze leerdoelen.

In de wat oudere psychometrische literatuur worden vele soorten validiteit onderscheiden, maar de laatstejaren pleiten steeds meer auteurs ervoor om de term validiteit te reserveren voor wat tot voor kort werdaangeduid met begripsvaliditeit: de mate waarin beoordelingen te verklaren zijn via eigenschappen vande beoordeelden. Het is niet langer voldoende om aan te tonen dat bijvoorbeeld de kleur van de ogeneen goede voorspeller is voor rijvaardigheid (’predictieve validiteit’); er zal een betekenisvolle verklaringvoor de gevonden correlatie moeten worden gegeven, al was het alleen maar omwille van demaatschappelijke aanvaardbaarheid. Niemand zal het immers accepteren dat hij geen rijbewijs krijgtomdat zijn ogen niet de juiste kleur hebben. Ook wetenschappelijk gezien is het onbevredigend omgenoegen te nemen met alleen het statistisch verband: men wil kunnen uitleggen waarom het gevondenverband bestaat.Niet zelden is echter sprake van de omgekeerde situatie: een test lijkt zo overduidelijk samen te hangenmet datgene waarover men een uitspraak wil doen, dat het empirisch aantonen van de validiteitoverbodig wordt geacht.

35

Page 40: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 3

Beide vormen van onderzoek, verklarend en empirisch, vergen nogal wat tijd en middelen waarover eenopleiding zelf niet beschikt. Wanneer men besluit een professioneel beoordelingsinstrument aan teschaffen, mag daarvan wél veracht worden dat er enig valideringsonderzoek heeft plaatsgevonden.In de volgende paragraaf wordt beschreven welke maatregelen kunnen worden getroffen om de validiteitvan een beoordelingsinstrument te bevorderen. Dit kan door aan bepaalde aspecten van de validiteits-vraag aandacht te schenken.

3.3.1 Validiteitsaspecten

Hoewel validiteit gezien moet worden als één overkoepelend begrip, zijn daaraan toch bepaalde aspectente onderscheiden. Door bij de constructie van meetinstrumenten rekening te houden met deze aspectenkan de validiteit weliswaar niet bewezen, maar wel aannemelijk gemaakt worden.Deze aspecten hangen samen met het gegeven dat men op basis van de meetgegevens een uitspraak wildoen over iets buiten de beoordelingssituatie. In het onderwijs gaat het dan met name om hetinhoudsaspect (de mate waarin het leerstofgebied gedekt wordt) en het externe aspect (de mate waarinop basis van de toetsprestaties uitspraken kunnen worden gedaan over zaken buiten de toetssituatie)(Messick, 1995). Beide aspecten worden hieronder nader toegelicht. Voor de herkenbaarheid wordtverder gesproken over respectievelijk de inhoudsvaliditeit en de criteriumvaliditeit.

InhoudsvaliditeitDoorgaans is het niet haalbaar om alle leerdoelen te toetsen. De toets die de docent nodig heeft om eenuitspraak te kunnen doen over de mate waarin de leerling de leerdoelen beheerst, moet dus eensteekproef zijn uit deze leerdoelen. Daarbij is het van belang dat de steekproef representatief is, dat wilzeggen dat de toets een goede afspiegeling is van het totale domein van de leerdoelen. Het mag nietvoorkomen dat slechts enkele leerdoelen in de toets aan bod komen. Er wordt immers na de toetsafnameop grond van de meetresultaten vastgesteld of de leerling ’de’ leerdoelen behaald heeft.Bij de inhoudsvaliditeit gaat het dus om de mate waarin een toets een relevante en representatievesteekproef vormt uit de leerdoelen waarover een uitspraak gedaan moet worden.

Om tot een optimale steekproef te kunnen komen, wordt bij de constructie van een beoordelingsinstru-ment wordt uitgegaan van een overzicht van gespecificeerde leerdoelen. In zo’n overzicht staat concreetaangegeven welke leerinhouden en vaardigheden getoetst moeten worden. Vervolgens wordt in datoverzicht aangegeven met welke en hoeveel toetsonderdelen deze gemeten worden. Als dat gebeurd is,is er sprake van een toetsmatrijs. Daarmee wordt een beeld verkregen van de representativiteit van hetmeetinstrument.De toetsmatrijs wordt voorafgaand aan de constructie van het meetinstrument – zowel bij schriftelijketoetsen als bij praktijktoetsen – opgesteld en vormt tijdens de constructiefase een continue oriëntatiepuntvoor degenen die de toets ontwikkelen.Maar ook voor diegenen die het meetinstrument naderhand gebruiken, bevat de bij het meetinstrumentbehorende toetsmatrijs belangrijke informatie over de reikwijdte van het instrument.Bij schriftelijke toetsen wordt per toetsvraag gewoonlijk direct in de matrijs aangegeven welkeleerinhoud en welke vaardigheid deze vraag meet.Bij vaardigheidstoetsen wordt vaak gebruikgemaakt van beoordelingscriteria. Wanneer het bijvoorbeeldde bedoeling is te meten of een leerling in staat is te luisteren naar anderen, zal er in het meetinstrumenteen criterium opgenomen moeten zijn dat hieraan refereert, zoals: ’gaat in op door anderen gesteldevragen of opmerkingen’Deze beoordelingscriteria vormen dan een wezenlijk onderdeel van de toetsmatrijs. De beoordelaarsmoeten aangeven of de beoordelingscriteria relevant en dekkend zijn ten opzichte van de te beoordelenleerdoelen.

36

Page 41: Verantwoord Meten In Het Gezondheidszorgonderwijs

Kwaliteitseisen m.b.t. de toets als meetinstrument

tabel 8 - Voorbeeld van een toetsmatrijs voor een schriftelijke toets

leerinhoud:ontwikkeling van zuigeling en peuter

kennis toepassing inzicht totaal

zuigeling – algemeen 0 0 3 3

lichamelijke en motorische ontwikkeling 0 3 0 3

emotionele en sociale ontwikkeling 3 0 0 3

dagelijkse zorg 1 0 2 3

voeding 0 2 1 3

peuter – algemeen 1 2 0 3

lichamelijke en motorische ontwikkeling 2 0 1 3

emotionele en sociale ontwikkeling 2 1 0 3

dagelijkse zorg 0 1 2 3

voeding 1 1 1 3

totaal 10 10 10 30

Een voorbeeld van een (ingevulde) toetsmatrijs is te zien in tabel 8.Dit is een toetsmatrijs van een (gefingeerde) schriftelijke theorietoets Kinderverpleegkunde. Zoals uit dematrijs af te lezen is, bestaat deze toets uit in totaal 30 vragen. Over elk onderdeel van de leerinhoudworden 3 vragen gesteld, in een vooraf vastgestelde verhouding verdeeld over de gedragscategorieën’kennis’, ’toepassing’ en ’inzicht’. Volgens deze matrijs moeten in elke gedragscategorie 10 vragengesteld worden.De leerstofonderdelen zijn in deze matrijs zeer gedetailleerd aangegeven. Dat is niet altijd mogelijk ensoms ook niet zinvol: als de te toetsen leerinhoud omvangrijker is dan in bovenstaande matrijsaangegeven, zou de lijst met gespecificeerde onderdelen erg groot kunnen worden. Daarom wordt insommige gevallen volstaan met een minder gedetailleerde matrijs.Een andere reden om de matrijs iets ’grover’ te maken is het feit dat de driedeling ’kennis/toepassing/in-zicht’ in de praktijk vaak niet werkt. Het onderscheid ’toepassing/inzicht’ blijkt vaak moeilijk te maken.Om die reden worden deze twee gedragscategorieën dan samengevoegd tot één categorie. Bovendiengebruikt men tegenwoordig meestal andere termen: reproductie en productie.Voor de aantallen vragen per categorie volstaat men soms ook wel met het geven van een ondergrensen een bovengrens. Een en ander is de volgende voorbeeld-matrijs te zien (tabel 9):

tabel 9 - Een meer globale toetsmatrijs

leerinhoud:ontwikkeling van zuigeling en peuter

kennis(reproductie)

toepassing / inzicht(productie)

totaal

zuigeling 4-6 9-11 15

peuter 4-6 9-11 15

10 20 30

Ook voor de toetsing van praktische vaardigheden is het van belang vooraf een toetsmatrijs op te stellen.Het gaat er dan vooral om in kaart te brengen welke deelaspecten er aan de te toetsen vaardigheidonderscheiden kunnen worden: deskundigen moeten het onderling eens zijn over de aspecten waarop inde toetssituatie gelet moet worden. Anders dan bij de theorietoetsen worden de gedragscategorieën soms

37

Page 42: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 3

ingevuld met het onderscheid ’zelfstandig – onder begeleiding’ of een indeling naar vaardigheden’cognitief – psychomotorisch – reactief – interactief’.Vaker echter wordt volstaan met alleen de analyse van de deelhandelingen. In tabel 11 is zo’n een-dimensionale toetsmatrijs weergegeven voor het wassen van een patiënt.

tabel 10 - Eendimensionale toetsmatrijs

Leerinhoud: wassen van een patiënt

• verpleegkundig dossier raadplegen

• patiënt voorbereiden

• juiste werkomgeving creëren

• handen wassen

• juiste benodigdheden klaarzetten

• patiënt in juiste houding helpen

• privacy van de patiënt bewaken

• patiënt uitkleden en sieraden af (laten) doen

• gezicht wassen

• handen en armen wassen

De toetsmatrijs geeft dus een beeld van de representativiteit van het meetinstrument.Voor praktische vaardigheden is dit echter aanzienlijk moeilijker dan bij een meetinstrument dat gerichtis op het meten van cognitieve vaardigheden.Aan vaardigheidstoetsen wordt dikwijls een hoge validiteit toegeschreven door de beoordelaars. De redenhiervoor is dat deze toetsen ’echt aandoen’. Of deze uitspraak over de validiteit altijd terecht is, valt tebetwijfelen (zie ook par. 2.5.2).

CriteriumvaliditeitHet externe aspect van validiteit speelt vooral een rol wanneer men primair geïnteresseerd is in eenbuiten het meetinstrument liggend criterium. Dit criterium kan in de toekomst liggen, een situatie die inhet onderwijs nogal eens voorkomt: men wil kunnen ’voorspellen’ wie met succes een vervolgopleidingzullen kunnen voltooien. Men spreekt in dit verband dan ook wel van predictieve validiteit. Er kan ookgekeken worden naar gelijktijdig beschikbare gegevens, waarvan men op theoretische grond verwachtdat daarmee een samenhang zou moeten zijn. Daarvoor moet een tweede set beoordelingen van deleerlingen worden verzameld.In een onderzoek van Schotten en Stolk (1995) is gebruikgemaakt van een dergelijk gelijktijdigcriterium: het gemiddelde globale oordeel van een groep van 10 ’ongewapende beoordelaars’ was daarbijhet criterium om de validiteit van de uitspraken van de ’gewapende’ beoordelaars te bepalen.’Ongewapend’ betekent in dit verband dat de beoordelaars de prestaties van de leerling beoordeelden opde manier zoals ze dat gewoonlijk in hun eigen praktijk doen en daarbij geen gebruikmaakten van hetontwikkelde beoordelingsinstrument, terwijl de ’gewapende’ beoordelaars bij de beoordeling wélgebruikmaakten van dit beoordelingsinstrument. (Dit lijkt op het eerste gezicht een zwak criterium, maarde kracht ligt juist in het grote aantal beoordelaars.)

Achterliggende gedachte daarbij was dat de betrouwbaarheid van de uitspraken van de ’gewapende’beoordelaars groter zou zijn dan die van de ’ongewapende’ beoordelaars omdat zij gebruikmaakten vaneen gestandaardiseerde observatielijst. Of met die observatielijst ook daadwerkelijk de juiste vaardigheidwerd gemeten, is dus nagegaan door een vergelijking met een buiten het instrument gelegen criterium.

38

Page 43: Verantwoord Meten In Het Gezondheidszorgonderwijs

Kwaliteitseisen m.b.t. de toets als meetinstrument

3.3.2 Relatie validiteit en betrouwbaarheid

Ter afsluiting van de bespreking van de begrippen validiteit en betrouwbaarheid, volgen hier tweeuitspraken om duidelijk te maken op welke wijze deze begrippen met elkaar samenhangen.

EEN TOETS DIE NIET VALIDE IS, KAN BEST BETROUWBAAR ZIJN.

Het is denkbaar dat er toetsresultaten verkregen zijn die zeer consistent blijken te zijn. Toch kan er indit geval met de toets steeds iets anders gemeten zijn dan beoogd werd te meten. Het eerder aangehaaldevoorbeeld van de schriftelijke toets voor het meten van psychomotorische vaardigheden is hiervan eentreffende illustratie.

EEN TOETS DIE NIET BETROUWBAAR IS, KAN NOOIT VALIDE ZIJN!

Als er een toets wordt afgenomen die de ene keer deze en de volgende heel andere toetsresultatenoplevert (dus onbetrouwbare/inconsistente gegevens) is het niet meer duidelijk wat er nu eigenlijkgemeten is (validiteitsvraag). Dit probleem speelt met name bij de meer representatieve toetsvormen.

Deze samenhang tussen validiteit en betrouwbaarheid wordt ook nog geïllustreerd aan de hand van devolgende afbeelding, waarin drie ’schietschijven’ te zien zijn. De betrouwbaarheid is op elke schijf demate waarin ’de schoten bij elkaar in de buurt liggen’. De validiteit is de mate waarin ’de schoten ookdaadwerkelijk doel treffen’.

afb. 16 - Verband tussen betrouwbaarheid en validiteit

Het verband tussen betrouwbaarheid en validiteit kan ook nog op een andere manier worden aangeduid:de validiteit van een toets kan nooit hoger zijn dan de betrouwbaarheid. De correlatie met een anderetoets (als maat voor de validiteit) kan nooit hoger zijn dan de correlatie zoals weergegeven in debetrouwbaarheidscoëfficiënt. De maximum validiteit (r12 max) wordt bepaald door de volgende formule:

Hierin zijn r11 en r22 de betrouwbaarheidscoëfficiënten van de beide respectieve toetsen.

3.4 Overige kwaliteitseisen: efficiëntie, transparantie, aanvaardbaarheid en specificiteit

Efficiëntie, als eis die aan een meetinstrument wordt gesteld, heeft zowel betrekking op de afname alsop de vormgeving van het meetinstrument. De afname van de toets of toetsopdracht mag de voortgangvan het onderwijs niet te veel belasten of verstoren en het scoren van de resultaten of het beoordelen van

39

Page 44: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 3

de prestaties mag niet meer tijd en menskracht in beslag nemen dan strikt noodzakelijk is. Bij het begripefficiëntie wordt dan vooral gedacht aan de moeite die het afnemen van de toets of toetsopdracht vergt.Dit wordt met name bezien vanuit het standpunt van de beoordelaar. Het gaat dan om aspecten alsvoorbereiding, organisatie, benodigdheden (materialen en menskracht), logistiek tijdens de afname,tijdsduur, correctie etcetera.Maar ook de omvang van de toets(opdracht) moet in de juiste verhouding staan tot de beschikbare tijd:de leerling moet in staat zijn de strategie voor het uitvoeren van de toetsopdracht als geheel te bepalen.Uiteraard moet de vormgeving van het meetinstrument ook zodanig zijn dat het uitvoeren van detoetsopdracht (schriftelijk of praktisch) zo efficiënt mogelijk kan gebeuren.Hierbij moet men denken aan aspecten van de presentatie (bijv. het qua lay-out duidelijk onderscheidenvan vragen en opdrachten, informatieve teksten en richtlijnen).

Toetsen voor praktische vaardigheden zullen meestal minder efficiënt zijn dan bijvoorbeeld schriftelijketoetsen of soms zelfs op gespannen voet daarmee staan. Daar waar bij het toetsen door middel vanmeerkeuzetoetsen vaak een min of meer ’massale’ toetsafname mogelijk is (dus sprake is van een zeerhoge efficiëntie) waarbij bovendien gebruikgemaakt kan worden van mechanische scoring en verwerking,is het toetsen van praktische vaardigheden in de daadwerkelijke beroepspraktijk vaak een zaak vanbeoordeling van individuele leerlingen waarbij voor de prestatiebeoordeling gebruik gemaakt moetworden van meerdere deskundigen die ter plaatse de (eerste) beoordeling uitvoeren (dus een relatief lageefficiëntie).Omwille van de haalbaarheid en realiteit zal in het algemeen gezocht moeten worden naar een zoeenvoudig mogelijke afnameprocedure zonder daarbij afbreuk te doen aan het streven naar een optimalevaliditeit en een voldoende betrouwbaarheid.Dit spanningsveld tussen efficiëntie, betrouwbaarheid en validiteit komt in de volgende paragraaf aande orde.

Onder transparantieverstaat men de mate waarin alle betrokkenen vooraf beschikken over relevanteinformatie met betrekking tot de toetsing. Voor de leerlingen betekent dit bijvoorbeeld dat zij over díeinformatie beschikken die hen in de gelegenheid stelt zich op een goede manier voor te bereiden op detoetsing. Ze moeten op de hoogte zijn van de eisen die er gesteld worden (wat moeten ze kennen/kun-nen? op welk niveau?), van de vormgeving van het meetinstrument (is het een schriftelijke toets, eenmondelinge opdracht of een praktijkopdracht; wordt er gebruikgemaakt van bijvoorbeeld simulatie-patiënten), van de beslissingsregels die bij de normering gehanteerd worden en van de manier waaropde cijfertoekenning tot stand komt, van de consequenties van een onvoldoende, van de omvang van detoets (hoeveel vragen in hoeveel tijd?) etcetera.Maar ook anderen dan de leerlingen hebben recht op duidelijkheid: degene die aanwezig is bij de afnamevan de toets of degenen die zelf de beoordeling uitvoeren, moeten weten welke procedures en regels erbijgehanteerd moeten worden.In het algemeen geldt voor alle betrokkenen dat de beoordelingsprocedures en de regels die daarbijgehanteerd worden helder en inzichtelijk moeten zijn.

Uit de eis van transparantie vloeit dus in ieder geval voort dat de leerling vooraf op de hoogte wordtgesteld van het feit dat hij getoetst wordt. Soms wordt dit op de praktijkvormingsplaats achterwegegelaten met het argument dat er een gekunstelde situatie ontstaat, waarin de leerling eerder geneigd zalzijn ’gewenst gedrag’ te vertonen. Dit is echter onvoldoende reden om pas achteraf tegen de leerling tezeggen dat er een beoordeling heeft plaatsgevonden.Een vergelijkbaar bezwaar wordt wel geuit tegen het werken met observatielijsten: de leerling zou deneiging hebben de beoordelingscriteria van de lijst uit het hoofd te leren in plaats van zich te oefenenin een maximale beheersing van de te toetsen vaardigheid. Hierdoor zou men iets anders toetsen dan menbeoogt te toetsen. Maar: als de leerling weet op welke aspecten hij wordt beoordeeld en daarmee in zijn

40

Page 45: Verantwoord Meten In Het Gezondheidszorgonderwijs

Kwaliteitseisen m.b.t. de toets als meetinstrument

gedrag rekening houdt, zal dit ertoe kunnen leiden dat deze leerling die aspecten integreert in zijnhandelen. Dit kan de kwaliteit van het handelen alleen maar verbeteren. Een voorwaarde daarbij is danuiteraard wel dat er gedurende de opleiding meerdere toetsmomenten in verschillende zorgsituaties zijnen dat het meetinstrument alle relevante beoordelingsaspecten bevat (valide is).

Onderaanvaardbaarheidvan meetresultaten verstaat men de mate waarin alle betrokkenen (de leerling,de school, de overheid, de maatschappij) de beslissingen die genomen worden op grond van dezemeetresultaten kunnen accepteren. De beslissingen moeten door betrokkenen als doelmatig en billijkervaren worden. Onder meer om deze reden maken vertegenwoordigers van deze betrokken partijen vaakdeel uit van commissies die de toetsopgaven vaststellen of van commissies die beslissingen nemen opbasis van de toetsresultaten.

Onderspecificiteitverstaat men de mate waarin het meetinstrument die vaardigheden meet die specifiekzijn voor de beroepsuitoefening en/of die het resultaat zijn van het voorafgaande onderwijs. Eenmeetinstrument, gericht op het meten van vaardigheden in de gezondheidszorg is specifiek als het dievaardigheden meet die rechtstreeks samenhangen met het beroep van verpleegkundige. Of eenmeetinstrument daadwerkelijk specifieke vaardigheden meet, kan uitsluitend beoordeeld worden doorberoepsbeoefenaren. Een aandachtspunt daarbij is dat ook ’algemene vaardigheden’, zoals probleemoplos-send vermogen, kritisch denken of bepaalde sociale vaardigheden, een wezenlijk onderdeel van deberoepsvaardigheden zijn en niet verward moeten worden met ’common sense’.

3.5 Het spanningsveld tussen betrouwbaarheid, validiteit en efficiëntie

Zoals aangegeven in paragraaf 3.2.3 is het doel van het verkrijgen van meetgegevens: de juisteconclusies kunnen trekken over het beheersingsniveau van leerlingen. Om de kans op onjuistebeslissingen te beperken moet gestreefd worden naar een zo hoog mogelijke validiteit (door eensystematische en zorgvuldige constructie van de toets) en een zo hoog mogelijk betrouwbaarheid (dooreen goede meet- en beoordelingsprocedure).

Bij schriftelijke toetsen (en met name meerkeuzevragen) is het relatief eenvoudig om een goedebetrouwbaarheid te realiseren. Maar ook moet de toets dekkend zijn voor de leerdoelen, evenwichtigsamengesteld zijn (niet te gemakkelijke of te moeilijke vragen) en een representatieve steekproef vormenuit de leerdoelen (validiteitsprobleem).Daarnaast is het van belang dat de leerlingen vooraf goed geïnformeerd zijn over de meting en deprocedure die daarbij gevolgd wordt, zodat men zich optimaal kan voorbereiden op de toetssituatie.Vervolgens moeten er vooraf maatregelen getroffen zijn om de condities waaronder de toetsafnameplaatsvindt optimaal te laten zijn.Tenslotte moeten er heldere afspraken zijn met betrekking tot de correctieprocedure: sluitende eneenduidige sleutels en antwoordmodellen, eventueel meer correctoren, afspraken over de volgorde vancorrectie e.d.Bij het toetsen van praktische vaardigheden zal het meer moeite kosten om een hoge betrouwbaarheidte realiseren. Om de toetssituatie zo dicht mogelijk te laten aansluiten op het leerdoel is het vaak gewenstde meting daadwerkelijk in de beroepspraktijk uit te laten voeren. De validiteit is dan optimaal.Voor de betrouwbaarheid ligt dat anders: de beroepspraktijk voldoet in het algemeen niet aan de eisenvan betrouwbaarheid in de zin van consistent, reproduceerbaar. Ook is standaardisatie van depraktijksituatie maar ten dele te realiseren: elke praktijksituatie is weer anders doordat de omstandighe-den niet identiek zijn. Standaardisatie moet dus vooral gezocht worden in bijvoorbeeld standaardinstruc-ties voor de leerling en voor degene die de toets afneemt, gebruik van ’standaard’-observatielijsten enprotocolvoorschriften, gebruik van toetsmatrijs etcetera.

41

Page 46: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 3

afb. 17 - Betrouwbaarheid, validiteit en efficiëntie

Ondanks deze standaardisatie blijft er echter altijd een verschil in afnamecondities: het is niet mogelijkom leerlingen altijd onder precies gelijke afnamecondities te toetsen.Een mogelijke oplossing voor dit laatste is om leerlingen vaker te toetsen. Elke leerling ’treft’ danweleens een ’moeilijker’ en een ’gemakkelijker’ praktijksituatie. Hierdoor zijn ’gemiddeld’ depraktijksituaties toch weer voor elke leerling min of meer gelijkwaardig.

Uit het voorgaande zal duidelijk geworden zijn dat de constructeur van een praktijktoets zich geplaatstziet voor het dilemma: maximale validiteit of maximale betrouwbaarheid.Wanneer het primaat gelegd wordt bij de validiteit zal dat negatieve consequenties kunnen hebben voorde betrouwbaarheid. Andersom speelt hetzelfde: wanneer het primaat gelegd wordt bij de betrouwbaar-heid, zal dat negatieve consequenties kunnen hebben voor de validiteit.Het spanningsveld tussen validiteit en betrouwbaarheid neemt nog extra toe als men bedenkt dat eenbetrouwbare beoordeling van vaardigheden in ’natuurgetrouwe’ beoordelingssituaties veel tijd, geld envooral menskracht kost. Dit is het probleem van de efficiëntie van het meetinstrument.In afbeelding 17 is het spanningsveld schematisch weergegeven.

Efficiëntie is een aspect waar individuele docenten meestal nauwelijks invloed op hebben. Hetmanagement van de instelling zal – indien men tenminste het belang van een valide en betrouwbaremeting ondersteunt – moeten zoeken naar wegen om het probleem van de tijdsinvestering, debeschikbaarheid van meerdere beoordelaars en de kosten die dit met zich meebrengt op te lossen (al danniet in samenwerking met andere opleidingen).Om het spanningsveld tussen validiteit, betrouwbaarheid en efficiëntie bij het toetsen van praktischevaardigheden op te lossen, zal er in de praktijk vaak sprake zijn van een compromis. Er zal steeds eenafweging moeten plaatsvinden tussen een acceptabele (zo hoog mogelijke) mate van validiteit, eenacceptabele (zo hoog mogelijke) mate van betrouwbaarheid en een acceptabele (zo hoog mogelijke) matevan efficiëntie.

3.6 Aandachtspunten ter verhoging van de kwaliteit van een meetinstrument

Het doel van deze paragraaf is de docent een aantal aandachtspunten aan te bieden waarmee – indienstelselmatig toegepast op het (concept)meetinstrument – de kwaliteit van het meetinstrument kan wordenverhoogd. Deze aandachtspunten betreffen met name de kwaliteitseisen objectiviteit, validiteit enbetrouwbaarheid.Een en ander gebeurt in een zodanige vorm dat het desgewenst gehanteerd kan worden als een checklist.

Aandachtspunten tijdens de constructiefase van de toets:– Wordt met de toets gemeten wat beoogd is te meten?– Is er een correcte toetsmatrijs aanwezig waaruit men de (inhouds)validiteit kan afleiden?– Is de inhoud van de toets een goede afspiegeling van de te toetsen leerdoelen?

42

Page 47: Verantwoord Meten In Het Gezondheidszorgonderwijs

Kwaliteitseisen m.b.t. de toets als meetinstrument

– Is de toetsvorm geschikt voor de te toetsen leerdoelen?– Voldoen de toetsvragen of -opdrachten aan de eis van specificiteit?– Is de toets(opdracht) zodanig helder, eenduidig en concreet geformuleerd dat er geen interpretatiever-

schillen kunnen ontstaan bij de leerlingen of beoordelaars welk gedrag of welke respons gevraagdwordt?

– Sluit de toetsopdracht (qua moeilijkheidsgraad en taalgebruik/formulering) aan bij de doelgroep?– Bevat de toets geen extreem moeilijke of gemakkelijke opgaven?– Is de lengte van de toetsopdracht in overeenstemming met de omvang van het te toetsen

leerstofgebied?– Is de toetslengte voldoende met het oog op de betrouwbaarheid van de meting?– Is bij de omvang van de toetsopdracht rekening gehouden met de beschikbare tijd?– Zijn er vooraf antwoordmodellen, procedures of protocollen opgesteld als hulpmiddel en leidraad bij

de correctie?– Zijn de vakdeskundigen het onderling eens over het goede antwoord(model), het gewenste gedrag,

de opgestelde criteria, de scoringsvoorschriften etcetera?– Zijn deze antwoord(modell)en, scoringsvoorschriften, beoordelingscriteria, observatieschema’s

etcetera eenduidig geformuleerd?– Is de typografische verzorging van de toetsopdracht correct? (geen hinderlijke lay-out of tikfouten)

Aandachtspunten rondom de afnamefase van de toets:– Zijn de leerlingen vooraf goed geïnformeerd over de toetsafname, de toetsprocedure etcetera?– Zijn de instructies voor degene die de toets afneemt (of degene die aanwezig is tijdens de

toetsafname) duidelijk?– Is duidelijk welke hulpmiddelen tijdens de toetsing toegestaan zijn?– Zijn er maatregelen getroffen om de omstandigheden waaronder de toetsafname plaatsvindt optimaal

te laten zijn?– Zijn er vooraf bij sommige leerlingen persoonlijke omstandigheden bekend die de betrouwbaarheid

van de score zouden kunnen verminderen?– Hebben de leerlingen voldoende tijd om de toets te maken?– Zijn er (inhoudelijke en/of technische) maatregelen getroffen om de subjectiviteit van de beoordeling

te verminderen?– Discrimineert de toetsopdracht voldoende tussen ’goede’ en ’zwakke’ leerlingen?

43

Page 48: Verantwoord Meten In Het Gezondheidszorgonderwijs

4 Indeling en beschrijving van kenmerken van toetsvormen

4.1 Eigenschappen van toetsvormen

Een beroepsopleiding beoogt leerlingen competentie te laten verwerven ten aanzien van díe vaardighedendie de beginnende beroepsbeoefenaar nodig kan hebben bij het uitoefenen van zijn functie. Voordat hetdiploma overhandigd kan worden, zal de leerling moeten aantonen dat hij die vaardigheden beheerst;erover kunnen praten of schrijven is geenszins voldoende bewijs van competentie. ’Harde’ conclusiesover de competentie zijn eigenlijk alleen mogelijk op basis van een toets die een beroep doet op preciesdíe vaardigheid die vastgesteld moet worden. Het is echter niet realistisch hieraan de conclusie teverbinden dat toetsing van beroepskwalificaties altijd zou moeten plaatsvinden in de beroepspraktijk. Eris een aantal redenen te noemen waarom andere, minder realistische toetsvormen soms de voorkeurgenieten.Met verschillende toetsvormen kunnen verschillende dingen getoetst worden. Het is steeds het zoekennaar een optimaal compromis tussen de verschillende eigenschappen van toetsen. In dit hoofdstuk wordtschematisch aangegeven wat de kwaliteiten van de verschillende toetsvormen zijn.

4.1.1 Representativiteit

In paragraaf 2.5 is gesproken over verschillende ordeningsmogelijkheden voor toetsvormen. Opverschillende manieren kwam daarbij naar voren dat een indeling naar vaardigheden een zeer bruikbareindeling is: de belangrijkste vraag die immers steeds gesteld moet worden, is of een toets ’representatief’is, of deze een goede afspiegeling vormt van de werkelijkheid en de complexiteit van de taak dekt. Viahet begrip ’fit’ werd in andere bewoordingen hetzelfde gezegd: een toets heeft een ’perfect fit’ als detoets die leerdoelen meet die hij moet meten. De keuze voor een bepaalde toetsvorm zou derhalve simpelkunnen zijn.Bij het selecteren van de meest geschikte toetsvorm spelen naast deze representativiteit en fit echter ooknog andere aspecten een rol. Er moet dus steeds een afweging plaatsvinden.

4.1.2 Betrouwbaarheid

De betrouwbaarheid van de meting is een belangrijke factor bij de keuze van de toetsvorm.De betrouwbaarheid van een toets met gesloten vragen zal in het algemeen aanmerkelijk hoger zijn danvan een toets die in de werkelijke beroepspraktijk wordt afgenomen.Het aanbieden van verschillende taaksituaties is in zo’n context lastig te realiseren, hetgeen ten koste kangaan van de algemene geldigheid van de toetsprestatie. Natuurgetrouwe toetsen worden ook gekenmerktdoor de hoge mate van onvoorspelbaarheid met betrekking tot de wijze waarop taken worden uitgevoerd.Daardoor kan een beoordelingsinstrument niet anders dan zeer globale richtlijnen bevatten. Dit vormteen bedreiging voor de betrouwbaarheid van de toetsscores.In het algemeen kan men – althans in het gezondheidszorgonderwijs – stellen dat de betrouwbaarheidvan een beoordelingsinstrument afneemt naarmate de toets representatiever is.

44

Page 49: Verantwoord Meten In Het Gezondheidszorgonderwijs

Indeling en beschrijving van kenmerken van toetsvormen

4.1.3 Organisatie/logistiek

Ook kunnen de organisatorische en logistieke aspecten voor de ene toetsvorm eenvoudiger liggen danvoor de andere toetsvorm: het ontwikkelen en afnemen van een meerkeuzetoets bij een groep leerlingenis aanzienlijk eenvoudiger te organiseren dan het opzetten van een beoordelingssysteem van leerlingenin de daadwerkelijke beroepspraktijk (work sample tests). De afname van een praktijktoets is gewoonlijkindividueel. Elke leerling wordt afzonderlijk beoordeeld. Er moet een beoordelingsinstrument zijn datde beoordelaar in staat stelt de prestaties van de leerling volgens gelijke maatstaven te meten. Er moetop het juiste tijdstip een geschikte toetssituatie beschikbaar zijn. Er moeten minimaal twee beoordelaarsaanwezig zijn om de prestaties van de leerling te kunnen beoordelen.Organisatorisch blijkt het soms onmogelijk de leerling díe taak voor te leggen die een beroep doet opde te toetsen vaardigheid. Vaststellen of een leerling-verpleegkundige in staat is adequaat te reageren opeen patiënt die in een shocktoestand dreigt te raken, kan niet in de beroepspraktijk getoetst worden omdatdergelijke patiënten niet op afroep beschikbaar zijn.Ethische bezwaren dringen zich op als het uitvoeren van taken een bedreiging kan vormen voor hetfysische of psychische welbevinden van de leerling en/of personen op wie de taakuitvoering gericht is.Of een leerling tandheelkunde voldoende ’boorvaardig’ is, mag niet vastgesteld worden door hempreparaties te laten vervaardigen bij echte patiënten.

4.1.4 Financiële consequenties

Toetsvormen verschillen onderling ook aanzienlijk in financieel oogpunt. Niet altijd zal gekozen kunnenworden voor de toetsvorm die uit oogpunt van representativiteit ’de beste’ is: aan elke toetsvorm hangteen prijskaartje, toetsen vragen in wisselende mate een investering van tijd en/of geld, een nietonbelangrijke factor bij de afweging die op curriculumniveau gemaakt moet worden.

Hoewel er voor veel toetsvormen geen exacte gegevens beschikbaar zijn over de kosten, is hier wel eenschatting van te geven. Daarbij is het nuttig een onderscheid te maken tussen enerzijds de productiekos-ten en anderzijds de afnamekosten van de toetsvorm.Als een meetinstrument nieuw ontwikkeld moet worden zonder dat er voorbeelden zijn van de maniervan ontwikkelen (er zijn geen prototypen aanwezig) zijn de kosten hiervan in het algemeen zeer hoog.Onder deze kosten vallen dan ook de investeringen die nodig zijn om de geschiktheid van de toetsvormvast te stellen en de kwaliteit van het meetinstrument te verbeteren. Deze situatie wordt hierna verderbuiten beschouwing gelaten.– De reguliereproductiekostenvan een toetsinstrument (waarbij dus wel een prototype aanwezig is)

verschillen sterk qua hoeveelheid tijd en benodigde deskundigheid. De constructie van eenmeerkeuzetoets zal in het algemeen aanzienlijk goedkoper zijn dan het ontwikkelen van eenpraktijktoets.

– De reguliereafnamekostenten slotte kunnen ook sterk verschillen per toetsvorm: een groepsgewijsafgenomen meerkeuzetoets vergt minder geld dan een individueel beoordelingssysteem op dewerkplek. Voor bepaalde toetsvormen is het zelfs nodig over bepaalde apparatuur (video,computerapparatuur, beeldplaatspelers) te beschikken.Een voorbeeld uit het leger kan een en ander verder verduidelijken: in de militaire opleiding wordtveel gewerkt met simulatoren om bijvoorbeeld de vaardigheid van leerlingen in het gebruik vanwapensystemen te beoordelen. Zeker waar het geleide projectielen betreft, is het financieel niethaalbaar leerlingen in de beroepspraktijk te toetsen.

45

Page 50: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 4

4.1.5 Een schematische weergave

In de volgende paragraaf passeren alle toetsvormen de revue. Elke beschrijving gaat vergezeld van eenschematische weergave van de kwaliteit van de desbetreffende toetsvorm. In dit schema zijn debelangrijkste kwaliteitsaspecten opgenomen met daarachter een grijze balk. Hoe langer de grijze balk,hoe gunstiger die toetsvorm op dat kwaliteitsaspect scoort. In tabel 11 is een voorbeeld opgenomen.

tabel 11 - De kwaliteiten van een toets

kwaliteitsaspect kwaliteitsindicatie

representativiteit laag hoog

betrouwbaarheid laag hoog

organisatie/logistiek lastig eenvoudig

financieel: productie duur goedkoop

afname duur goedkoop

4.2 De kenmerken van de verschillende toetsvormen

Om de keuze van de toetsvorm te vergemakkelijken, worden nu achtereenvolgens de verschillendetoetsvormen besproken. In hoofdstuk 6, 7 en 8 wordt veel uitvoeriger ingegaan op de constructie,afname, correctie en beoordeling van de verschillende toetsen. In hoofdstuk 7 wordt ook aandachtbesteed aan twee onderwijs-/toets-vormen, die enigszins buiten het hier gepresenteerde indelingsprincipevallen, namelijk de beroepspraktijkvorming en de scriptie.Omdat bij de bespreking van bepaalde toetsvormen af en toe verwezen wordt naar andere toetsvormen(om de verschillen duidelijk te maken), staan in tabel 12 alle toetsvormen alvast op een rijtje.

tabel 12 - Overzicht van de besproken toetsvormen

toetsvorm paragraaf representativiteit betrouwbaarheid organisatie financiën

gesloten vragen 4.2.1 •1 ••••••••• ••••••••• ••••••••

open vragen 4.2.2 •• ••••••• ••••••••• ••••••••

casustoetsen 4.2.3 •• •••••••• •••••••• ••••••••

potlood-en-papier 4.2.4 •• ••••••• •••••••• ••••••••

computersimulatie 4.2.5 ••• ••••••••• •• •

simulator 4.2.6 •••• •••••• ••(•••••)2 •(•••)2

skill sample test 4.2.7 •••••• ••••••• •••• •••••

patiëntsimulatie 4.2.8 ••••••• ••••• ••• •••

work sample test 4.2.9 ••••••••• ••• ••• ••••1 Hoe meer balletjes, hoe gunstiger de toetsvorm op het desbetreffende aspect scoort2 De variant met een fantoom scoort hier gunstiger dan die met de ’virtual environment’

46

Page 51: Verantwoord Meten In Het Gezondheidszorgonderwijs

Indeling en beschrijving van kenmerken van toetsvormen

4.2.1 Toetsen met gesloten vragen

Een gesloten vraag (of meerkeuzevraag) is een vraagtype waarbij de leerlingen moeten kiezen uit eenbeperkt aantal antwoordmogelijkheden die vooraf gegeven zijn. Een gesloten vraag bestaat uit een stamen een aantal alternatieven. Alleen in de stam wordt de vraag of het probleem gesteld. In de alternatievenbevinden zich naast één juist antwoord (= de sleutel) een of meer afleiders.Door het stellen van schriftelijke gesloten vragen is het mogelijk gedurende het totale opleidingstrajectde cognitieve vaardigheden van leerlingen te toetsen. Dit meten van cognitieve vaardigheden moet breedgezien worden. Het wil namelijk ook zeggen dat de kennis gemeten wordt die ten grondslag ligt aanpsychomotorische en reactieve/interactieve vaardigheden. In tabel 14 worden de sterke en zwakke puntenvan gesloten vragen weergegeven.

– De representativiteit is gering: de situatie tijdens de toets staat ver van de werkelijke beroepspraktijk.

tabel 13 - Toetsen met gesloten vragen

kwaliteitsaspect kwaliteitsindicatie

representativiteit

betrouwbaarheid

organisatie/logistiek

financieel: productie

afname

Er is wel een groot (kennis)gebied afvraagbaar: er kunnen veel vragen gesteld worden, want hetinvullen kost weinig tijd. Daarmee kan de inhoudsvaliditeit van de toets worden gewaarborgd.

– De betrouwbaarheid is over het algemeen goed. Over het juiste antwoord bestaat in principe geeninterpretatieverschil (voor zover de deskundigen, die het item geconstrueerd hebben, het ook eenszijn over het juiste antwoord). Bij de correctie is de inbreng van de beoordelaar minimaal, waardooreen gelijke behandeling van alle leerlingen gewaarborgd is. De beoordeling is derhalve objectief.Daardoor is de betrouwbaarheid doorgaans hoger. Een bedreiging voor de betrouwbaarheid wordtgevormd door het feit dat leerlingen door raden goede antwoorden kunnen geven.

– De constructie vergt vrij veel tijd en geld: niet alleen moet aandacht worden besteed aan heteenduidig formuleren van de vraag en het juiste antwoord, maar ook aan de afleiders (de fouteantwoorden). Het opstellen ervan vereist een grote mate van deskundigheid: er is ervaring nodig omze te maken.

– De afname kan gebeuren met grote groepen leerlingen tegelijk en is betrekkelijk eenvoudig teorganiseren.

– De correctie kost weinig tijd: per leerling hoeven maar weinig gegevens nagekeken te worden. Eenvoorgestructureerd antwoordblad en een correctiesjabloon kan daarbij veel helpen. Via optischleesbare antwoordbladen kunnen de resultaten mechanisch worden nagekeken, hetgeen vooral bijgrote groepen zeer efficiënt is.

Andere punten:– Er kan een vrij eenvoudig scoringssysteem worden gehanteerd (goed/fout) hetgeen inzichtelijk is voor

alle betrokkenen. Wanneer de vragen niet discutabel zijn, kan over de resultaatbepaling ook geendiscussie ontstaan.

– Goed geconstrueerde vragen zijn duidelijk voor de leerlingen: ze krijgen niet alleen de vraag maarook de mogelijke antwoorden; zij krijgen zo een goed beeld van het antwoord dat wordt verwacht.

47

Page 52: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 4

– Empirische gegevens bieden meer analysemogelijkheden dan bij andere vraagvormen: analysegege-vens richten zich met name op toetsverbetering, een systematische foutenanalyse en bieden demogelijkheid om de normen constant te houden.

– Er bestaat altijd een gokkans: het is bij elke vraag mogelijk dat leerlingen het goede antwoord nietwisten, maar hebben geraden. Het blind raden komt echter maar heel weinig voor. Om op basis vanenkel gokken een voldoende te krijgen, is erg veel geluk nodig. De kans op een goed antwoord bijgokken is bij vierkeuzevragen 25%, bij driekeuzevragen 33,3% en bij ja/nee-vragen 50%. Alsvuistregel kan worden aangehouden, dat toetsen die uit vierkeuzevragen bestaan minstens 40 itemsmoeten bevatten. Bij driekeuzevragen zijn 60 items nodig en een toets met uitsluitend tweekeuzevra-gen moet uit minstens 80 items bestaan.

– De productieve taalvaardigheid wordt niet getoetst: leerlingen leren niet om een antwoord teformuleren, zij hoeven het (juiste) antwoord alleen maar aan te strepen.

– De docent krijgt geen inzicht in de argumentatie achter een fout antwoord. Dit hangt samen met devorige twee punten: de leerlingen hoeven alleen een antwoord aan te strepen of met een letter op teschrijven en het is dus niet duidelijk of een antwoord gebaseerd is op (gebrek aan) kennis of op goedof fout gokken. Het is daarom aan te bevelen de afleiders zo te kiezen dat daarin bepaaldedenkfouten besloten liggen (zie ook par. 2.3.4).

4.2.2 Toetsen met open vragen

Een open vraag is een vraagtype waarbij de leerlingen het antwoord zelf moeten formuleren.Bij een open vraag hoort een correctievoorschrift of een beoordelingsschema. Een vast onderdeel vandit correctievoorschrift wordt gevormd door het antwoordmodel.Door het stellen van schriftelijke open vragen kunnen, evenals bij de gesloten vraagvormen, cognitievevaardigheden of cognitieve aspecten van psychomotorische en reactieve/interactieve vaardigheden wordengetoetst. Het maken van open vragen is over het algemeen moeilijker en tijdrovender dan vanmeerkeuzevragen, omdat tevens een antwoordmodel moet worden geconstrueerd, waarbij een onderscheidgemaakt moet worden in kort- en lang-antwoord-vragen. In tabel 15 worden de sterke en zwakke puntenvan open vragen weergegeven.

– De representativiteit is gering: de situatie tijdens de toets staat ver van de werkelijke beroepspraktijk.

tabel 14 - Toetsen met open vragen

kwaliteitsaspect kwaliteitsindicatie

representativiteit

betrouwbaarheid

organisatie/logistiek

financieel: productie

afname

De hoeveelheid leerstof die getoetst kan worden is bovendien beperkt (schrijven gaat nu eenmaallangzamer dan lezen en aanstrepen, zoals bij een toets met gesloten vragen). De werkelijkheid wordtwel beter benaderd dan bij de gesloten vragen, omdat in de dagelijkse praktijk de problemen zichzelden aandienen in meerkeuzevorm.

– Een toets met open vragen heeft een minder hoge interbeoordelaarsbetrouwbaarheid (consistentie vanscoring) dan een toets met gesloten vragen.

– De constructie vergt vrij veel tijd en geld: niet alleen moet aandacht worden besteed aan heteenduidig formuleren van de vraag, maar ook aan een goed antwoordmodel. Het opstellen daarvan

48

Page 53: Verantwoord Meten In Het Gezondheidszorgonderwijs

Indeling en beschrijving van kenmerken van toetsvormen

vereist een grote mate van deskundigheid: er is steeds een wisselwerking tussen vraag enantwoordmodel, waarbij de vraag net zolang bijgesteld moet worden dat een goede leerling ook tothet gewenste antwoord kan komen.

– De afname kan gebeuren met grote groepen leerlingen tegelijk en is betrekkelijk eenvoudig teorganiseren.

– Het levert de docent veel correctiewerk op en de beoordeling door een deskundige is noodzakelijk.

Overige punten:– Met deze toetsvorm wordt het zelfstandig formuleren van de leerlingen gemeten. Vooral bij de lang-

antwoord-vragen en essayvragen is dit een niet onbelangrijk aspect. Er kan inzicht worden verkregenin de mate waarin leerlingen zich op papier correct kan uitdrukken.

– Het is niet mogelijk om door raden een correct antwoord te geven.– Het biedt de docent inzicht in fouten die de leerlingen maken in hun denken en/of de argumentatie

die zij aanvoeren.– Het meet meer dan alleen kennis: ook wijze van formuleren, verbale of schriftelijke begaafdheid (als

dat een doel is)

Uit onderzoek is gebleken dat toetsen met open vragen in kwalitatieve zin net zo goed zijn als toetsen

tabel 15 - Kenmerkende verschillen tussen open en gesloten toetsen

toetsen met open vragen toetsen met gesloten vragen

De cursist gebruikt de afnametijd voornamelijk om tedenken en schrijven.

De cursist gebruikt de afnametijd vooral om te den-ken en te lezen.

De cursist moet goed kunnen schrijven. De cursist moet goed kunnen lezen.

De toets bestaat uit relatief weinig vragen waaropeen min of meer uitvoerig antwoord gegeven moetworden. Dit is nadelig voor zowel de betrouwbaar-heid (bij kortere toetsen spelen toevalstreffers eengrotere rol) als voor de validiteit van de toets (korteretoetsen zijn vaak minder representatief voor de doe-len).

De toets bestaat uit een groot aantal vragen met ge-precodeerde antwoorden. Dit bevordert zowel de be-trouwbaarheid als de validiteit van de toets.

De docent besteedt de meeste tijd aan de formuleringvan antwoordmodellen en aan de correctie van deantwoorden.

De docent besteedt de meeste tijd aan de constructievan de vragen.

Efficiënt bij kleine groep cursisten. Efficiënt bij grote groep cursisten.

In gewijzigde vorm overgenomen uit: Dousma & Horsten (1980).

die bestaan uit gesloten vragen, tenminste als de beoordelingstaak bij de toets met open vragenvoldoende gestructureerd is. Dit betekent dan dat de keuze voor de vraagvorm vooral een kwestie vanefficiëntie is: volgens Dousma & Horsten (1980) zijn gesloten vragen efficiënter vanaf ongeveer 40leerlingen. Maar de uitkomsten van dit onderzoek gelden alleen als de doelen van het onderwijs in alleredelijkheid met zowel open als gesloten vragen getoetst kunnen worden.

4.2.3 Casustoetsen

In het kader van de toetsing verstaan wij onder een casus een beschrijving van een aan de praktijkontleende situatie, waaraan vanuit een of meer vakgebieden (of leergebieden) vragen gekoppeld zijn.Uitgangspunt hierbij is dat de vragen niet los van de beschrijving te beantwoorden zijn.In de tabel worden de sterke en zwakke punten van casustoetsen weergegeven.

49

Page 54: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 4

– De representativiteit is nog niet zo groot: de situatie tijdens de toets staat uiteraard ver van de

tabel 16 - Casustoetsen met gesloten en open vragen

kwaliteitsaspect kwaliteitsindicatie

representativiteit

betrouwbaarheid

organisatie/logistiek

financieel: productie

afname

werkelijke beroepspraktijk. Hier staat tegenover dat in een casus wel getracht wordt een situatie uitde beroepspraktijk te beschrijven. De hoeveelheid leerstof die getoetst kan worden is bovendienbeperkt: het lezen van de casus kost (examen)tijd. Bovendien moeten de opgaven (open en geslotenvragen) gekoppeld zijn aan de casus, waardoor de keuzevrijheid beperkt is.Deze toetsvorm biedt mogelijkheid om de volgende integratieve doelstellingen te toetsen:. de leerlingen kunnen aantonen dat ze theorie en praktijk met elkaar in verband kunnen brengen

en vanuit de theorie probleemoplossend bezig kunnen zijn in een aan de praktijk ontleendesituatie (integratie theorie en praktijk);

. de leerlingen kunnen verschillende vak- en leergebieden met elkaar in verband brengen(integratie van vakken), waarbij verpleegkunde het centrale vak is;

. de leerlingen kunnen problemen op cognitief, psychomotorisch, reactief en/of interactief gebiedoplossen (integratie van vaardigheden).

Met name op de eerste twee punten biedt de casustoets mogelijkheden. Ten aanzien van het laatstepunt geldt uiteraard, dat alleen kennis over het psychomotorisch handelen en de manier van inlevenen reageren getoetst kunnen worden (voorwaardelijke kennis). Het voordeel is wel dat leerlingengevraagd kunnen worden naar argumenten voor hun handelen, iets wat in de praktijk moeilijk kan.Hierbij geldt echter weer de beperking dat de docent nooit weet of leerlingen in de praktijk inderdaadzo zullen handelen: de docent kan alleen toetsen of zij weten hoe zij zouden moeten handelen en ofzij weten waarom dat zo is.Algemeen geldt toch dat, wanneer de leerdoelen samenhang vertonen, deze ook in samenhanggetoetst worden. En daar is een casus bij uitstek geschikt voor.

– Een casustoets met open en gesloten vragen zit wat de interbeoordelaarsbetrouwbaarheid (consistentievan scoring) betreft in tussen een toets met alleen gesloten vragen en een toets met alleen openvragen.

– De constructie vergt veel tijd en geld: naast het construeren van opgaven en het voldoen aan alleeisen die daarvoor gelden, moet ook een casusbeschrijving gemaakt worden, die aan verschillendeeisen voldoet.

– De afname kan gebeuren met grote groepen leerlingen tegelijk en is betrekkelijk eenvoudig teorganiseren.

– Het levert de docent, voor zover er gebruik wordt gemaakt van open vragen, veel correctiewerk open de beoordeling door een deskundige is noodzakelijk.

4.2.4 Potlood-en-papier-toetsen

De term ’potlood-en-papier’–toets geeft al aan dat er bij deze toets geen handelend optreden van deleerling wordt verwacht bijvoorbeeld in de zin van daadwerkelijk een anamnesegesprek voeren met eenzorgvrager, en ook niet in de vorm van het schrijven van een rapportage of andere ’authentieke taken’

50

Page 55: Verantwoord Meten In Het Gezondheidszorgonderwijs

Indeling en beschrijving van kenmerken van toetsvormen

(dat wil zeggen: taken die een grote gelijkenis vertonen met de taken van een beroepsbeoefenaar in degezondheidszorgsector).De potlood-en-papier–toets omvat in ieder geval op papier aangeboden opgaven; de antwoorden wordenop papier genoteerd en na afloop van de toets ingeleverd.Maar de potlood-en-papier toets biedt meer: deze toetsvorm is vooral geschikt om toepassingsvaardighe-den van een leerling te toetsen die te beschrijven zijn als algoritmische procedures. Algoritmen zijnlogische oplossingsprocedures die gegarandeerd tot de oplossing leiden die de algoritme beschrijft. Zijbieden goede aanknopingspunten voor de formulering van eenduidige beoordelingscriteria.Een goed voorbeeld is een toets die naar aanleiding van verkeersonderwijs afgenomen zou kunnenworden. De toetsitems zijn op papier gepresenteerde verkeerssituaties. De leerling moet die oplossen doorbijvoorbeeld aan te geven welke verkeersdeelnemer voorrang heeft. Met zo’n toets kan vastgesteldworden of de leerling de voorrangsregels op toepassingsniveau beheerst, maar niet of hij die in hetverkeer zelf correct kan uitvoeren. Daarvoor is de toets te veel een reductie van de complexewerkelijkheid. De snelheid waarmee de verkeerssituatie beoordeeld moet worden, het beperkte overzicht(in vergelijking met de op papier gepresenteerde situaties) en de soms stressvolle situatie maken de toetsen de praktijk tot twee heel verschillende taken.Met potlood-en-papier-toetsen kan dus meer getoetst worden dan alleen maar het herinneren en begrijpenvan leerstof. Ook de toepassing van het geleerde in onbekende contexten kan zo geëvalueerd worden,echter alleen in voorwaardelijke zin. Dat wil zeggen: de toets stelt alleen vast of de leerling weet hoede verworven kennis en vaardigheden in een taaksituatie moeten worden toegepast.Bij algoritmeachtige taken worden oplossingsprocedures toegepast op gelijksoortige taken als tijdens deinstructie/het onderwijs aan de orde zijn gekomen. Hierdoor onderscheidt de potlood-en-papier toets zichvan de casustoets. Bij een casustoets bestaat de mogelijkheid om een diversiteit aan problemen aan tebieden, die niet als algoritmen te kenschetsen zijn. Overigens kan ook bij een potlood-en-papier-toetseen korte situatieschets een goed startpunt zijn.In termen van Romiszowski gaat het bij potlood-en-papier-toetsen om productieve, cognitievevaardigheden. Het cognitieve karakter van deze toetsvorm komt tot uitdrukking in het feit dat het vooralgaat om plannen, beslissingen nemen, keuzen maken, problemen oplossen en logisch denken.Het gaat daarnaast om productieve vaardigheden, omdat de leerling met nieuwe situaties wordtgeconfronteerd, dat wil zeggen situaties die niet exact gelijk zijn aan de taken die tijdens hetonderwijsleerproces aan de orde zijn gekomen. Het vraagt probleemoplossend vermogen met betrekkingtot een nieuwe probleemstelling. Kenmerkend voor productieve vaardigheden is het blijvend belang vanhet planningselement om tot de juiste uitvoering te komen.Zoals gezegd gaat het bij de potlood-en-papier-toets om taken waaruit moet blijken dat de leerling eenproductieve, cognitieve vaardigheid beheerst. Cognitieve vaardigheden zijn echter een reductie vangeïntegreerde vaardigheden. Hoewel alle vaardigheden (cognitieve, reactieve, etc.) vaak zeer verwevenzijn, en voor het uitvoeren van de meeste beroepstaken in de zorgsector meerdere vaardigheden uitverschillende categorieën tegelijkertijd nodig zijn, worden bij het maken van potlood-en-papier-toetsenvoor beroepsopleidingen alléén de cognitieve vaardigheden als uitgangspunt genomen, maar het gaat danwel om complexere denkactiviteiten (productieve, cognitieve vaardigheden).Anders gezegd: het gaat om een reductie van de werkelijkheid tot het niveau van het productieve,cognitieve aspect van de taakuitvoering, om een eenzijdige gerichtheid op de cognitieve component.Overigens worden deze cognitieve vaardigheden in de potlood-en-papier-toets niet alleen beoordeeld opgrond van een eindresultaat (een definitieve keuze, een oplossing) maar ook en vooral op grond van hetdenkproces dat tot dit resultaat geleid heeft. De registratie van het denkproces vindt indirect plaats,bijvoorbeeld doordat de leerling zijn keuzen of beslissingen in het denkproces schriftelijk vastlegt.Een potlood-en-papier-toets mag echter niet geassocieerd worden met een kennistoets (kennis in de zinvan Romiszowski). Er kan namelijk méér getoetst worden dan alleen maar het herinneren/herkennen enbegrijpen van feiten, concepten e.d. Zo is het bijvoorbeeld met deze toetsmethodiek mogelijk om

51

Page 56: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 4

ontwerpvaardigheden en afleesvaardigheden vast te stellen. In paragraaf 7.4 zullen deze beidevaardigheden worden toegelicht aan de hand van voorbeelden.

Potlood-en-papier-toetsen zijn aantrekkelijk vanwege het gemak waarmee grote aantallen leerlingen

tabel 17 - Potlood-en-papier-toetsen

kwaliteitsaspect kwaliteitsindicatie

representativiteit

betrouwbaarheid

organisatie/logistiek

financieel: productie

afname

tegelijkertijd getoetst kunnen worden. Het toetsen door middel van potlood-en-papier-toetsen is niet zoarbeidsintensief. Er hoeft geen gebruik gemaakt te worden van dure of extra materialen. Behalve dat dekostprijs laag is ten aanzien van het gebruik, geldt dit ook ten aanzien van de constructie. Oporganisatorisch vlak zijn er weinig obstakels.Het belangrijkste nadeel schuilt in de mogelijk slechte ’fit’ tussen dat wat getoetst wordt en devaardigheid waarover eigenlijk een uitspraak moet worden gedaan. De mate van representativiteit voorde reële werksituatie is over het algemeen laag.Overigens hoeft dit niet altijd het geval te zijn. Het komt voor dat de vaardigheid waarop met eenpotlood-en-papier-toets een beroep wordt gedaan, zeer sterk overeenkomt of identiek is aan devaardigheid die in de reële werksituatie vereist is. Denk bijvoorbeeld aan een vaardigheid als hetbijwerken van een patiëntenkaart door een doktersassistente. Een potlood-en-papier-toets waarin dezevaardigheid bevraagd wordt, is uiteraard zeer representatief.

4.2.5 Computersimulatie, beeldplaat

Net als de potlood-en-papier-toets is de computersimulatie een toetstechniek waarmee alleen vastgesteldkan worden of een leerling weet hoe hij zou moeten handelen. Daartoe geeft een leerling aan wat hij ineen bepaalde situatie zou doen, zonder daar uitvoering aan te geven. Het gaat ook hier derhalve omcognitieve vaardigheden. De representativiteit kan echter hoger zijn, omdat voor het vormgeven van hetuitgangsmateriaal de nog steeds groeiende mogelijkheden van de multimedia benut kunnen worden.Computersimulaties bieden daarom een tamelijk realistische context voor het vaststellen van debekwaamheid om problemen op te lossen of beslissingen te nemen in complexe taaksituaties.Computersimulaties kunnen door hun eenzijdige gerichtheid op de cognitieve component meestal nietdienen als vervanging van de proeve van bekwaamheid in de werksituatie zelf. Maar op de weg daarheenkunnen ze een waardevol instrument zijn om tijdig hiaten of tekortkomingen in de betreffendevaardigheid vast te stellen.De structuur van dergelijke computersimulaties is in grote lijnen dezelfde: de leerling wordt in eentaaksituatie geplaatst met de opdracht om voorkomende problemen op te sporen en die vervolgens opte lossen. Het oplossingsproces kenmerkt zich veelal door de volgende fasen: informatie verzamelen overhet probleem, definitieve probleemstelling formuleren, kiezen van een oplossing en evalueren van hetresultaat. Bij de beoordeling wordt de weg waarlangs de oplossing bereikt werd heel expliciet inbeschouwing genomen.Een goed voorbeeld van een computersimulatie is het oefen- en toetsprogramma ’Triage’ dat ontwikkeldis voor de Koninklijke Landmacht. Triage is een voorschrift voor de handelwijze van artsen bijcalamiteiten. Het voorschrift is erop gericht zoveel mogelijk slachtoffers te helpen. Dit betekent dat

52

Page 57: Verantwoord Meten In Het Gezondheidszorgonderwijs

Indeling en beschrijving van kenmerken van toetsvormen

alleen levensreddende handelingen uitgevoerd mogen worden. Dit druist in tegen de medische ethiek vande arts onder normale omstandigheden, die een patiënt zo volledig mogelijk wil helpen.Het programma stelt militaire artsen in staat hun kennis en vaardigheid toe te passen onder gesimuleerdeomstandigheden. Bij de start van de simulatie kiest het programma vijf gewonden uit de databank. Detaak van de arts is om de conditie van zoveel mogelijk gewonden zodanig te stabiliseren dat ze vervoerdkunnen worden naar een locatie waar ze volledig behandeld kunnen worden. Op basis van het tijdstipen de ernst van de verwondingen wordt voor elke gewonde de beginconditie berekend. Het programmageeft vervolgens een korte beschrijving van elke gewonde: voorgeschiedenis en aard van de verwonding.Dit wordt ondersteund met beelden. Vervolgens gaat de klok lopen en kan de arts elke gewonde, in eenzelf te bepalen volgorde, onderzoeken of behandelen. Na elk onderzoek/behandeling wordt de klokzoveel verder gezet als overeenkomt met de tijd die het onderzoek of de behandeling in werkelijkheidzou hebben gekost. De tijd dat de arts niets doet, loopt de klok met normale snelheid. De conditie vande gewonden wordt voortdurend herberekend naar de actuele kloktijd van de simulatie. Als de toestandvan een gewonde kritiek wordt verschijnt een waarschuwing op het scherm (niet bij toetsing). Desimulatie eindigt als alle gewonden zijn overleden of afgevoerd. Na afloop kan men op verschillendemanieren geïnformeerd worden over de prestaties. Het programma kan de prestatie (in termen vantijdsduur en gemaakte fouten) vergelijken met die van andere artsen. In de tweede plaats kan de volgordewaarin de slachtoffers behandeld zijn kritisch beschouwd worden. Een andere mogelijkheid is om eenoverzicht te krijgen van ten onrechte uitgevoerde behandelingen en van ten onrechte nagelatenbehandelingen.

In vergelijking met het aanbieden van een probleemsituatie op papier is de meerwaarde van de computer

tabel 18 - Computersimulatie (beeldplaat, CD-i)

kwaliteitsaspect kwaliteitsindicatie

representativiteit

betrouwbaarheid

organisatie/logistiek

financieel: productie

afname

vooral gelegen in de mogelijkheid om dynamische problemen aan te bieden. Dat wil zeggen problemenwaarvan de aard kan veranderen als gevolg van de acties die de leerling ’uitvoert’. Ingeval van eenmedische computersimulatie bijvoorbeeld betekent dit dat patiënten nieuwe klachten kunnen krijgen alsgevolg van een ’uitgevoerde’ behandeling. Een ander belangrijk voordeel van de computer is dat achterafhet oplossingsproces opgevraagd en beoordeeld kan worden. Het is ook mogelijk dat het oplossingspro-ces door het computerprogramma zelf gescoord wordt en dat de leerling onmiddellijk na afloop uitslagkrijgt.De computer biedt ook veel mogelijkheden voor het aansluiten van allerlei randapparatuur. Dit kan denatuurgetrouwheid sterk bevorderen. Door middel van interactieve video of cd–i kan het geschrevenwoord vervangen of ondersteund worden door beeldmateriaal en/of gesproken woord. De keerzijde vandie hogere natuurgetrouwheid betreft de ontwikkelingskosten. Bij dergelijke multimedia-toepassingen zijndeze aanzienlijk hoger dan bij computersimulaties die alleen gebruikmaken van tekst. De constructie vaneen computersimulatie vraagt echter in alle gevallen een deskundigheid die de reikwijdte van dithandboek te buiten gaat. In paragraaf 7.5 zal daarom alleen een voorbeeld beschreven worden van eendergelijke toets. Aanwijzingen voor de constructie, zoals in de overige paragrafen van hoofdstuk 6,blijven achterwege.

53

Page 58: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 4

4.2.6 Simulator

Terwijl de patiëntsimulatie vooral gericht is op het toetsen van vaardigheden waarin sociaal-communicatieve aspecten een belangrijke rol spelen, is de simulator, net als de skill sample test, vooralbedoeld om de technische kant van een vaardigheid te toetsen. Het verschil met de skill sample test isdat de simulator vooral wordt ingeschakeld als het gaat om vaardigheden die in hun uitwerking vervelendof bedreigend kunnen zijn voor mensen.

Een simulator is een apparaat dat sterk lijkt op (een onderdeel uit) de werkomgeving van een bepaalde

tabel 19 - Simulator

kwaliteitsaspect kwaliteitsindicatie

representativiteit

betrouwbaarheid

organisatie/logistiek

financieel: productie

afname

= kwaliteitsindicatie voor fantoom

functionaris. Hij wordt gebruikt voor de training en toetsing als het gebruik van de echte uitrusting(vervoermiddel, bedieningsapparatuur, instrumenten) niet haalbaar is. Bijvoorbeeld omdat de echteuitrusting continu in gebruik is voor productiedoeleinden (denk aan de procesindustrie), omdat deoperationele kosten van het gebruik van de echte uitrusting te hoog zijn (denk bijv. aan de opleiding voorvlieger in de burgerluchtvaart) of omdat aan het gebruik van de echte uitrusting gevaren zijn verbondenvoor de leerling of diens omgeving (denk aan de opleiding van stuurman voor de grote vaart). Ook inde gezondheidszorgopleidingen wordt de simulator zinvol ingezet, alleen wordt daar meestal van’fantoom’ gesproken. Bekende voorbeelden zijn de fantoomkop uit de opleiding voor tandarts diegebruikt wordt voor training en toetsing van ’boren en vullen’ en de ’dummy’ die inEHBO-opleidingengebruikt wordt voor training en toetsing van het beademen van bewusteloze mensen.Hoewel leerlingen zich bewust zijn van de kunstmatige situatie waarin ze verkeren, kunnen sommigesimulatoren de reële werksituatie zeer dicht benaderen. Dit is met name het geval bij simulatoren dievallen in de categorie ’virtual environment’. Dit is een kunstmatige werkomgeving die als gevolg vanallerlei technische aanpassingen door mensen als zeer realistisch wordt ervaren. In Canada wordt een VE-systeem gebruikt in de opleiding voor jachtvlieger bij het onderdeel ’luchtgevecht’. De piloot zit in eensimulator en draagt een helm die volledig lichtdicht is. Op zijn ogen wordt een stereoscopisch beeldgeprojecteerd en twee ingebouwde speakers zorgen voor de akoestische illusie. Een uiterst krachtigecomputer zorgt ervoor dat de kunstmatige omgeving op een natuurlijke manier reageert op de gebruiker.Als deze bijvoorbeeld zijn hoofd naar links draait, moet hij het beeld naar rechts zien verschuiven. Ookde akoestiek moet automatisch worden aangepast. De helm zorgt ervoor dat de menselijke waarnemingbijna volledig gedicteerd wordt door de computer. De simulatie is zó natuurgetrouw dat de piloot een’noodknop’ tot zijn beschikking heeft waarmee hij de simulatie kan afbreken teneinde ongewenstelichamelijke reacties te voorkomen (SURF, 1993).Gebruikt in een toetssituatie biedt de VE een zeer hoge natuurgetrouwheid gekoppeld aan een hoge graadvan standaardisatie.Het grootste voordeel van de simulator is dat ook zeldzame, gevaarlijke en dure taken voorgelegd kunnenworden aan leerlingen. Doordat elke leerling geconfronteerd kan worden met identieke taken, kanbeoordeling plaatsvinden op grond van een standaard–beoordelingsvoorschrift. Ook automatischeregistratie en beoordeling behoren soms tot de mogelijkheden. Daarvoor is vereist dat de simulator

54

Page 59: Verantwoord Meten In Het Gezondheidszorgonderwijs

Indeling en beschrijving van kenmerken van toetsvormen

’gestuurd’ wordt door een computer en dat de beoordelingscriteria zo eenduidig geformuleerd kunnenworden dat machinale scoring mogelijk is.Een cruciale vraag bij de inzet van de simulator voor toetsdoeleinden is natuurlijk of de toetsprestatiegeldigheid bezit voor de reële werksituatie. Dit zal voor elke nieuwe toepassing uitgezocht moetenworden. Soms is er weinig keuze: of een piloot voldoende competent is met betrekking tot het uitvoerenvan noodprocedures is niet in de reële werksituatie te toetsen. In algemene zin geldt dat het veilig is omop basis van een simulatortoetsing alleen conclusies te trekken over de competentie in technisch opzicht,gedemonstreerd onder gestandaardiseerde omstandigheden. Als hiervan sprake is, is het verantwoord omde leerling toe te laten tot de oefenfase waarin de betreffende vaardigheid wordt toegepast onderrealistische werkomstandigheden. Deze fase kan vervolgens worden afgesloten met een toets waarin metechte of simulatiepatiënten gewerkt wordt.Een belangrijk nadeel van de simulator vormen vaak de kosten. De aanschafprijs voor complexesimulatoren is dermate hoog dat terugverdienen vaak alleen mogelijk is voor opleidingen waarin detraining van de vaardigheid in de reële werksituatie ook zeer hoge kosten met zich meebrengt. Een andernadeel heeft betrekking op de bruikbaarheid: met een simulator kan slechts één leerling tegelijk getoetstworden zodat een toets veel tijd in beslag zal nemen als het aantal leerlingen groot is.

4.2.7 Skill sample test

De skill sample test lijkt op de work sample test (zie par. 4.2.9) in die zin dat het gaat om een steekproefuit een groot aantal relevante vaardigheden.

Het verschil is gelegen in het feit dat bij de skill sample test de aandacht exclusief uitgaat naar de

tabel 20 - Skill sample test

kwaliteitsaspect kwaliteitsindicatie

representativiteit

betrouwbaarheid

organisatie/logistiek

financieel: productie

afname

vaardigheid zelf en niet naar de omstandigheden waaronder die wordt uitgevoerd. De te toetsenvaardigheden kunnen gericht zijn op mensen of op apparatuur, instrumenten, e.d. Het bepalen van delongcapaciteit met een spirometer is bijvoorbeeld een vaardigheid die zich goed leent om met behulp vaneen skill sample test te worden vastgesteld. Omdat het vooral gaat om het technisch correct uitvoerenvan een procedure kan elke persoon (bijv. een medeleerling) dienen als ’patiënt’ waarop de vaardigheidgericht is. Echte patiënten of simulatiepatiënten zijn niet nodig. Natuurlijk is deze techniek niet bruikbaarals het gaat om vaardigheden die in hun uitwerking vervelend of zelfs bedreigend kunnen zijn voordegenen op wie ze gericht zijn. Voor dergelijke vaardigheden moet worden uitgeweken naar desimulator.

4.2.8 Patiëntsimulatie

De patiëntsimulatie komt als toetsvorm tegemoet aan een belangrijke tekortkoming van de work sampletest (zie par. 4.2.9), namelijk de beperkte mogelijkheden om het verloop van de toets te kunnencontroleren. In een work sample test wordt met echt materiaal, echte apparatuur en echte mensen gewerktonder reële werkomstandigheden. Zeker als de te toetsen vaardigheid gericht is op het bieden van hulp

55

Page 60: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 4

aan mensen komt de voorspelbaarheid van de uitvoering van de vaardigheid onder druk te staan. Depatiëntsimulatie biedt hiervoor een oplossing door de interacties tussen de leerling en degene op wie devaardigheid gericht is, volgens een van tevoren uitgewerkt plan te laten verlopen. Op die manier wordthet mogelijk díe (deel)vaardigheden uit te lokken waarnaar de interesse uitgaat en deze te beoordelenaan de hand van een beoordelingsvoorschrift. De patiëntsimulatie leent zich bij uitstek voor het toetsenvan complexe vaardigheden; dat zijn vaardigheden die als gevolg van het grote aantal beslissingen datmoet worden genomen, op veel verschillende manieren kunnen worden uitgevoerd. Doorgaans is het nietmogelijk bij het opstellen van een beoordelingsvoorschrift rekening te houden met alle mogelijkeuitvoeringsvarianten. Door het voorschrijven van een ’rol’ wordt het aantal verschillende uitvoeringsvari-anten drastisch beperkt en kan worden volstaan met een hanteerbaar beoordelingsvoorschrift.

Een voorbeeld van een patiëntsimulatie is hetEHBO-examen dat wordt afgenomen door het Amerikaanse

tabel 21 - Patiëntsimulatie

kwaliteitsaspect kwaliteitsindicatie

representativiteit

betrouwbaarheid

organisatie/logistiek

financieel: productie

afname

exameninstituut National Registry of Emergency Medical Technicians (Priestley, 1982). In dit examenworden leerlingen op zes tot acht ’stations’ getoetst op hunEHBO-vaardigheden. Een station is een plaatsin of buiten het examengebouw waar een gewonde ligt die onmiddellijke hulp behoeft. Elk station doeteen beroep op een ander type vaardigheid. Bij binnenkomst van een station krijgt een leerling korteinformatie en instructies. Met behulp van geprogrammeerde patiënten wordt een ongevalssituatie zeerrealistisch weergegeven. De ’patiënten’ zijn zodanig aangekleed en geschminkt dat ze er als slachtoffersuitzien en ze gedragen zich alsof ze veel pijn hebben. De verrichtingen van de leerlingen wordenwaargenomen door examinatoren en gescoord aan de hand van een checklist. Daarop wordt preciesaangetekend wanneer (na hoeveel minuten) welke verrichting is uitgevoerd en of de uitvoering al danniet acceptabel was.

Grootste nadeel van de patiëntsimulatie schuilt in de organisatie. Anders dan bij de work sample test isde beschikbaarheid van ’cases’ geen probleem meer: zelfs de meest zeldzame gevallen kunnen wordenvoorgelegd. Maar de voorbereidingen voor de afname zijn nog omvangrijker dan bij de work sample test(schrijven van een script, instructie van acteurs).

4.2.9 Work sample test / praktijktoetsing op de werkplek

Van de verschillende toetsmethodieken die onderscheiden kunnen worden voor het meten vanvaardigheden is de ’work sample test’ de toetstechniek met de beste aansluiting bij de reële werksituatie(Straetmans, 1993). Om de Engelse term te vermijden, spreken wij over toetsing op de werkplek. Bijdeze toetsvorm gaat het om een gecontroleerde uitvoering van een vaardigheid onder reële werkomstan-digheden. ’Gecontroleerd’ wil zeggen dat de vaardigheid doelbewust wordt uitgelokt door de leerlingeen bepaalde taak voor te leggen. Hierin onderscheidt de work sample test zich van de observatie. Bijhet gebruik van laatstgenoemde techniek moet de observator passief afwachten totdat het gewenstegedrag zich voordoet. De techniek van de bewuste uitlokking maakt het tevens mogelijk het gedrag ingrote lijnen te voorspellen. Dit biedt aanknopingspunten voor gestandaardiseerde beoordeling aan de hand

56

Page 61: Verantwoord Meten In Het Gezondheidszorgonderwijs

Indeling en beschrijving van kenmerken van toetsvormen

van beoordelingsvoorschriften. Dit laatste is alleen zinvol als er duidelijke uitvoeringsroutines zijn voorde betreffende vaardigheid die in het voorafgaande onderwijs getraind zijn.Een vaardigheid die zich goed leent om te worden vastgesteld met behulp van een work sample test isbijvoorbeeld het meten van de bloeddruk bij een patiënt/cliënt/bewoner. Deze vaardigheid kan vrijeenvoudig worden ontleed in een aantal achtereenvolgens uit te voeren stappen, die algemeen (op bijnaelke persoon) toepasbaar zijn en door de meeste leerlingen als zodanig verworven zijn. Overigens zaldaarbij dan niet het accent liggen op het beoordelen van instrumenteel-technische vaardigheden, omdatdaarvoor andere toetsmethodieken meer aangewezen zijn, zoals skill sample test of de patiëntsimulatie.Juist omdat gebruik wordt gemaakt van echte patiënten in reële situaties, is er de mogelijkheid om dereactieve en interactieve vaardigheden van de leerling te beoordelen.Beroepstaken die een zware wissel trekken op dergelijke vaardigheden, zoals het voeren van eenopname-gesprek, verdienen het dan ook om op de werkplek beoordeeld te worden. Een voorbeeld vaneen speciaal daarvoor ontwikkeld instrument is opgenomen in paragraaf 7.9.

Het lastigste punt bij de organisatie is de beperkte beschikbaarheid in de werksituatie van apparatuur,

tabel 22 - Work sample test (praktijktoetsing op de werkplek)

kwaliteitsaspect kwaliteitsindicatie

representativiteit

betrouwbaarheid

organisatie/logistiek

financieel: productie

afname

materiaal en cases. Met ’cases’ wordt het volgende bedoeld: als een leerling getoetst moet worden opzijn vaardigheid een gipsverband aan te leggen dan is daarvoor de aanwezigheid vereist van een patiëntmet een botbreuk. Wanneer echter meer de nadruk wordt gelegd op het generieke aspect (de reactieveen interactieve vaardigheden) en minder op de instrumenteel-technische handeling, zouden meer situatiesin aanmerking kunnen komen: elke situatie waarbij sprake is van het aanleggen of verwisselen van eenverband is dan in principe geschikt als toetssituatie.

In tabel 22 worden de sterke en zwakke punten van deze toetsvorm weergegeven:– De representativiteit is optimaal: de verpleegsituaties waarin toetsing plaatsvindt, zijn levensecht,

waardoor niet alleen de vaardigheid op zich beoordeeld kan worden maar ook de inpassing daarvanin het volledige verpleegkundig handelen (m.n. de omgang met de patiënt, het rekening houden methet gehanteerde verpleegsysteem e.d.). Een voorwaarde is dan wel dat de leerling het niveau van eenbeginnend beroepsbeoefenaar heeft. De leerling moet immers niet alleen de vaardigheid op zichbeheersen maar ook voldoende kennis hebben van bijvoorbeeld de aandoening van de patiënt.Er zijn wel enkele beperkingen:. niet alle vaardigheden kunnen altijd getoetst worden, omdat de vereiste situatie zich niet

voordoet;. omdat er sprake is van echte patiënten, is niet elke situatie geschikt als beoordelingssituatie: soms

is het immers medisch of ethisch onverantwoord om een leerling in een acute of emotionelesituatie te beoordelen.

– Naar de betrouwbaarheid van deze toetsvorm is nog weinig onderzoek gedaan. Uit onderzoek vanSchotten en Stolk (1995) is gebleken dat de betrouwbaarheid vrij laag ligt, hetgeen dus directconsequenties heeft voor de validiteit. Wel heeft het genoemde onderzoek suggesties opgeleverd omde betrouwbaarheid te verbeteren.

57

Page 62: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 4

– Het construeren van een beoordelingslijst kost veel tijd en onderling overleg. De te beoordelenvaardigheden moeten in kaart worden gebracht. Doordat de toetssituatie niet gestandaardiseerd kanworden, moeten de beoordelingsaspecten ruim geformuleerd worden. Dit houdt tevens in dat debeoordelaars het eens moeten zien te worden over de te hanteren beoordelingscriteria.

– De verpleegsituaties waarin toetsing plaatsvindt zijn vrijwel altijd voorhanden, tenzij het om zeerzeldzame vaardigheden gaat. Het gaat immers niet om een nieuw toetsmoment, maar om hetverbeteren van de huidige methode van ’observeren en aftekenen’: iedere leerling wordt op dezelfdeaspecten beoordeeld, waardoor een grotere mate van standaardisatie (en daarmee van objectiviteit)in de beoordeling ontstaat. Door het vastleggen van procedures en expliciteren van voorwaarden kande betrouwbaarheid worden bevorderd.

– De toetsing is organisatorisch relatief eenvoudig, omdat de leerling in principe gewoon zijn werkdoet. Uiteraard kan er per toetsmoment maar één leerling worden beoordeeld.

– De toetsing is qua uitvoering relatief goedkoop, in vergelijking met het opzetten van complexesimulatiesituaties.

58

Page 63: Verantwoord Meten In Het Gezondheidszorgonderwijs

5 Beslissingen en activiteiten op curriculumniveau

In de voorafgaande hoofdstukken is beschreven welke plaats beoordelen in het didactische proces kanhebben, welke functies daaraan toegekend kunnen worden en aan welke eisen het meten vanleerresultaten moet voldoen om verantwoorde beslissingen te kunnen nemen. Ten slotte werden deverschillende toetsvormen kort gepresenteerd.Voordat beschreven gaat worden hoe de constructie van de gepresenteerde toetsvormen aangepakt kanworden, is het noodzakelijk om na te gaan aan welke toetsvormen behoefte bestaat en welk soortuitspraak men op basis daarvan wil doen. Dit zijn zaken die op curriculumniveau geregeld moetenworden.In dit hoofdstuk wordt beschreven voor welke afwegingen men komt te staan op curriculumniveau: debeschikbare middelen (materiaal, mensen) moeten zo verdeeld worden over de verschillendetoetsmomenten dat de verzamelde gegevens niet alleen betrouwbaar en valide zijn, maar ook optimaalsturing geven aan het onderwijsproces.Het document waarin deze afwegingen hun beslag krijgen, is de onderwijs- en examenregeling.

5.1 Onderwijs- en examenregeling

Het is voor elke opleiding van belang een onderwijs- en examenregeling vast te stellen. In paragraaf 9.5wordt uitgebreid ingegaan op de invulling hiervan. Op dit moment is het voldoende om te vermeldendat in de onderwijs- en examenregeling wordt vastgelegd wat de toetsinhouden zijn, welke toetsmomen-ten er per studiejaar zijn en welke toetsvormen er gebruikt zullen worden.In de volgende paragrafen wordt nader ingegaan op de toetsinhouden, de toetsmomenten en detoetsvormen. Enkele andere zaken waaraan op curriculumniveau aandacht moet besteden, wordenhieronder kort aangestipt.– Voor de toetsen, waarvoor dit relevant is, zal de wijze waarop de externe legitimering plaatsvindt,

aangegeven moeten worden.– Verder zal de tijdsduur van de toetsen bepaald moeten worden. Het is moeilijk om hier algemene

regels voor op te stellen. Vaak spelen ervaring en traditie een rol bij het bepalen van de tijdsduur.Belangrijk is dat bij vaardigheidsdoelen snelheid een rol kan spelen bij de beoordeling en dat bijkennistoetsen voldoende tijd wordt geboden aan de leerlingen om tot een goed antwoord te komen.Als regel wordt voor een toets met 30 à 40 meerkeuzevragen een uur gerekend, voor parate kennis.

– Het aantal herkansingen wordt vermeld.– Verder is de vraag naar het combineren van toetsresultaten van belang. Als er meer toetsen te maken

zijn bij één examenonderdeel, kan men dan aangeven volgens welke regels toetsresultatengecombineerd moeten worden om te kunnen bepalen of leerlingen geslaagd of gezakt zijn voor hetexamenonderdeel?Deze vraag is altijd relevant, waar meer dan één toets wordt afgelegd bij één certificaateenheid. Menkan hierbij denken aan het compenseren van onvoldoende resultaten op één toets met goederesultaten op een andere toets (compensatie), elke toets moet voldoende zijn (conjunctie) of aan eenminimumaantal voldoende toetsen (disjunctie).

59

Page 64: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 5

5.1.1 Toetsinhouden

Een leerstofbeschrijving kan eenvoudig afgeleid worden uit het curriculum. Hierin staat immersbeschreven op welk moment in de opleiding welke leerdoelen bereikt moeten zijn en/of welke leerstofbehandeld moet worden.De inhoud van de toetsen wordt gespecificeerd uit de leerstof. In principe is alle leerstof potentiëletoetsstof. Een toets is dan een representatieve steekproef uit deze leerstof.Over het algemeen wordt de stelregel gehanteerd dat die leerstof waar de meeste onderwijstijd in wordtgeïnvesteerd, belangrijke leerstof is, die beslist getoetst moet worden.Welke criteria spelen een rol bij het specificeren van de inhoud van de toets?– de tussen- en eindtermen van de opleiding;– de tijdsduur van bepaalde leerstofonderdelen (in het leerplan is meer tijd beschikbaar voor het ene

onderdeel dan voor een ander onderdeel);– de tijdsduur van verschillende onderwerpen binnen bepaalde leerstofonderdelen (aan het opmaken

van een bed (verpleegkunde) wordt over het algemeen minder tijd besteed dan aan het lerentoedienen van een injectie).

Voor deze specificatieronde kan een toetscommissie van docenten worden gevormd. Deze toetscommissiestelt het aantal toetsen vast, specificeert de inhoud en verdeelt de te toetsen leerstof over de verschillendetoetsmomenten.Indien gewerkt wordt met modulen kan elke module worden afgesloten met een toets, die zo nodig eenvrijstelling geeft voor de afsluiting van een bepaald toetsonderdeel. Het is raadzaam om ook deleerstofonderdelen (vakken, modulen of thema’s) waarin de toetsstof aan bod komt, te noemen.Het verdient aanbeveling om op dit niveau een toetsmatrijs op te stellen.

5.1.2 Toetsmomenten

Het roosteren van tijdstippen van de afname behoort bij de organisatie van de toetsing. Hier wordt opmeer algemene gronden bepaald wanneer de toetsing van dit speciale onderwerp plaatsvindt. Belangrijkhierbij is de voorwaardelijkheid van de toetsen ten opzichte van elkaar. Bij een ’eindexamen’ behoeftmen hier geen rekening mee te houden en bij toetsen die alle op eindtermniveau toetsen, zal dit ook geenprobleem vormen. Uit ervaring blijkt dat bij het toetsen van modulen, de kennis en vaardigheden vande ene module voorwaardelijk kunnen zijn voor de kennis en vaardigheden van andere modulen. Het isdan zaak om deze volgorde van inhouden vast te leggen.Bij het vaststellen van de toetsmomenten moet men zich ook realiseren dat van toetsing een sterkesturing uitgaat naar de leerlingen. Er wordt weleens gesteld dat ’wat niet getoetst wordt ook niet geleerdwordt’. Misschien is dat te sterk uitgedrukt, maar feit is wel dat leerlingen regelmatig informatie moetenkrijgen over hun leerproces. Soms is de leerstof zelf-evaluerend, in de meeste gevallen zal die informatievia meting verkregen moeten worden.Ook degene die onderwijs geeft, heeft van tijd tot tijd behoefte aan informatie over de voortgang vanhet onderwijsproces. Zulke momenten zullen in de onderwijs- en examenregeling ingebouwd moetenworden. Per toetsmoment moet derhalve aangegeven worden welke functie aan de desbetreffende toetswordt toegekend. Dit heeft immers consequentie voor de eisen die er aan de toets gesteld worden. Ditis in tabel 23 schematisch weergegeven.Het belangrijkste uitgangspunt bij de eisen die aan het toetsinstrument gesteld moeten worden, zijn deconsequenties die er voor de leerling aan verbonden zijn. Hoe groter die consequenties zijn, in de zinvan zakken of leerstof herhalen, hoe betrouwbaarder de meting moet zijn. Ook de verlangde validiteitverandert daarmee: een diagnostische toets moet de leerstof zo goed mogelijk dekken (inhoudsvaliditeit),een certificerende toets moet een betekenisvolle score opleveren (dit wordt wel aangeduid metbegripsvaliditeit) of een aantoonbaar verband hebben met een objectieve maat buiten de toets, zoalssucces in een vervolgopleiding (criteriumvaliditeit).

60

Page 65: Verantwoord Meten In Het Gezondheidszorgonderwijs

Beslissingen en activiteiten op curriculumniveau

5.1.3 Toetsvormen

tabel 23 - Toetsfuncties en kwaliteitseisen

diagnosticering onderwijsevaluatie selectie en certificering

wie betreft het individuen groepen kandidaten individuen

consequentie voor leer-ling

gering gering of groot groot

vereiste toetskenmerken:

• vergelijkbaarheidinformatie

gering groot groot

• objectieve scoring nee ja ja

• gestandaardiseerdeverwerking

nee ja ja

vereiste informatie:

• gedetailleerd of alge-meen

gedetailleerd(aanknopingspunten voorremediëring)

algemeen algemeen

• frequentie regelmatig gedurendeeen schooljaar

eenmaal per jaar of min-der

afhankelijk van mate vanflexibilisering

• onmiddellijk beschik-baar

ja nee nee

technische eisen:

• betrouwbaarheid kan wisselen groot zeer groot

• soort van bewijs voorvaliditeit

inhoudsvaliditeit bij ’geringe consequen-ties’: inhoudsvaliditeitbij ’grote consequenties’:constructvaliditeit

inhoudsvaliditeit plusaanvullende informatieover validiteit in verbandmet specifiek toetsdoel

De volgende beslissing die genomen moet worden is die van de toetsvorm. Eerder (zie par. 2.5.1) isbetoogd dat de toetsvorm moet aansluiten bij het te toetsen leerdoel (en bij de wijze waarop dit isaangeleerd). Om praktische redenen zal dat niet altijd mogelijk zijn. Er moet echter rekening mee wordengehouden dat leerlingen geneigd zijn om bij het bestuderen van de stof uit te gaan van de wijze waaropdeze leerstof in de toets aan de orde wordt gesteld: worden alleen de feiten bevraagd of is er ook eniginzicht nodig? In het eerste geval zal de leerling zich vooral richten op het memoriseren van de stof, inhet tweede geval zal hij op zoek gaan naar samenhangen. Ook de voorbereiding op een schriftelijke toetszal anders zijn dan op een praktische toets. Opleidingen hebben de taak zich ervan te vergewissen datuiteindelijk de eindtermen getoetst worden. Dat kan niet door alleen maar vragen te maken entoetsvormen te kiezen die vrij gemakkelijk te construeren zijn.In tabel 24 zijn enkele overwegingen te zien, die een rol spelen bij het kiezen van de meest geschiktetoetsvorm. Hierbij wordt uitgegaan van een taak die een beroep doet op een mix van vaardigheden.Uiteraard komen in de hoog representatieve toetsvormen ook cognitieve en of psychomotorischevaardigheden aan de orde, maar de aandacht zal in meeste gevallen vooral gericht zijn op de reactieveen interactieve aspecten van de taak, ervan uitgaande dat de cognitieve en psychomotorische aspectenop een eerder moment in een beter controleerbare situatie zijn getoetst.Het schema in tabel 25 geeft een nuancering van tabel 24. De dimensie ’representativiteit’ is nuuitgesplitst in ’omvattendheid’ en ’natuurgetrouwheid’. Bestudering maakt direct duidelijk wat het groteprobleem is van de toetsconstructeur: voor vier van de zes toetstechnieken is het niet goed mogelijk omzowel de omvattendheid als de natuurgetrouwheid te bevorderen. Dit betekent ofwel dat conclusies over

61

Page 66: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 5

competentie beperkt moeten blijven tot de taak die in de toets werd aangeboden (ingeval van work

tabel 24 - Overwegingen bij het kiezen van de juiste toetsvorm

representativiteit(classificatie vlgs.Romiszowski)

overige keuzen toetsvormen mogelijkheden voor verhogen validiteiten betrouwbaarheid

laag(vooral gericht opkennis)

snelle correctiegewenst, veel vragengewenst, veel kandida-ten

meerkeuzevragenvoldoende vragen stellen, gespreid overde leerstof

zelf formulerengewenst, weinig kandi-daten

open vragenvoldoende vragen stellen, gespreid overde leerstof, uitgewerkt correctievoor-schrift, tweede corrector inschakelen

laag - gemiddeld(vooral gericht opcognitieve vaardig-heden)

procedures toepassenpotlood-en-pa-pier

meerdere malen een soortgelijke toetsafnemen

samenhang zien casusmeerdere malen een soortgelijke toetsafnemen

probleem oplossencomputersimula-tie

meerdere malen een soortgelijke toetsafnemen vooral ter verhoging van devaliditeit

gemiddeld(vooral gericht opcognitieve en psy-chomotorische vaar-digheden)

werkelijke uitvoeringbezwaarlijk

simulator

beoordelingscriteria goed uitwerken,meerdere malen een soortgelijke toetsafnemen, tweede beoordelaar inscha-kelen

vaardigheid centraal,omstandigheden nietbelangrijk

skill samplebeoordelingscriteria goed uitwerken,meerdere malen een soortgelijke toetsafnemen

hoog(vooral gericht opreactieve/interactievevaardigheden)

bezwaarlijk voor eenechte patiënt & te simu-leren

patiëntsimulatie

beoordelingscriteria goed uitwerken,tweede beoordelaar inschakelen, stan-daardisatie van de toetssituatie, meer-dere malen een soortgelijke toets afne-men

niet bezwaarlijk vooreen echte patiënt & niette simuleren

work sample

tweede beoordelaar inschakelen, con-sensus proberen te bereiken over dereactieve en interactieve aspecten, meer-dere malen een soortgelijke toets afne-men

sample test en patiëntsimulatie) ofwel dat alleen conclusies getrokken worden over de beheersing vande cognitieve vaardigheden die voorwaardelijk zijn voor competentie (in het geval van computersimulatieen potlood-en-papier-toets). Alleen bij de skill sample test en de simulator lijkt het mogelijk om zowelde omvattendheid als de natuurgetrouwheid te bevorderen, maar nooit tot een niveau dat bij gebruik vanandere toetstechnieken mogelijk zou zijn.

62

Page 67: Verantwoord Meten In Het Gezondheidszorgonderwijs

Beslissingen en activiteiten op curriculumniveau

tabel 25 - Omvattendheid en natuurgetrouwheid van enkele toetsvormen

work sam-ple test

patiënt-simulatie

skill sampletest

simulatorcomputersimulatie

potlood-en-papier

omvattendheid

hoog

mid-den

laag

natuurgetrouw-heid

hoog

mid-den

laag

6 Uitvoeringsniveau: algemene richtlijnen

In de volgende drie hoofdstukken, die alle gericht zijn op het uitvoeringsniveau, worden aanwijzingengegeven voor de constructie, afname en beoordeling van diverse toetsen en beoordelingsinstrumenten.In hoofdstuk 6 worden algemene richtlijnen gegeven voor de constructie vragen en toetsopdrachten; inhoofdstuk 7 worden per vraagvorm specifieke richtlijnen gegeven.In hoofdstuk 8 wordt tot slot ingegaan op de afname van de toets, het verwerken van de gegevens ende correctie. Daarbij wordt tevens ingegaan op de beoordeling van de toetsresultaten.

6.1 Stappenplan voor de constructie van kennistoetsen

In het stroomschema op de volgende bladzijde (afb. 18) staan de stappen die gezet moeten worden bijde constructie van kennistoetsen. Hieronder worden de verschillende stappen nader toegelicht. Sommigestappen (stap 0 en 1: zie par. 3.3.1 en 5.1.1 en stap 5: zie par. 2.3 en 5.1.2) zijn, als het goed is, al vooreen deel genomen zijn op curriculumniveau. Voor de volledigheid zijn deze stappen toch in het schemaopgenomen.’Kennistoets’ is overigens niet helemaal de juiste term, omdat de beschreven procedure uitgaat vancognitieve taken. Wanneer daarvan alleen de onderliggende kenniselementen op een reproductieve maniergetoetst worden, is er sprake van een kennistoets. Binnen de procedure kan echter ook gekozen wordenvoor een accent op probleemoplossende vaardigheden.

0 Inventariseer de cognitieve takenZorg dat er een overzicht beschikbaar is van de kenniselementen en cognitieve taken, die een leerlingmoet beheersen.

63

Page 68: Verantwoord Meten In Het Gezondheidszorgonderwijs

1 Stel een toetsmatrijs opEen toets, ongeacht de omvang ervan, is altijd een steekproef uit de grote hoeveelheid toetsitems die erinopgenomen zouden kunnen worden. Er wordt dan uitgegaan van de veronderstelling dat de responsenop deze geselecteerde deelverzameling typerend zijn voor de responsen op mogelijke anderedeelverzamelingen van items. Maar dit betekent wél dat de toets een representatieve steekproef moet zijn.Een toetsmatrijs is een handig hulpmiddel voor het bewerkstelligen van die representativiteit. Elders isbeschreven hoe een toetsmatrijs kan worden opgesteld.

2 Selecteer de te toetsen leerstofonderdelenEen toetsmatrijs bevat alle concrete doelstellingen van een stuk onderwijs. Zoals eerder opgemerkt, ishet meestal niet mogelijk alle doelstellingen met een of meer items te toetsen. Er moet een selectiegemaakt worden. Het is handig om de selectie in de toetsmatrijs aan te geven door de betreffende cellenmet een textmarker in te kleuren. Bij de selectie moet de toetsconstructeur al enige rekening houden metde tijd die leerlingen beschikbaar hebben om de toets te maken.

64

Page 69: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: algemene richtlijnen

afb. 18 - De constructie van een kennistoets

65

Page 70: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 6

3 Beslis welk aspect getoetst gaat worden: kennis, cognitieve vaardigheden of beideAfhankelijk van de te toetsen vaardigheid, moet gekozen worden voor een bepaalde toetsvorm. Een toetsmet losse gesloten en/of open vragen is uitermate geschikt om kennis (feiten, begrippen) te toetsen.Wanneer kennis moet worden toegepast in een nieuwe situatie en de oplossing is niet via vastealgoritmen te vinden, dan komt een casustoets in aanmerking. Voor het meten van productieve cognitievevaardigheden is een potlood-en-papier-toets geschikt.Overigens is de scheiding tussen de verschillende toetsvormen niet zo absoluut als hier wellichtgesuggereerd wordt. Met meerkeuzevragen kan ook meer dan alleen kennis getoetst worden, eeninleiding op een open vraag kan een kleine casusbeschrijving zijn, sommige casusvragen laten zichalgoritmisch oplossen etcetera. Het onderscheid wordt enkel gemaakt om het beslissingsproces helderte laten verlopen.Waar sprake is van het toetsen van hogere cognitieve vaardigheden ontstaat een raakvlak met het hiernate bespreken stappenplan voor de constructie van vaardigheidstoetsen. Immers, wanneer bij het toetsenvan vaardigheden gekozen wordt om vooral de cognitieve component te toetsen, komt men op dezelfdetoetsvorm uit.

4 Ontwikkel de toetsBij een toets met alleen losse vragen is het ontwikkelen van de toets bijna hetzelfde als het construerenvan de items (zie de volgende stap). Wanneer gekozen wordt voor een casustoets of een potlood-en-papier-toets, moet apart aandacht worden besteed aan het construeren van een casusbeschrijving of eenprobleemsituatie.

5 Construeer de toetsitemsAfhankelijk van de functie die de toets moet gaan vervullen, moeten de items aan bepaalde voorwaardenvoldoen. Bij een summatieve toets moeten de items qua inhoud een evenwichtige en representatieveafspiegeling vormen van de leerdoelen die bereikt moeten worden. De toets is bedoeld om vast te stellenwelke leerlingen wel en welke niet voldoen aan de gestelde norm. Belangrijk is dus dat de vragen ofopdrachten in de toets ’discrimineren’ tussen ’goede’ en ’slechte’ leerlingen. Dit kan vooral bereiktworden door voldoende items in de toets op te nemen met een moeilijkheidsgraad die ligt rondom debeoogde cesuur: wanneer gestreefd wordt naar 25% zakkers, zullen er voldoende items moeten wordengeconstrueerd met een geschatte p-waarde van .75.Ook een formatieve toets moet een evenwichtige en representatieve afspiegeling vormen van de leerstof,zowel qua inhoud als qua moeilijkheidsgraad. De toets hoeft echter geen hoog onderscheidend vermogente hebben in een bepaalde range. Bij de itemconstructie kan men bewust gebruik maken van veelvoorkomende denkfouten, foutieve oplossingsstrategieën e.d. Op die manier verkrijgt men aanknopings-punten voor remediëring.Elk item moet wel bijdragen aan de betrouwbaarheid en validiteit van de toets. Die bijdrage is positiefals het toetsitem:– relevant is (het verlangde antwoord geeft een indicatie over de beheersing van het leerstofonderdeel

dat de vraag beoogt te toetsen);– objectief is (er is geen discussie mogelijk over het goede antwoord);– van het juiste niveau is (de vraag is niet te moeilijk of te gemakkelijk);– differentiërend vermogen heeft (de vraag kan op de juiste wijze onderscheid maken tussen leerlingen

die de stof wel en niet beheersen);– efficiënt is (de investering in lees- en antwoord-gedrag van de leerling en de constructie en

beoordelingsinspanning van de docent moeten in redelijke verhouding staan tot de informatie die devraag levert over het kennisniveau van de leerling).

66

Page 71: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: algemene richtlijnen

6 Stel de toets samenDe afzonderlijke vragen moeten nu aaneengesmeed worden tot een toets. De volgende richtlijnen kunnendaarvoor gevolgd worden:– Laat de toets beginnen met één of enkele relatief eenvoudige vragen (opwarmertje; aanmoediging

voor faalangstige kandidaten).– Zet vragen van dezelfde vorm bij elkaar (dus geen meerkeuzevragen en open vragen door elkaar

gebruiken). De verschillende vraagvormen doen een beroep op geheel verschillende antwoordstrate-gieën; een voortdurende omschakeling is voor leerlingen niet prettig.

– Binnen een bepaalde vraagvorm moeten vragen over hetzelfde leerstofonderdeel bij elkaar geplaatstworden.

– Controleer de vragen op afhankelijkheid. (Bevatten de vraagstelling of de antwoordalternatieven inde ene vraag geen informatie die de beantwoording van andere vragen vereenvoudigd?)

– Ken eventueel een gewicht toe aan de vragen. Een goed uitgangspunt hierbij is de inspanning diede gemiddelde leerling moet leveren om de vraag te beantwoorden. Hierbij moet de inspanning bijhet beantwoorden van een meerkeuzevraag niet onderschat worden.Onderzoek heeft overigens uitgewezen dat weging weliswaar tegemoetkomt aan het rechtvaardig-heidsgevoel van docenten en leerlingen, maar dat het voor het uiteindelijke toetsresultaat weiniguitmaakt: de rangorde van de leerlingen verandert er nauwelijks door.Weging wordt nogal eens gebruikt om het relatieve belang van een bepaald leerstofonderdeel tebenadrukken. Met die ene vraag over dat belangrijke onderwerp zijn opeens 20 punten te verdienen.Als dat onderwerp echter zo belangrijk wordt gevonden, kunnen daarover beter meerdere vragengesteld worden.Het gewicht van de vraag moet in ieder geval bij de vraag vermeld worden. Leerlingen kunnendaarmee bij het maken van de toets rekening houden.

7 Bepaal de cesuurDe grens tussen een voldoende en onvoldoende prestatie kan op twee manieren worden vastgesteld: 1achteraf op grond van de prestaties van alle kandidaten en 2 vooraf op grond van een door detoetsconstructeur zinvol geacht criterium. Eerstgenoemde methode wordt in de literatuur vaak aangeduidmet ’relatieve cesuurbepaling’ en de tweede methode met ’absolute cesuurbepaling’.Vroeger, maar ook nu nog gebruiken veel leerkrachten (vaak onbewust) een relatieve cesuurbepaling.Het prestatieniveau van de groep leerlingen is dan bepalend voor waar de cesuur gelegd wordt. Als degroep goed presteert, ligt de cesuur hoog; presteert de groep slecht dan ligt de cesuur laag. Dat ditsysteem vaak onbewust gehanteerd wordt, komt omdat docenten over het algemeen een constantzakpercentage van zo’n 25% een rechtvaardige zaak vinden. Het belangrijkste nadeel van deze methodeis dat het niveau van het onderwijs voor een aanzienlijk deel gedicteerd wordt door de onderwijsconsu-menten. Kwaliteitsbewaking is in zo’n situatie moeilijk te realiseren.Bij absolute cesuurbepaling wordt de grens tussen voldoende en onvoldoende van tevoren vastgelegd.Het vaststellen van die beheersingsstandaard is, zeker als de kwaliteit van de toetsvragen onbekend is,een nogal subjectief gebeuren. Er zijn wel procedures ontwikkeld die beogen dit proces te objectiveren,maar die zijn over het algemeen zeer bewerkelijk en slagen er bovendien niet in om de subjectiviteithelemaal terug te dringen. Een snel alternatief biedt de volgende procedure:a Stel de maximaal bereikbare score vast.b Bepaal bij welk percentage van de maximumscore de cesuur moet liggen. Intuïtief vinden veel

docenten dat 60% verdedigbaar is.c Stel de cesuur vast op basis van de waarden uit stap a en b.d Bestaat de toets (voor een deel) uit gesloten vragen en werden de leerlingen geïnstrueerd om geen

vragen over te slaan, dan moet de vastgestelde cesuur gecorrigeerd worden voor dit raadeffect.Immers, bij gesloten vragen kunnen kandidaten punten scoren door blind of beredeneerd te raden.Een voorbeeld van een toets bestaande uit 45 vragen is te zien in tabel 26.

67

Page 72: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 6

tabel 26 - Cesuurbepaling met correctie voor raden

vraagnum-mer

vraagtype maximale score kansscore

1 (open vraag) max. 1 punt

2 (open vraag) max. 2 punten

3 (open vraag) max. 3 punten

4 (open vraag) max. 5 punten

5 (open vraag) max. 6 punten

6 t/m 15 (ja/nee vragen) max. 10 punten kansscore: 10/2 = 5

16 t/m 45 (driekeuzevragen) max. 30 punten kansscore: 30/3 = 10

max. 57 punten totale kansscore = 15

Hieruit blijkt dat elke leerling, ook degene die niets weet, waarschijnlijk een score haalt van minimaal15. Het scorebereik loopt dus eigenlijk niet van 0 tot 57 maar van 15 tot 57 (42 punten). Met ditgegeven in de hand kan nu een absolute cesuur worden vastgesteld. 60% van 42 punten is 25. Ditwordt opgeteld bij de kansscore van 15, waarmee de cesuur op 40 komt te liggen.

8 Schrijf aanwijzingen voor de kandidatenHet voorblad van de toets dient informatie te bevatten over de volgende zaken:– toegestane tijd voor de beantwoording.– de minimaal te behalen score.– de wijze van scoring bij gesloten vragen (’correctie voor raden’ of ’gedwongen raden’). Bij het

correctie–voor–raden–systeem levert een fout antwoord een lagere score (er worden puntenafgetrokken) op dan niet beantwoorden (0 punten). Dit systeem dient om het blind raden tegen tegaan als de kandidaat alle alternatieven even waarschijnlijk voorkomen. Bij het gedwongen-–raden–systeem luidt de scoringsregel: goed antwoord: 1 punt; fout antwoord of overgeslagen: 0punten. Uit onderzoek is gebleken dat het ene systeem niet leidt tot meer betrouwbare scores danhet andere. Gelet op het feit dat leerlingen nogal eens moeite hebben met het correctie-voor-radensysteem gaat de voorkeur uit naar het gedwongen–raden–systeem.

– De te volgen antwoordstrategie (bij gesloten vragen). Als het gedwongen–raden–systeem gebruiktwordt, moeten leerlingen erop gewezen worden dat alle vragen beantwoord moeten worden, desnoodsdoor te raden. Het overslaan van vragen heeft een nadelige invloed op de te behalen score. Bij hetcorrectie–voor–raden–systeem luidt de geadviseerde antwoordstrategie: ’Laat vragen waar je doortijdnood niet aan toekomt onbeantwoord. Komen alle antwoordalternatieven je even waarschijnlijkvoor, laat de vraag dan onbeantwoord. Kun je een of meerdere alternatieven wegstrepen, beantwoordde vraag dan wel.’

6.2 De constructie van kennistoetsen met behulp van een toetsenbank

Alle docenten proberen opgaven en toetsen opnieuw te gebruiken bij volgende toetsmomenten. Lossevragen en complete toetsen worden bewaard en zo mogelijk hergebruikt. En terecht, want een opgaveof toets die zijn waarde inmiddels bewezen heeft, verdient het om vaker gebruikt te worden. Bovendienis er een trend te bespeuren om de toetsing en afsluiting te flexibiliseren. Dat vraagt niet alleen om veelitems maar ook om een efficiënte inzet van het beschikbare toetsmateriaal.In het verleden was dat in veel gevallen een kwestie van goed zoeken, knippen, plakken en kopiëren.Soms moesten delen opnieuw uitgetypt worden. Tegenwoordig kan de computer dit werk aanzienlijk

68

Page 73: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: algemene richtlijnen

vergemakkelijken. Het toetsmateriaal wordt opgeslagen in zogenaamde itembanken of toetsenbanken.Deze kunnen al dan niet deel uitmaken van een toetsservicesysteem.Voordat wordt ingegaan op de mogelijkheden van zo’n elektronische aanpak, worden hieronder deverschillende begrippen eerst nader toegelicht.

Itembank/opgavenbankDe begrippen itembank en opgavenbank mogen door elkaar gebruikt worden. ’Opgave’ is een ruimerbegrip dan ’item’, waarmee vaak alleen een meerkeuzevraag wordt aangeduid. Het wordt itembank lijktechter het meest te zijn ingeburgerd. Een itembank is een geordende verzameling opgaven. Opgaven zijnlosse vragen, maar kunnen ook vragen zijn die bij elkaar horen en gekoppeld zijn aan bepaalduitgangsmateriaal (een tekening, een casusbeschrijving etc.). Een belangrijk kenmerk van een itembankis dat de opgaven geordend zijn volgens één of meer indelingen.

ItembanksysteemEen itembanksysteem is een geautomatiseerd hulpmiddel waarmee items worden opgeslagen, gewijzigden beheerd. Het systeem zorgt voor selecties op basis van door de gebruiker aangegeven categorieën.

Indelingen van itembankenEen itembank wordt zo ingedeeld, dat het samenstellen van toetsen met zo weinig mogelijk moeiteautomatisch kan geschieden zonder overigens handmatige wijzigingen uit te sluiten. De structuur vande itembank zit dan niet alleen in de vakinhoudelijke classificatie, maar ook in de vraagvorm, degebruiksgegevens etcetera. Het moet in principe mogelijk zijn een toets samen te laten samenstellen opbasis van een toetsdefinitie.

ToetsdefinitieDe ’schets’ of ’blauwdruk’ voor een toets wordt toetsdefinitie genoemd. In de toetsdefinitie staat vermeldvoor welke doelgroep de toets is bedoeld en staan de te selecteren categorieën vermeld. De toetsdefinitiebakent een deel van de gehele itembank af. Het is in feite een toetsmatrijs, waarbij is opgegeven wat deomvang van de toets moet zijn.

ToetsenbankEen toetsenbank is een verzameling kant-en-klare toetsen, die zodanig in de verzameling zijnopgenomen, dat zij bij een selectie in hun geheel kunnen worden gebruikt. Toetsen zijn geordend naarte toetsen eenheden.

ToetsservicesysteemEen toetsservicesysteem kan worden gekenschetst als een itembanksysteem met extra faciliteiten. Hetbiedt als extra namelijk mogelijkheden voor het oproepen en presenteren van toetsen (op papier of viade computer) en het analyseren van toetsresultaten.In afbeelding 19 is te zien dat de opgavenbank in feite de kern van het toetsservicesysteem is. Op basisdaarvan worden toetsen geconstrueerd. Wellicht geeft ’geselecteerd’ beter weer wat er gebeurt: op basisvan de toetsdefinitie worden bepaalde items in de toets opgenomen. Het enige dat geconstrueerd wordt,is het toetsorigineel dat in oplage gekopieerd moet worden. De toets blijft op deze manier ook gewoondeel uitmaken van de itembank.Na de toetsafname (welke geen deel uitmaakt van het toetsservicesysteem, vandaar het afwijkende kader)kunnen de resultaten worden geanalyseerd. De gegevens die hier uit komen, kunnen vervolgens gebruiktworden om opgaven bij te stellen en/of de toetsdefinitie aan te passen. In principe zijn dit gegevens, diealleen iets zeggen over de toets als geheel zoals deze door een bepaalde groep leerlingen is gemaakt.

69

Page 74: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 6

Door calibratie1 kunnen deze gegevens ook vertaald worden in itemparameters, die bij de items kunnenworden opgeslagen.

afb. 19 - Toetsservicesysteem

Het grote voordeel van een professioneel itembanksysteem is dat het proces van toetsproductie isgeautomatiseerd: bij een voldoende aantal opgaven kan het systeem inhoudelijk gelijkwaardige toetsen’genereren’. Dit betekent een zeer grote flexibiliteit bij het toetsen en examineren: de opgavenbank zorgtvoor een voldoende aantal verschillende en toch inhoudelijk gelijkwaardige opgaven, zodat geenproblemen rond geheimhouding ontstaan. De ene student kan de andere geen goede antwoorden meerdoorspelen, omdat de reeks opgaven per toetsdatum verschilt.

Het ’genereren’ van toetsen moge dan wel geautomatiseerd verlopen, maar voor het systeem operationeelis, moet er nog wel het een en ander gebeuren:– de examenstof moet op een bepaalde manier georganiseerd worden;– er moet een groot aantal opgaven verzameld en geconstrueerd worden;– er moeten ’recepten’ voor toetsen gemaakt worden, waarmee het systeem aan de slag kan.Over deze afzonderlijke werkzaamheden gaan de volgende passages.

Organisatie van de examenstof: de itembankstructuurAls een school met een itembanksysteem gaat werken, moet iemand de structuur van een opgavenbankbepalen. Zonder structuur is er geen adequate opslag en selectie van opgaven mogelijk.Het lijkt voor de hand te liggen om voor een geordende opslag van opgaven uit te gaan vanonderwijseenheden (dat wil zeggen modulen, leerstofkavels, cursusblokken en wat er nog meer aantermen in omloop is) of deelkwalificaties (combinaties van eindtermen die gelden voor een bepaaldeberoepsopleiding) als organisatorisch principe. DeWEB schrijft immers voor dat onderwijseenheden endeelkwalificaties getoetst worden.

1 Bij calibratie worden gebruiksgegevens van opgaven zodanig bewerkt, dat het mogelijk wordt de opgaven te rangordenen opeen schaal van makkelijk naar moeilijk. Deze schaal is in tegenstelling tot de klassieke p-waarden populatie-onafhankelijk.Op deze manier kunnen de eigenschappen van opgaven bepaald worden onafhankelijk van de personen die de opgavengemaakt hebben en omgekeerd kunnen de eigenschappen van personen gemeten worden onafhankelijk van de opgaven diemen daarvoor gebruikt.

70

Page 75: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: algemene richtlijnen

Het grote nadeel van dit uitgangspunt is dat onderwijseenheden en deelkwalificaties inhoudelijk kunnenveranderen. Bovendien zullen de onderwijseenheden per opleiding verschillen, waardoor eenopgavenbank die specifiek ontwikkeld is voor één opleiding, onbruikbaar is voor andere.Om een bank geschikt te maken voor vernieuwing en algemeen gebruik, kan de indeling beter gebaseerdworden op onderwerpen. Nagenoeg ieder vak kent een onderwerpenstructuur. Onderwerpen verwijzennaar leerstof. Opgaven om die leerstof te toetsen, kunnen dus altijd bij een bepaald onderwerp wordeningedeeld. Wel moet eerst een handige onderwerpenstructuur worden ontwerpen en vaststellen.Onderwerpen zijn vaktermen die aangeven waar een groep opgaven in een bank over gaat. Onderwerpenkunnen op hun beurt weer onder overkoepelende onderwerpen vallen. Een voorbeeld:

afb. 20 - Onderwerpenstructuur

Onderwerpen worden meestal afgeleid van een vak. Het begrip ’vak’ is hier heel algemeen gebruikt. Hetkan gaan om theorievakken, praktijkvakken of nieuwe vakken die aan beroepsactiviteiten ontleend zijn.Er kan ook worden uitgegaan van deelkwalificaties. Wat telt, zijn de onderwerpen.Door onderwerpen te kiezen, is het mogelijk behalve een vak ook onderwijseenheden, deelkwalificatiesof eindtermen te definiëren. Onderwerpen met de bijbehorende opgaven geven immers aan welke kennisen vaardigheden nodig zijn om een beroepstaak op de juiste wijze uit te voeren.Afbeelding 21 brengt de relatie tussen onderwerpen, vakken, deelkwalificaties en eindtermen in beeld:

afb. 21 - Verdeling van onderwerpen over vakken

71

Page 76: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 6

Met A t/m H worden onderwerpstructuren aangeduid als in de vorige figuur. Tot het vakgebied 1behoren de onderwerpen onder A, B, C en E, tot vakgebied 2 de onderwerpen onder C, D, G en H.Onderwerpen onder C zijn voor beide vakken van belang, terwijl onderwerpen onder F buiten beidevakgebieden vallen. De onderwerpen onder A + B kunnen nu een onderwijseenheid vormen. DaarnaastzoudenC + D + G tengrondslag kunnen liggen aan een deelkwalificatie, bestaande uit eindtermen diedoor C, D en G bepaald worden.

De vulling van een opgavenbankIn het begin is de opgavenbank leeg. Ongetwijfeld kan men uit eerdere tentamens en examens opgavenhalen die geschikt zijn voor de bank. In de regel zal men echter opgaven moeten bijmaken, om hetitembanksysteem voldoende selectiemogelijkheden te bieden: enerzijds voor het samenstellen van toetsendie representatief zijn voor de totale examenstof (inhoudsvalide toetsen), anderzijds om te voorkomendat in toetsen die volgens hetzelfde recept zijn gemaakt steeds weer dezelfde opgaven terechtkomen.Het ontwikkelen van opgaven is teamwork. De ervaring leert dat docenten vaak heel aardige vragen enopgaven kunnen bedenken, maar dat een collega er toch altijd weer onduidelijkheden en onvolkomenhe-den uithaalt. Het verdient daarom aanbeveling om per opgavenbank een productiegroep te formeren.Leden van zo’n groep, de vakdeskundigen, kunnen onafhankelijk van elkaar vragen ontwerpen, maardaarna is er een gezamenlijke bespreking en eindredactie noodzakelijk. Opgavenontwikkeling is gééneenmanszaak.

Zeker als het gaat om opgaven voor hergebruik, is het de moeite waard om de nodige tijd en aandachtin het materiaal te steken. Verhoging van de kwaliteit van de opgaven verhoogt de kwaliteit van detoetsing. Het werken met een opgavenbank voor flexibele toetsing maakt deze investering toch rendabel.De opgaven komen immers meer dan eens aan bod, in verschillende arrangementen voor verschillendeleerlingen.Nieuwe opgaven kunnen in de bank worden opgeslagen met een bepaalde statusaanduiding. Voorbeeldenvan statusaanduidingen zijn: ’eerste concept’, ’herziene versie’ of ’gereed voor goedkeuring’.Zeker als met grote aantallen opgaven wordt gewerkt, vergemakkelijkt een gecomputeriseerdeopgavenbank het productieproces. Met een paar eenvoudige commando’s kan men de opgaven oproependie voor verdere behandeling in aanmerking komen.

Als men uit de itembank toetsen gaat samenstellen, moet men ervan op aan kunnen dat de kwaliteit vande opgaven goed is. Als het systeem kant-en-klare toetsen moet leveren, die volgens een bepaald receptzijn bereid, moet men op de kwaliteit van de gebruikte ingrediënten kunnen vertrouwen.Het is wenselijk om de vaststelling van opgaven, dat wil zeggen hun goedkeuring voor gebruik in eentoets, buiten de productiegroep te houden en over te laten aan degenen die voor het samenstellen vantoetsen verantwoordelijk zijn. Zij kunnen het itembanksysteem dan met een gerust hart toetsen latenassembleren, in de zekerheid dat de opgaven hun goedkeuring kunnen wegdragen.Als het gaat om opgaven die in het kader van externe legitimering een rol spelen, kan onafhankelijkevaststelling zelfs noodzakelijk zijn.

De computer stelt toetsen samen uit goedgekeurde opgaven. Naar goedgekeurde opgaven hoeft bij hetsamenstellen van een toets niet meer gekeken te worden. Ze zijn klaar voor gebruik. Wel bestaat demogelijkheid dat ze op grond van hun ’afwijkende gedrag’ in een toets alsnog moeten worden verwijderdof herzien. Er kan een onduidelijkheid zitten in de vraagstelling. De stof kan geheel onbekend zijn. Erkan een onbedoelde aanwijzing in één van de alternatieven van een meerkeuzevraag zitten, waardooriedereen vanzelf het goede antwoord kiest, etcetera.

72

Page 77: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: algemene richtlijnen

ToetssamenstellingEr is al een paar keer sprake geweest van recepten voor de samenstelling van toetsen. Zulke receptennoemt men toetsmatrijzen. Volgens deWEB worden onderwijseenheden die leiden tot een deelkwalifica-tie, afgesloten met een toets. Voor het samenstellen van zo’n toets moet men eerst de onderwerpeninventariseren die in de onderwijseenheden voorkomen. Stel, er is bij pathologie een onderwijseenheidgetiteld ’Aandoeningen van hart en bloedvaten’. In deze eenheid komen de volgende onderwerpen aande orde:– afwijkingen in de prikkelvorming, onderverdeeld in sinusbradycardie, sinustachycardie, fibrilleren

en extrasystolie;– afwijkingen in de prikkelgeleiding, onderverdeeld in atrioventriculair block, bundeltakblock en

totaalblock;– arteriële aandoeningen;– veneuze aandoeningen.Daarna moeten worden bepaald, hoeveel scorepunten de opgaven bij de verschillende onderwerpen aande totaalscore van de toets mogen bijdragen. Spreiding van de scorepunten over onderwerpen is nodigom er zeker van te zijn dat door de toets een volledig en evenwichtig beeld van de kundigheden van deleerlingen wordt verkregen.Misschien kunnen ook nog typen opgaven worden onderscheiden: snel te beantwoorden meerkeuzevragendie bij een goed antwoord slechts één punt opleveren, of tijdrovende essayvragen of berekeningen diewel voor 10 scorepunten kunnen zorgen. Dergelijk keuzen worden vastgelegd in een toetsmatrijs.Het voordeel van het werken met toetsmatrijzen is duidelijk: men hoeft zich alleen maar te buigen overde vraag welke onderwerpen bij de toetsing aan de orde moeten komen en welk gewicht zij bij debeoordeling krijgen. Als dit is vastgesteld, kan de computer uit de opgavenbank een groot aantal toetsenputten die volgens zo’n voorschrift zijn samengesteld. Wel moet de bank heel wat opgaven bevatten alsde toetsen niet te veel vragen gemeenschappelijk mogen hebben.

Het verwijderen of toevoegen van een eindterm bij een examen verandert niets aan de bank. Hetitembanksysteem slaat de bijbehorende opgaven bij een selectie simpelweg over of neemt ze mee.Hier komt een belangrijk voordeel van een itembank naar voren, zeker als het systeem wordt geplaatstnaast een meer traditionele werkwijze, waarbij docenten kant-en-klare toetsen als ’hardcopies’ ofelektronische bestanden bewaren: als de inhoud van het examen wijzigt, moeten alle toetsen wordenherzien. Bij het werken met een geavanceerde itembank hoeft men alleen het recept voor een toets aante passen.

Wanneer gebruik wordt gemaakt van een itembank kan men dus uit een voorraad geordende opgavenmet behulp van toetsmatrijzen toetsen maken die op diverse data kunnen worden afgenomen. Het feitechter dat men bij opgavenontwikkeling niet over één nacht ijs moet gaan, leidt er wel toe dat debeoogde flexibilisering een geleidelijk proces is. Als men start met een opgavenbank, is het aantalopgaven in de regel niet groot genoeg om tot volledige flexibiliteit over te gaan.Het aantal toetsdata kan geleidelijk worden uitgebreid, bijvoorbeeld van één tentamen met één herkansingper trimester via enkele vaste tentamendata naar een groot aantal gespreide keuzedagen.Bij het creëren van meer afnamemomenten moet er niet alleen rekening worden gehouden met decapaciteit van de opgavenbank, maar ook met de organisatorische spankracht van de school.

Correctie en normeringAls er in een toets open opgaven voorkomen, zijn er examinatoren of correctoren nodig die deantwoorden nakijken.Om geen uiteenlopende waarderingen te krijgen van wat goed is en fout, vormt iedere opgave één geheelmet zijn correctievoorschrift, dat wil zeggen de richtlijnen voor correctoren: een overzicht van foute,

73

Page 78: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 6

gedeeltelijk goede en juiste antwoorden met hun respectieve waardering. Bij meerkeuzevragen hoevenmen alleen maar het juiste alternatief aan te geven.

Onder normeren wordt verstaan: het bepalen van regels volgens welke toetsscores in cijfers wordenomgezet. De bepaling van de norm op bredere basis dan een enkele school (bijv. door rekening tehouden met inzichten en opvattingen in het werkveld) verleent de niveauvaststelling een externelegitimering.Als de moeilijkheidsgraad van de opgaven in een bank bekend is, kan de computer toetsen samenstellenvan een vaste moeilijkheidsgraad. In dat geval hoeft alleen maar te worden bepaald hoe moeilijk de toetsmag zijn en welke score een leerling minimaal moet halen voor een voldoende. Dan kan de computertoetsen samenstellen die niet alleen inhoudelijk gelijkwaardig zijn, maar ook nog dezelfde eisen aan deleerlingen stellen. Toetsen die dus over dezelfde leerstof gaan en even moeilijk zijn, maar uit anderevragen bestaan. Zulke toetsen heten parallel. Als de norm eenmaal bepaald is, garandeert de computerdat aan alle leerlingen dezelfde eisen worden gesteld.

Als men begint te werken met een opgavenbank, ontbreken in de regel gegevens over de moeilijkheids-graad van opgaven. Men moet accepteren dat de ene vraag moeilijker is dan de andere, ook al gaan zeallebei over precies dezelfde stof. Dit betekent dat na een toets de resultaten van de leerlingen bekekenmoeten worden. Valt de uitslag tegen of mee? Waar wordt de norm gelegd?Ook bij volgende toetsen, gemaakt volgens hetzelfde recept, luidt telkens de vraag: Is dit een ’uitschieter’of niet? Indien niet is aan te nemen dat de leerlingen bij de ene toets veel minder (of meer!) kennen enkunnen dan bij de andere, moet er met de norm geschoven worden, als er naar verhouding veel of weinigonvoldoendes dreigen te vallen. De scoreverschillen liggen dan aan de toets en niet aan de leerlingen.Het doorlopend verzamelen, verwerken en opslaan van toetsresultaten maakt dat er na enige tijd wélparallelle toetsen kunnen worden samengesteld. In dat geval blijft het werk beperkt tot het opstellen enzo nodig bijstellen van de toetsmatrijs en het vaststellen van de norm. De productie van toetsen enverwerking van resultaten is dan alleen nog maar routine.Werken met parallelle toetsen garandeert een gelijke behandeling van iedere leerling die voor eenbepaald tentamen opgaat, naast de handhaving van een constant niveau.Een zorgvuldige registratie van gegevens per opgave is van belang voor het vaststellen van hunmoeilijkheidsgraad en het naderhand produceren van parallelle toetsen. De beoordelaars moeten degegevens op een zodanige manier vastleggen dat ze voor een computer leesbaar zijn en/of volgens eenbepaald programma verwerkt kunnen worden.

Resultaatverwerking en kandidatenregistratieDe gegevens die met behulp van toetsen worden verzameld, zijn in eerste instantie bedoeld ombeslissingen te nemen over leerlingen: zak-/slaag-beslissingen, cijfergeving. Pas in tweede instantie zijnze bedoeld om opgaven in de bank te voorzien van een moeilijkheidsindex.

BeveiligingZoals op het gemeentehuis niet iedereen in de kaartenbakken van de burgerlijke stand mag grasduinenen kaarten mag toevoegen, verwijderen of veranderen, zo mogen alleen geautoriseerde personen met eenopgavenbank werken. Het is niet de bedoeling dat een individuele docent aan een eenmaal vastgesteldetoetsmatrijs gaat sleutelen of dat een ’hacker’-leerling de opgaven voor een examen vooraf laat uitprintenen onder de toekomstige kandidaten verspreid. Er is daarom een fysieke en software-matige beveiligingvan het systeem noodzakelijk: de computer mag zich niet op een voor iedereen toegankelijke plaatsbevinden en geautoriseerde gebruikers moeten zich bedienen van toegangscodes (’wachtwoorden’) diebepalen tot welk gebruik en welke ingrepen zij bevoegd zijn.

74

Page 79: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: algemene richtlijnen

6.3 Stappenplan voor de constructie van vaardigheidstoetsen

In het stroomschema op de volgende bladzijde (afb. 22) staan de stappen die gezet moeten worden bijde constructie van vaardigheidstoetsen. Hieronder worden de verschillende stappen nader toegelicht.Sommige stappen (0, 1 en 5) zijn, als het goed is, al voor een deel genomen zijn op curriculumniveau.Voor de volledigheid zijn deze stappen toch in het schema opgenomen.

0 Inventariseer de takenEen functie bestaat meestal uit een aantal taken die de functionaris moet kunnen uitvoeren. Een taakwordt hier opgevat als een goed omschreven, doelgerichte activiteit met een onderscheidbaar begin eneinde. Meestal wordt een taak in een relatief kort tijdsbestek uitgevoerd.

Bij bestaande beroepsopleidingen zullen de taken van de functie waarvoor wordt opgeleid dikwijlsexpliciet beschreven zijn in het opleidingsplan. Het inventariseren van taken kan dan wordenovergeslagen. Als dit niet het geval is, zal een functieanalyse moeten worden uitgevoerd om de takente inventariseren.

1 Selecteer de takenHet ontwikkelen van een vaardigheidstoets is een ingewikkelde en langdurige activiteit. Doorgaans zalhet niet mogelijk blijken voor alle taken een vaardigheidstoets te ontwikkelen. Bij de selectie van takendie getoetst moeten worden moet rekening worden gehouden met beschikbare informatie over hetverwervingsproces van de vereiste vaardigheden om de betreffende taak te kunnen uitvoeren. Als demeeste leerlingen probleemloos de vereiste vaardigheden verwerven, is toetsing minder urgent. Daarnaastspeelt de crucialiteit van de taak een belangrijke rol: kritieke taken komen in principe altijd voor toetsingin aanmerking.

2 Bepaal of de beoordeling gebaseerd moet worden op het product, het proces of op beideOf een leerling voldoende vaardig is in het uitvoeren van een taak kan op drie manieren wordenvastgesteld:a direct, door de taakuitvoering te observeren en te beoordelen;b indirect, door een eventueel resulterend product te beoordelen;c combinatie van a en b.Voor de keuze voor a, b of c is geen algemeen geldend voorschrift te geven. Per taak zal steedszorgvuldig afgewogen moeten worden wat de voorkeur geniet. Enig houvast bieden de volgendevuistregels:– Beoordeel de taakuitvoering als de uitvoeringsprocedure in het onderwijs expliciet geoefend is

(m.a.w. als er sprake is van een gewenst handelingsverloop).– Beoordeel het product als voor de uitvoering veel varianten aanvaardbaar zijn (m.a.w. dat het er niet

zo toe doet hoe iemand een taak uitvoert).Ter illustratie: Of iemand een vaardig beeldhouwer is, moet blijken uit de kwaliteit van zijn sculpturen.Het beeldhouwen zelf moet niet zozeer worden opgevat als een procedure (d.w.z. stappen die in eenbepaalde volgorde uitgevoerd tot een vooropgezet doel leiden) maar eerder als een creatief proces. Ditbetekent dat het vormgevingsproces een onvoorspelbaar karakter heeft waardoor het niet of nauwelijksobjectief beoordeeld kan worden.

3 Voer een taak- en/of productanalyse uitObjectieve beoordeling van uitvoeringsprocessen en van daaruit voortkomende producten is alleenmogelijk aan de hand van eenduidige beoordelingsvoorschriften. Voor processen houdt dit in datbeoordeeld moet worden of de diverse stappen in de procedure (taakelementen) op de juiste wijze en in

75

Page 80: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 6

afb. 22 - De constructie van een vaardigheidstoets

76

Page 81: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: algemene richtlijnen

de juiste volgorde zijn uitgevoerd. Voor producten betekent het dat de beoordeling gebaseerd wordt opmeerdere kritieke kwaliteitsaspecten. Het in kaart brengen van de stappen in een procedure en van dekwaliteitsaspecten van producten gebeurt door het uitvoeren van een taak– respectievelijk productanalyse.

3A TaakanalyseEen taakanalyse is een activiteit die leidt tot de specificatie van zowel waarneembaar als niet-waarneembaar gedrag dat noodzakelijk is voor de uitvoering van een taak. Als het goed is, is voor elketaak die in een opleiding onderwezen wordt een taakanalyse uitgevoerd (het is de enig juiste manier omde doelstellingen van het onderwijs en de sequentiëring daarvan vast te stellen). Voor gevallen waarindit niet gebeurd is of voor compleet nieuwe taken, is het uitvoeren van een taakanalyse echternoodzakelijk.

De keuze voor een taakanalytische techniek (let op: meestal is het verstandig om gebruik te maken vanmeer dan één techniek) is ten dele een zaak van persoonlijke voorkeur. Er is echter een aantal vragenwaarvan de beantwoording het keuzeproces rechtstreeks beïnvloedt:– Kan de taakuitvoering geobserveerd worden?

Bij sommige taken ligt de nadruk op de cognitieve component waardoor een groot deel van deuitvoering voor het oog van de observator verborgen blijft.Het is ook mogelijk dat er opdracht is gegeven om een toets te construeren voor het evalueren vande vaardigheid met betrekking tot een nog niet bestaande taak (bijvoorbeeld: in een machinefabriekgaan de traditionele draaibanken vervangen worden doorCNC-banken en de directie wil dat alleendíe werknemers de nieuwe apparatuur bedienen, die bewezen hebben vaardig te kunnen omgaandaarmee.)

– Hoeveel overeenstemming is er over de uitvoering van (niet observeerbare) taken?Niet direct waarneembare taakuitvoeringen kunnen alleen geanalyseerd worden door een beroep tedoen op de opinies van relevante betrokkenen. Daarmee wordt uiteraard een aanzienlijke dosissubjectiviteit in de analyse ingebracht. Om deze subjectiviteit te beperken zijn verschillendetaakanalytische technieken beschikbaar.

Op grond van bovenstaande twee vragen kan het in tabel 28 weergegeven selectiehulpmiddel wordenvervaardigd.

tabel 27 - Methoden voor taakanalyse

TAAKUITVOERING IS:

observeerbaar niet observeerbaar

taak bestaat taak bestaat niet

meningsverschillen: meningsverschillen:

klein matig groot klein matig groot

1 documentstudie

2 observatie

3 interview

4 focusgroep

5 critical incident

6 simulatie

7 Delphi

77

Page 82: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 6

Hieronder volgt een summiere bespreking van deze technieken.

documentstudie Als er documentatie beschikbaar is over de wijze waarop een taak uitgevoerd dientte worden, is het in alle gevallen raadzaam hiervan kennis te nemen.

observatie Men wake ervoor de taakuitvoering van experts tot norm te verheffen voor gebruikin opleidingssituaties. Aan een beginnend beroepsbeoefenaar mogen in alleredelijkheid niet dezelfde eisen gesteld worden als aan een ervaren beroepsbeoefe-naar. De ’verkortingen’ die experts aanbrengen in de taakuitvoering zijn voorbeginners vaak niet haalbaar. Beginners moeten beoordeeld worden op de taakuitvoe-ring zoals die in de opleiding is verworven. Dit is de reden waarom in opleidingscon-texten taakanalyses uitgevoerd moeten worden bij beginnende beroepsbeoefenaren.

interview Als de taakuitvoering niet echt observeerbaar is, kan geprobeerd worden door middelvan een interview te achterhalen welke aanpak meestal gevolgd wordt. Evenals bij’observatie’ verdient het aanbeveling hiervoor geen experts te gebruiken. Hetinterview kan ook de vorm aannemen van een ’hardop-denk-protocol’: de taakuit-voerder vertelt wat hij denkt tijdens de uitvoering van een taak en geeft zo inzichtin de relevante aspecten die aan de taak te onderscheiden zijn.

focusgroep Focusgroepen zijn erop gericht om door middel van discussies informatie teverschaffen over belangrijke kenmerken van een functie/taak, over specifiekeproblemen die zich voordoen bij de uitvoering, en over specifieke eisen die aan defunctionaris/taakuitvoerder gesteld moeten worden. Een aantal, verschillendsamengestelde groepen van werknemers (een groep verantwoordelijke managers, tweeof drie groepen taakuitvoerders die volgens de managers uitstekend functioneren eneen groep taakuitvoerders die volgens de managers onvoldoende functioneren)discussieert over vragen die de analist hen voorlegt.

critical incident Bij deze techniek gaat het niet om complete gedragspatronen maar om tamelijkgeïsoleerde gedragingen naar aanleiding van kritieke voorvallen. Twee groepeninhoudelijke experts beschrijven onafhankelijk van elkaar specifieke voorvallen metdaarbij de gevolgen die in relatie gebracht kunnen worden met een bepaalde wijzevan taakvervulling. Tevens wordt gevraagd om aan te geven welke menselijkefactoren de voorvallen gunstig of ongunstig beïnvloed kunnen hebben. Vervolgensworden de voorvallen geordend op een schaal van sterk positief naar sterk negatief.Elk schaalpunt moet door minstens één voorval beschreven worden. Ten slotteworden beide groepen bij elkaar gebracht en wordt elkaars werk besproken,verschillen toegelicht en opgelost. De techniek leidt uiteindelijk tot aanbevelingen inde trant van: ’...doe meer van die dingen en minder daarvan...’.

simulatie Als de taak nog niet bestaat kan men proberen de taaksituatie na te bootsen envervolgens te observeren hoe de taakuitvoering verloopt. Vooral ’live simulaties’(acteurs spelen een rol waarop de taakuitvoerder moet reageren) en ’simulatoren’(apparaten die een nauwkeurige nabootsing zijn van werktuigen of machines) komenhiervoor in aanmerking.

Delphi Deze methode verdient aanbeveling als er goede reden is om aan te nemen dat devakinhoudelijke experts grote meningsverschillen zullen hebben over de taakuitvoe-ring. De analist legt stellingen/vragen voor aan een anonieme groep van vakinhoude-lijke experts. Hun responsen worden geanalyseerd en omgewerkt tot nieuwestellingen/vragen, die vervolgens opnieuw worden voorgelegd aan dezelfde groep.Deze cyclus wordt herhaald totdat de groep overeenstemming heeft bereikt.

78

Page 83: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: algemene richtlijnen

3B ProductanalyseOp welke aspecten moeten resulterende producten beoordeeld worden? Het antwoord op deze vraag kangevonden worden door het raadplegen van productievoorschriften, productieverantwoordelijken,NEN-ISO

normen en kenners/experts.Productkwaliteiten kunnen meer of minder objectief van aard zijn. Vanzelfsprekend moet gestreefdworden naar het afleiden van productkwaliteiten die zo objectief mogelijk vastgesteld kunnen worden.Dit zijn kwaliteiten die gebaseerd zijn op fysieke (en dus meetbare) eigenschappen, zoals: afmeting,gewicht, volume, kleur, e.d. Echter, lang niet alle producten kunnen (alleen) op basis van hun fysiekeeigenschappen beoordeeld worden. Denk bijvoorbeeld aan de kwaliteit van een gipsverband. Een heelbelangrijk aspect daarvan is het comfort voor de drager. Maar dat is typisch een aspect dat objectief nietgoed vast te stellen is. De kwaliteit wordt dan bepaald door inschattingen te maken. Door goederichtlijnen te geven voor het inschatten (in de vorm van beoordelingsvoorschriften) kan de subjectiviteitzoveel mogelijk beperkt blijven.

4 Selecteer en operationaliseer de beoordelingsaspectenHet uitvoeren van taak- en productanalyses kan leiden tot lange opsommingen van processtappen ofproductkenmerken. Niet alle stappen of kenmerken moeten per se als beoordelingsaspect in de toetsworden opgenomen. Soms zijn processtappen dermate elementair dat elke leerling die zonder meer(correct) zal uitvoeren. Soms is de uitvoering ervan niet of slechts na veel inspanning waarneembaar temaken. Dergelijke stappen kunnen beter buiten de beoordeling gehouden worden. De selectie vanproductkwaliteiten kan gebaseerd worden op de vraag (aan deskundigen) welke productkenmerken hetbeste onderscheid maken tussen voldoende en onvoldoende producten.

tabel 28 - Voorbeeld beoordelingsaspecten en beoordelingscriteria

beoordelingsaspecten beoordelingscriteria

infuusfles ophangen - infuusfles met de vulopening naar beneden gericht;

- infuusfles zit in een passend mandje;

infuusfles desinfecteren - vloeistof aanbrengen op het rubber van de vulope-ning;

- tenminste één minuut laten inwerken;

toedieningssysteem uitpakken - zonder contaminatie van de naalden

toedieningssysteem aansluiten - eerst toedieningsslang met kamer op z’n kop;

- dan toedieningsslang afklemmen;

- vervolgens ontluchtingsslang met wattenfilter bovenvloeistofniveau;

etc.

Ook deuitkomst van stap 6 en 7 heeft invloed op de selectie van beoordelingsaspecten. Bepaalde beoordelingsas-pecten kunnen komen te vervallen als gekozen wordt voor een toetsvorm die meer gericht is opcognitieve vaardigheden.Wanneer een selectie gemaakt is van de aspecten waarop een proces en/of product beoordeeld moetworden, is het zaak om deze beoordelingsaspecten om te zetten in beoordelingscriteria. De eis vanobjectiviteit gebiedt dat de beoordelingsaspecten zodanig geformuleerd zijn dat onafhankelijk van elkaarwerkende beoordelaars de prestatie van een leerling identiek kunnen beoordelen. Aan deze eis kan nietaltijd voldaan worden, maar in ieder geval dient de toetsconstructeur ernaar te streven om elkbeoordelingsaspect in zo objectief mogelijke termen te formuleren. Het voorbeeld in tabel 28 maaktduidelijk wat de bedoeling is.

79

Page 84: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 6

5 Bepaal de representativiteit van de vaardigheidstoets en kies een toetsvormDe keuze voor de toetsvorm is niet alleen afhankelijk van de te toetsen vaardigheid, maar ook van debeschikbare middelen en menskracht. Zo kan om uiteenlopende redenen gekozen worden om eenbepaalde vaardigheid niet in de meest natuurgetrouwe setting te toetsen, maar met behulp van eensimulatiepatiënt of alleen de cognitieve aspecten te toetsen met behulp van een potlood-en-papier-toets.Uiteraard heeft deze beslissing consequenties voor de uitspraken die op basis van de toetsresultatenkunnen worden gedaan. Daarom zal deze beslissing genomen moeten worden in het kader van deonderwijs- en examenregeling, dus op curriculumniveau. Op dat niveau kan men een afgewogen besluitnemen om sommige vaardigheden wel en andere vaardigheden niet in de volle omvang te toetsen.

Het verloop van de constructieprocedure in stap 6 en 7 is afhankelijk van de gemaakte keuze in stap 5.Taaksituaties en scoringssystemen voor de meer representatieve toetsen worden anders ontworpen dandie voor minder representatieve toetsen. Bij dergelijke toetsen is de vaardigheid die getoetst moet wordengereduceerd van een complexe, geïntegreerde vaardigheid tot een cognitieve vaardigheid. Maar het gaatdaarbij alleen om de zogeheten ’hogere orde’ cognitieve vaardigheden, zoals: besluitvorming enprobleemoplossing. Dat zijn vaardigheden die niet alleen beoordeeld moeten worden op grond van eeneindresultaat (een definitieve keuze, een oplossing) maar ook (en vooral) op grond van het denkprocesdat daartoe geleid heeft. Omdat het maken van hardop-denk-protocollen voor toetsdoeleinden in hetonderwijs niet haalbaar is, moet de registratie van het denkproces op een meer indirecte wijzeplaatsvinden, bijvoorbeeld door de leerling te dwingen zijn keuzes of beslissingen in het denkprocesschriftelijk vast te leggen. Voor de toetsconstructeur is het de kunst om de leerling een taaksituatie voorte leggen met daarin verweven verschillende momenten waarop beslissingen genomen moeten wordenten aanzien van de taakuitvoering, zonder dat leerlingen dit als erg kunstmatig gaan ervaren.De stappen voor de meer complexe toetsen zijn herkenbaar aan de A-codering, die voor de cognitievetoetsen aan de B-codering.

6A Ontwikkel een taaksituatie voor het beoordelen van gedrag en/of een productIn de voorgaande stappen is helder geworden hoe bepaalde taken uitgevoerd moeten worden, waarop zebeoordeeld moeten worden en in hoeveel verschillende taaksituaties de vaardigheid gedemonstreerd zoumoeten worden. Met die wetenschap kan nu aan het werk gegaan worden om de benodigde taaksituatieste beschrijven. Het gaat dan om een beschrijving van enerzijds de opdracht die leerlingen krijgenvoorgelegd en anderzijds de omstandigheden, voorzieningen en voorwaarden zoals die gelden tijdens detaakuitvoering.Als getoetst wordt onder reële werkomstandigheden zijn er weinig of geen mogelijkheden om deomstandigheden waaronder de vaardigheid gedemonstreerd moet worden, te controleren. Verlichting,temperatuur, locatie, drukte, e.d. zijn gegeven en kunnen niet gemanipuleerd worden om deomstandigheden meer of minder gunstig te laten zijn. Onder gesimuleerde werkomstandigheden kan ditwel. De stress waaronder gewerkt wordt bij de Eerste Hulp, bijvoorbeeld, kan flink worden opgevoerddoor een groot aantal verkeersslachtoffers tegelijk binnen te brengen.Onder voorzieningen vallen gereedschappen, apparatuur, instrumenten en materialen. Beschreven moetworden welke voorzieningen aanwezig moeten zijn, zo nodig gespecificeerd naar hoeveelheid, afmetingen kwaliteit.Ten slotte moeten de voorwaarden beschreven worden waaronder de uitvoering van de taak zijn beslagmoet krijgen. Hierbij moet antwoord gegeven worden op vragen als: Is er een tijdslimiet? Hoeveelproducten (al dan niet tastbaar) moeten minimaal vervaardigd worden? Is hulp inroepen toegestaan enzo ja, hoe vaak? Zijn er beperkingen aan de hoeveelheid te verbruiken materiaal? Welke veiligheidsmaat-regelen moeten beslist in acht worden genomen?

80

Page 85: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: algemene richtlijnen

6B Ontwikkel een taaksituatie voor het beoordelen van cognitieve vaardighedenOp basis van de resultaten van stap 1 tot en met 5 ontwikkelt de toetsconstructeur in deze fase eentaaksituatie die een beroep doet op de te toetsen (cognitieve) vaardigheid van de leerling. In deonderwijskundige literatuur worden dergelijke toetsen vaak aangeduid met de term ’schriftelijkesimulatie’. Het creëren van deze taaksituatie is een tijdrovend proces dat een groot beroep doet op decreativiteit van de toetsconstructeur en op diens vakinhoudelijke kennis. Dit stappenplan is niet de juisteplek om gedetailleerde aanwijzingen te geven voor de constructie van dergelijke taaksituaties. Er wordtvolstaan met een opsomming van de belangrijkste stadia in het ontwikkelingsproces en met het verwijzennaar een uitvoerige handleiding.

Ontwikkelingsstadia bij een toets voor hogere cognitieve vaardigheden– Formuleer een probleemsituatie.

Het probleem moet afgestemd zijn op de vaardigheid die getoetst moet worden. Bij de keuze moetmen proberen het midden te houden tussen triviale ’rechttoe rechtaan problemen’ en onwaarschijnlijkcomplexe problemen.

– Maak een blauwdruk van het oplosproces.Als de leerling kennis heeft genomen van de probleemsituatie moet hij door het nemen van een reeksbeslissingen proberen tot een oplossing te komen. Na elke beslissing die hij neemt kan de oplossingdichterbij komen of juist onwaarschijnlijker worden. In de blauwdruk worden de gebeurtenissen (naaraanleiding waarvan de leerling beslissingen moet nemen) ontworpen en hun sequentie bepaald. Heteindresultaat van deze fase is een schema waarin tussen probleemsituatie en oplossing verschillende’oplosroutes’ zichtbaar zijn. De oplosroutes verschillen van elkaar in de beslissingen dieachtereenvolgens genomen zijn.

– Werk de oplosroutes uit.Alle mogelijke oplosroutes, ook die welke niet tot een correcte oplossing leiden, moeten in detailworden uitgewerkt. Dit betekent dat de gebeurtenissen naar aanleiding waarvan de leerling moetreageren worden uitgeschreven evenals de verschillende reacties waaruit de leerling kan kiezen ende terugkoppeling die gegeven moet worden (in termen van het gevolg van de reactie van deleerling).

– Maak een stroomdiagram.Het verloop van de interactie tussen toets en leerling moet schematisch worden weergegeven in eenstroomschema. Op basis van dit stroomschema kan de toets geprogrammeerd worden voor gebruikop een computer.

– Ontwerp en controleer het programma.Zodra het programma in een eerste versie beschikbaar is, moet het uitvoerig getest worden op ’bugs’(fouten in het programma) waarna de definitieve versie vervaardigd kan worden.

7A Ontwikkel de beoordelingslijstEen beoordelingslijst bestaat uit een verzameling aspecten die door de observator worden gemeten. Dezebeoordelingsaspecten worden geoperationaliseerd door hieraan criteria te verbinden. Het zijn doorgaansde criteria die als items in de beoordelingslijsten zijn opgenomen. Hierdoor worden de beoordelingslijstenook wel criterialijsten genoemd.Het kan echter ook voorkomen dat criteria niet in de beoordelingslijsten zijn geëxpliciteerd. Het is danwel noodzakelijk om de beoordelingsaspecten tijdens een beoordelaarstraining te verduidelijken (zie bijstap 10).

Proces- en/of product-beoordelingBij vaardigheidstoetsing kan een vaardige taakuitvoering op drie verschillende manieren wordenvastgesteld, namelijk door beoordeling van: 1 het proces, 2 het product of 3 beide.

81

Page 86: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 6

1 Wanneer de vaardigheid direct kan worden geobserveerd, ligt het accent op het meten van het procesvan de taakuitvoering. Een voorbeeld is de meting van de vaardigheid om een patiënt tekatheteriseren.

2 Voor een beoordeling van het product van de vaardigheid kan worden gekozen als er meerderevarianten van de taakuitvoering mogelijk zijn of wanneer de procedure niet belangrijk is. Dit laatsteis bijvoorbeeld het geval wanneer de vaardigheid bestaat uit een creatief proces (bijv. hetcomponeren van een muziekstuk).

3 Product en proces kunnen ook beide worden gemeten. Een voorbeeld hiervan is het aanleggen vaneen wonddrukverband. Zowel de procedure van de aanleg van het verband (het proces) als hetaangelegde verband (het product) kan worden gemeten.

De beoordelingslijsten die bij de drie genoemde manieren van meten worden gebruikt bevattenrespectievelijk procesitems, productitems en een combinatie van proces en productitems.Afhankelijk van de wijze waarop de vaardigheid wordt getoetst, kunnen dus verschillende typen itemsin de observatielijsten worden onderscheiden met als resultaat dat het karakter van de lijsten verschillendis.

DetailleringWat betreft de detaillering kunnen beoordelingslijsten worden gerangschikt van zeer globaal tot zeergedetailleerd. Een globale beoordelingslijst bevat doorgaans minder items dan een gedetailleerde lijst (dieover hetzelfde onderwerp gaat). Verder verschillen de items uit beide lijsten van elkaar: een item in eenglobale lijst heeft het karakter van een beoordelingsaspect, waarbij het criterium vaag is omschreven(bijv. een handeling moet adequaat zijn uitgevoerd) maar bekend is bij de observator (op basis vandeskundigheid of op basis van een training). Items van gedetailleerde lijsten zijn duidelijk omschrevencriteria.Er kunnen verschillende redenen zijn om voor een gedetailleerde beoordelingslijst te kiezen.– Er wordt op die manier nauw aangesloten bij de stappen die te onderscheiden zijn bij de uitvoering

van een gestandaardiseerde ’variant’ van de vaardigheid die centraal staat tijdens de instructie. Zowordt bijvoorbeeld in een medisch curriculum een hartonderzoek volgens één vaste procedureaangeleerd en worden varianten (eventueel) in de praktijk geleerd.

– Een tweede reden, die voortvloeit uit de vorige, is het gegeven dat door het gebruik vangedetailleerde lijsten de onderwijsdoelstellingen duidelijk worden gemaakt. Leerlingen weten beterwat van hen wordt verwacht.

– Een gedetailleerde lijst biedt verder de mogelijkheid om specifieke feedback te geven. Met namevoor de patiëntsimulatie die gericht is op diagnosticeren kan dit van belang zijn.

– Tot slot, maar niet in de laatste plaats, leidt het gebruik van gedetailleerde lijsten tot objectiveringvan de beoordeling. De operationalisatie van de vaardigheid die wordt gemeten is specifieker en ditgeeft de observator meer duidelijkheid over de aspecten waarop de leerling moet worden beoordeeld.De observator krijgt minder interpretatievrijheid en is dus objectiever.

Er zijn ook argumenten die pleiten tégen het gebruik van een uitgebreide analytische beoordelingslijst:– Een analytische beoordeling wordt door deskundige beoordelaars vaak als een strak keurslijf ervaren

wat afbreuk kan doen aan de acceptabiliteit.– Leerlingen kunnen in de verleiding komen om voorafgaand aan de toetsing de gedetailleerde

beoordelingslijst uit het hoofd te leren. Dit fenomeen wordt wel omschreven als strategisch gedragdat het gevolg is van transparantie.

– Een derde punt van kritiek is het feit dat in de praktijk niet altijd gewerkt wordt op de systematischeen gedetailleerde wijze zoals wordt gesuggereerd met een gedetailleerde beoordelingslijst. Naarmateeen leerlingen zijn gevorderd in de opleiding en meer praktijkervaring opdoen, moet er ook aandachtworden besteed aan de individuele variatie bij de uitvoering van vaardigheden.

– Als laatste kritiekpunt wordt het gevaar voor trivialiteit genoemd. Ook hier geldt dat dit met namevan toepassing is tijdens toetsing van de gevorderde leerlingen. Het klaarleggen van materiaal is

82

Page 87: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: algemene richtlijnen

essentieel bij een lichamelijk onderzoek, maar is voor gevorderde leerlingen zo’n vanzelfsprekend-heid bij de taakuitvoering dat het beter is dat het wordt weggelaten in de beoordeling.

Moeten vaardigheden nu op een globale of analytische wijze worden beoordeeld? Erg veel onderzoekis er niet gedaan waarbij een directe vergelijking van analytische en globale beoordelingslijsten centraalstond. Er lijkt weinig verschil te bestaan tussen analytische en globale beoordelingen wanneer gekekenwordt naar de totale toetsbetrouwbaarheid en de inhoudsvaliditeit. Dat zou dus pleiten voor het gebruikvan meer globale beoordelingslijsten aangezien ook de voorkeur van observatoren uitgaat naar mindergedetailleerde lijsten. Toch is een nuancering hier op zijn plaats. Ondanks het feit dat door een hogemate van detaillering de acceptabiliteit en de hanteerbaarheid van een beoordelingslijst vermindert, kanin bepaalde gevallen een gedetailleerde lijst erg nuttig zijn. Bij diagnosticering is een analytische lijstgewenst omdat uitvoerige feedback mogelijk is. Wanneer observatoren geen vakdeskundigen zijn isdetaillering noodzakelijk in verband met de objectiviteit van de meting. Verder is in het begin van deopleiding of bij het aanleren van nieuwe vaardigheden een analytische beoordeling onoverkomelijk omdatveel aspecten van een vaardigheid pas zijn aangeleerd en dus ook getoetst moeten worden. Het is daaromook niet verwonderlijk dat de mate van detaillering bij het beoordelen gedurende de opleiding varieertvan zeer gedetailleerd in de beginfase tot globaal in de eindfase.

SchaalvormNaast de detaillering van de beoordelingslijst (d.w.z. het aantal items) is de wijze waarop de itemsworden gescoord een kenmerkend aspect van de vorm van de beoordelingslijst. Dit aspect noemt menwel de schaalvorm. Er kunnen drie schaalvormen worden onderscheiden:– de checklist (inventarisatielijst);– de ratingscale (waarderingsschaal);– de productscale (modellenreeks).

Checklistsworden gebruikt om te inventariseren welke aspecten van het uitvoeringsproces vertoondworden of om de aan- c.q. afwezigheid van bepaalde kwaliteitskenmerken in een product te signaleren(zie tabel 29 voor een voorbeeld van een (onderdeel uit een) checklist voor een verpleegkundige taak).Waar een voorgeschreven volgorde van stappen in de taakuitvoering van belang is, moeten afwijkingendaarvan op eenvoudige en inzichtelijke wijze (d.w.z. dat achteraf moeiteloos gereconstrueerd moetkunnen worden welke stappen onderling verwisseld zijn) op de checklist genoteerd kunnen worden.

tabel 29 - Voorbeeld van een checklist

ja nee n.v.t.

. . . . . . . . .

bepaalt bloeddrukwaarde

- plaatst membraam in elleboogplooi

- laat manchet met een snelheid van 2 à 3 mmHg/s leeglopen

- laat manchet ononderbroken leeglopen

- leest de stand van de kwikkolom op ooghoogte af

. . . . . . . . .

Bij een ratingscalewordt een component van een proces of product niet alleen op aan- of afwezigheidgecheckt, maar wordt er tevens een waardeoordeel aan toegekend. Deze oordelen liggen op eencontinuüm van goed naar slecht, van hoog naar laag, etc. Ratingscales kunnen op zeer veel verschillendemanieren worden vormgegeven. In de praktijk wordt vaak gebruikgemaakt van de grafische ratingscale.

83

Page 88: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 6

Kenmerkend voor zo’n schaal is dat elke component van een proces of product beoordeeld wordt dooreen checkmark te plaatsen op een horizontale lijn. Over het algemeen worden op deze lijn tussen drieen zeven posities (ankers) gemarkeerd, die al dan niet gedetailleerd omschreven zijn (zie tabel 30).

De beoordelaar mag echter op elke plek een checkmark zetten en is dus niet verplicht om voor een van

tabel 30 - Voorbeeld van een ratingscale

De afwerking van het product is:

onacceptabel gebrekkig vrij van gebreken excellent

de omschreven posities te kiezen. Gedetailleerde omschrijving van de ankers is tijdrovend en daaromalleen aan te bevelen in situaties waarin de kans groot is dat de gespecificeerde gedragingen ofeigenschappen inderdaad geobserveerd kunnen worden. Naarmate de test levensechter is, wordt die kansechter kleiner als gevolg van de geringere standaardisatie en daardoor gereduceerde voorspelbaarheid vanhet te beoordelen gedrag.Over het optimale aantal ankers bestaan veel verschillende opvattingen. Enkele overwegingen daarbijluiden als volgt. Bij het beoordelen van vaardigheden is een gedetailleerde uitspraak in de vorm van eencijfer tussen 1 en 10 een weinig realistisch streven. De over het algemeen lage betrouwbaarheid staateen dergelijke nauwkeurigheid niet toe; er is in feite sprake van een schijnnauwkeurigheid.Het simpele onderscheid voldoende-onvoldoende lijkt dan een aantrekkelijk alternatief, ware het niet datniet zelden te weinig informatie voorhanden is om de keuze tussen deze twee te maken. Tussen beideuitersten zou een tussencategorie ’twijfelachtig’ moeten komen om de beoordelaar te behoeden voor eenimpasse en een vervolgens waarschijnlijk arbitraire keuze.Om prestaties die duidelijk boven het gemiddelde liggen toch als zodanig te kunnen waarderen, dientde driepuntsschaal met een categorie ’goed’ uitgebreid te worden tot een vierpuntsschaal. Dit biedtleerlingen de gelegenheid om zich enerzijds te onderscheiden en anders compensatiepunten te vergaren.Voor het evenwicht en de symmetrie zou dan ook een categorie ’slecht’ toegevoegd kunnen worden.Bindende adviezen zijn hierover in feite dus niet te geven. In hoofdstuk 6, waarin concrete voorbeeldenvan bestaande beoordelingsinstrumenten de revue passeren, zullen dan ook diverse varianten te vindenzijn. Het is echter wel aan te bevelen dat de docenten onderling overeenstemming te bereiken over dete hanteren schaal. Dit bevordert de communicatie tussen de verschillende docenten en tussen docentenen leerlingen (iedereen weet wat ’goed’ betekent).

Deproductscaletot slot is een instrument dat alleen voor de beoordeling van tastbare producten gebruiktwordt. De beoordelaar krijgt daarbij de beschikking over een serie producten die verschillendekwaliteiten representeren. Het gebruik van de schaal behelst dat de beoordelaar het te beoordelen productvergelijkt met elk van de geschaalde producten, totdat er sprake is van een ’match’. Het beoordeeldeproduct krijgt dan de waarde toegekend van het geschaalde product waarop het het meest lijkt. Andersdan bij checklists of ratingscales zijn productbeoordelingen op basis van productscales globaal van aard.Globale beoordeling kan een oplossing zijn als het moeilijk is om aan een product meer, onafhankelijkeaspecten te onderscheiden die de kwaliteit beïnvloeden. Productscales worden bijvoorbeeld gebruikt inhet preklinisch vaardigheidsonderwijs in de tandheelkunde om de afwerking van restauraties (vullingen)in plastic tanden of kiezen beter te kunnen beoordelen.

84

Page 89: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: algemene richtlijnen

WegingHet laatste punt waarover een besluit moet worden genomen is de weging: moet elk criterium evenveelpunten krijgen of zijn er criteria die een groter gewicht moeten krijgen dan andere? In sommige gevallenkan besloten worden om criteria te wegen, om redenen van aanvaardbaarheid van de toets: gewogenschema’s wekken een zorgvuldiger indruk dan ongewogen schema’s. In het algemeen blijkt echter datweging vrijwel niet van invloed is op het eindcijfer: alle criteria kunnen evenveel punten krijgen.Na het vaststellen van het maximumaantal punten per beoordelingscriterium moet worden aangegeven,indien mogelijk, hoe het totaal aantal punten verdeeld moet worden: wanneer krijgt een leerling eenmaximumscore van bijvoorbeeld 3 punten en wanneer krijgt hij 0, 1 of 2 punten?Bij sommige handelingen is het niet mogelijk onderscheid aan te brengen. Als er een beoordelingscriteri-um is zoals ’de leerling sluit de bedgordijnen’ dan is dat alleen met ja of nee te scoren. Dat is dan duseen scoring van 0 of de maximale score.Ten slotte worden ook wel minpunten toegekend: voor het ten onrechte of ten overvloede uitvoeren vaneen bepaalde handeling worden strafpunten gegeven.

7B Ontwikkel een scoringsvoorschriftEr moet duidelijk op papier komen te staan op welke manier de beoordelaars met de beoordelingslijstmoeten omgaan. In zo’n scoringsvoorschrift moeten aandacht besteed worden aan:– het aantal scorepunten per item;– de score van gedeeltelijke juiste handelingen;– het eventuele verschil tussen een niet-uitgevoerde en fout-gevoerde handeling;– het al dan niet gelijktijdig observeren en scoren;– de wijze waarop moet worden omgegaan met verbetering van eventueel eerder gemaakte fouten;– de mogelijkheid van compensatie van samenhangende handelingen die tezamen één item vormen.

8 Bepaal de cesuurCesuurbepaling kan in principe op twee manieren: disjunctief en conjunctief. Bij de disjunctieve methodewordt een kritische score vastgesteld door voor elk beoordelingsaspect afzonderlijk een minimaal tebehalen score te bepalen. Bij de conjunctieve methode wordt op basis van het minimale en maximaleaantal te behalen punten een kritische score vastgesteld, zonder dat er verdere restricties geformuleerdworden over de wijze waarop die score tot stand komt. Een lage score op een bepaald aspect kan dangecompenseerd worden door een hoge score op een ander aspect.

9 Schrijf een handleiding voor de testleiderDe handleiding moet informatie bevatten over de voorbereidingen die getroffen moeten worden, dehandelwijze tijdens de afname en de wijze van scoring na de afname. Aanwijzingen hiervoor staanvermeld in hoofdstuk 8.

10 Train beoordelaars in het gebruik van het beoordelingsinstrumentBeoordelingsinstrumenten zijn zelden of nooit dermate duidelijk in de formuleringen van hun criteria,dat elke beoordelaar hetzelfde daaronder verstaat. Het gevolg is dat beoordelaars de criteria gaaninterpreteren en daarmee subjectiviteit brengen in hun beoordeling. Beoordelaarstraining heeft tot doelde interpretatie van de criteria hetzelfde te laten zijn voor elke beoordelaar. Diverse studies hebben latenzien dat het mogelijk is (in ieder geval voor de korte termijn) om de interbeoordelaarsovereenstemmingte verhogen door training van beoordelaars.

De rol van observator kan door verschillende personen worden vervuld. Doorgaans zijn hetvakinhoudelijk deskundigen die de kandidaat observeren en beoordelen. Bij een patiëntsimulatie kan ookdegene die de patiënt speelt voor de meting van de kandidaten worden ingezet.

85

Page 90: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 6

In het voorgaande wordt steeds gesproken over beoordelaars. Volgens de formule op bladzijde 9 zou ditbetekenen dat er niet alleen sprake is van een meting, maar ook van waarderen. In feite is dat ook zo:vaak moet al op itemniveau een waardeoordeel (goed vs. fout) uitgesproken worden. Uiteraard wordtachteraf een oordeel gegeven over de gehele vaardigheid en wordt daarbij aan de waardering een(didactische) beslissing gekoppeld.

86

Page 91: Verantwoord Meten In Het Gezondheidszorgonderwijs

7 Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

7.1 Gesloten vragen

Een gesloten vraag is een vraagtype waarbij de leerling moet kiezen uit een beperkt aantal antwoordmo-gelijkheden die vooraf gegeven zijn. Een gesloten vraag bestaat uit een stam en een aantal alternatieven.Alleen in de stam wordt de vraag of het probleem gesteld. In de alternatieven bevinden zich naast éénjuist antwoord (= de sleutel) een of meer afleiders.Een voorbeeld van een vierkeuzevraag:

Welk orgaan breekt alcohol af? (stam)A bijnier (afleider)B dunne darm (afleider)

@ C lever (juiste antwoord of sleutel)1

D maag (afleider)

Niet elke gesloten vraag hoeft vier alternatieven te hebben. Het minimum is uiteraard twee. Er is danmeestal sprake van een waar/onwaar-vraag of ja/nee-vraag. Over het algemeen wordt zes alternatievenals het maximum gezien: de vraag dreigt dan onoverzichtelijk en minder efficiënt te worden.

7.1.1 Vraagformulering

De vraag kan op verschillende manieren in de stam geformuleerd worden. Er kan onderscheid wordengemaakt in een positief geformuleerde stam en een negatief geformuleerde stam.

– Positief geformuleerd.Voorbeeld:Welke van onderstaande bestanddelen van de voeding zijn belangrijk voor de opbouw vanlichaamscellen?

@ A eiwittenB koolhydratenC vettenD vitamines

– Negatief geformuleerd.Wanneer de stam negatief geformuleerd wordt, verdient het aanbeveling de leerling hier door de lay-out op te wijzen, bijvoorbeeld door negatieve woord te onderstrepen of in hoofdletters te zetten. Eennegatieve stam zou anders wel een strikvraag kunnen zijn.In het algemeen is de positieve vorm te verkiezen. Door bij onderstaand voorbeeld te vragen naarde 2e lijn van de gezondheidszorg wordt de vraag op eenvoudige wijze een positieve formulering.Voorbeeld:

1 De sleutel wordt aangegeven door een @-teken voor het betreffende alternatief.

87

Page 92: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

Welk beroep behoortNIET tot de 1e lijn van de gezondheidszorg?A huisarts

@ B specialistC wijkverpleegkundige

7.1.2 Vraagtypen

Daarnaast is een indeling te maken naar vraagtypen:– een directe vraag;– een zin met weglating van het einde;– een zin met weglating in het midden;– een zin met dubbele weglating in het midden (invulvraag);– een enkelvoudige stellingvraag (waar/onwaar- of ja/nee-vraag);– een dubbele stellingvraag.

– Directe vraagDeze vraagvorm verdient in het algemeen de voorkeur, omdat de constructeur gedwongen wordt hetprobleem te omschrijven, waardoor de vraag voor de leerling duidelijk wordt.Voorbeeld:Waartoe leidt, volgens Erikson, een positieve oplossing van het kernconflict in de kleutertijd?

@ A initiatiefB vertrouwenC vlijtD zelfstandigheid

– Zin met weglating van het eindeBij deze vraagvorm moet u er goed op letten dat het probleem in de stam duidelijk wordt. Het goedealternatief zou de leerling moeten kunnen geven zonder dat de alternatieven zichtbaar zijn.Voorbeeld:Volgens de psychoanalytische theorie wordt de basis van de persoonlijkheid gevormd door

@ A driften.B het geweten.C identificatie.D onbewuste conflicten.

– Zin met weglating in het middenVoorbeeld:Wanneer een verpleegkundige een probleemgesprek voert met een patiënt, is er sprake van ...communicatie.A horizontale, intentioneleB horizontale, niet-intentionele

@ C verticale, intentioneleD verticale, niet-intentionele

88

Page 93: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

– Zin met dubbele weglating in het midden (invulvraag)Voorbeeld:De linker kamer van het hart heeft een (1) ... wand dan de rechter kamer en de linker kamer heeftten opzichte van de rechter kamer een (2) ... slagvolume.

@ A (1) dikkere --- (2) gelijkB (1) dikkere --- (2) groterC (1) dunnere --- (2) gelijkD (1) dunnere --- (2) groter

– Enkelvoudige stellingvraag (waar/onwaar-vraag of ja/nee-vraag)Een ja/nee-vraag bestaat uit een bewering die beoordeeld moet worden als waar of onwaar, goed offout, mee eens of mee oneens, enzovoort. Het grootste voordeel van dit type vraag is dat debeantwoording heel weinig tijd vraagt van de leerling en dus dat er in de toegemeten tijd veel vanbeantwoord kunnen worden. Dit komt de dekking van de leerstof ten goede. Geheel ten onrechtestaat dit type vraag bekend als eenvoudig te construeren: je pakt een bewering uit een syllabus ofstudieboek en klaar is Kees. Eventueel wordt er iets aan die bewering veranderd om hem ’onwaar’te maken. Deze handelwijze moet om twee redenen worden ontraden. In de eerste plaats omdat opdeze wijze het studiegedrag gestuurd wordt in de richting van ’van buiten leren’. In de tweede plaatsomdat beweringen buiten de context vaak niet ondubbelzinnig waar of onwaar zijn.Het is overigens beslist niet waar dat ja/nee-vragen alleen geschikt zouden zijn voor het evaluerenvan reproductieve operaties; ook inzicht in de stof kan ermee vastgesteld worden zoals onderstaandvoorbeeld kan aantonen (voorwaarde is dat in de les of in de studieteksten het betreffende voorbeeldniet behandeld is, maar dat alleen aandacht is besteed aan de eigenschap van zout om vocht vast tehouden).Voorbeeld:Als een persoon met hoge bloeddruk een streng natriumbeperkt dieetkrijgt voorgeschreven, is de kans groot dat hij meer gaat urineren. ja / nee

Dit is in feite een tweekeuzevraag, waarbij overigens in de stam geen vraag wordt gesteld. Voor degehele toets wordt volstaan met de instructie ’Geef van onderstaande uitspraken aan of ze waar ofonwaar zijn.’Voorbeeld:In alle slagaders stroomt het bloed van het hart af.

@ A waarB onwaarHet is aan te bevelen termen als ’altijd’, ’nooit’, ’alleen’ en ’alle’ in dergelijke stelling te vermijden.Stellingen die deze termen bevatten zijn meestal onjuist. Bovenstaand voorbeeld vormt daarop eenuitzondering.

– TweestellingenvraagDit type vraag moet voldoen aan de volgende eisen (naast de eis die voor de enkelvoudigestellingvraag geldt):. De twee in de stam genoemde stellingen moeten verband met elkaar houden. Als dit niet het

geval zou zijn kunnen er beter twee afzonderlijke vragen over gesteld worden.. De stellingen mogen elkaar niet uitsluiten, zodat alle vier de standaardalternatieven mogelijk zijn.

Deze luiden:A I en II zijn juist.B Alleen I is juist.C Alleen II is juist.D I en II zijn niet juist.

89

Page 94: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

. Vóór de stellingen moet een instructie voor de leerlingen staan, bijv. ’Beoordeel de juistheid vanonderstaande stellingen.’

Voorbeeld van een tweestellingenvraag:Beoordeel de juistheid van onderstaande stellingen.I Het voordeel van een bedzeil is dat het matras beschermd wordt tegen inwerking van vocht.II Het nadeel van een bedzeil is dat het de kans op doorliggen bij de patiënt verhoogt.

@ A I en II zijn juist.B Alleen I is juist.C Alleen II is juist.D I en II zijn niet juist.

– Voorbeeld van een, twee of meer uitspraken vraag (cluster):Welke van onderstaande vormen van incontinentie kunnen zich als gevolg van eenCVA ontwikkelen?1 overloop-incontinentie2 stress-incontinentie3 urge-incontinentieA alleen 1 en 2

@ B alleen 1 en 3C alleen 2 en 3D alle drie

– Voorbeeld van een herordeningsvraag:De behoeftenhiërarchie van Maslow kan uitgebeeld worden als een trap.In welke volgorde, van laag naar hoog, staan de onderstaande behoeften in deze hiërarchie?1 liefde2 veiligheid3 zelfrespect4 zelfverwerkelijkingA 1 - 2 - 3 - 4B 1 - 2 - 4 - 3

@ C 2 - 1 - 3 - 4D 2 - 1 - 4 - 3

Een minder geslaagd type wordt gevormd door het volgende voorbeeld:Hieronder staan de delen van het darmkanaal van de mens vermeld.1 dikke darm2 dunne darm3 endeldarm4 maag5 slokdarm6 twaalfvingerige darmIn welke volgorde doorloopt het voedsel van de mens deze delen?A 2, 1, 3, 5, 4, 6B 4, 5, 6, 2, 1, 3C 5, 4, 6, 2, 1, 3D 6, 5, 4, 1, 2, 3Voor het beantwoorden van deze vraag hoeft de leerling alleen te weten dat het voedsel als eerstedoor de slokdarm gaat! Een open vraag verdient in dit geval de voorkeur.

90

Page 95: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

7.1.3 Algemene eisen aan gesloten vragen

– Relevantie.Hierbij gaat het om het beantwoorden van de vraag: ’In hoeverre is het item relevant ten opzichtevan wat men met het item wil meten?’.De belangrijkste zonden tegen deze eis zijn:. het item is triviaal;. het is uitsluitend een leesoefening;. het is een stokpaardje van de docent;. het is een strikvraag.

– Objectiviteit.Een item wordt als objectief beschouwd als verschillende experts allen hetzelfde alternatief als hetgoede antwoord aanwijzen.De belangrijkste zonden tegen deze eis zijn:. er wordt gevraagd naar de mening van de leerling;. meer alternatieven zijn juist;. de meningen van deskundigen zijn verdeeld.

– Specificiteit.Een item wordt specifiek genoemd als iemand het betreffende onderwijs niet genoten heeft, het itemslechts door raden op kan lossen.De belangrijkste zonden tegen deze eis zijn:. woorden als ’nooit’, ’altijd’, ’alleen’, ’alle’ wijzen vrijwel altijd in een bepaalde richting,. het juiste alternatief in wijkt lengte af van de andere alternatieven;. de items zijn afhankelijk;. het juiste alternatief staat systematisch op een bepaalde plaats staat.

– Efficiëntie.Een item is efficiënt, als het relevante informatie verschaft, terwijl de tijd die de leerling nodig heeftom het te kunnen beantwoorden zo kort mogelijk is.De belangrijkste zonden tegen deze eis zijn:. er komen ingewikkelde zinsconstructies in voor;. er worden onbekende woorden vermeld;. de aansluiting tussen de stam en de alternatieven is grammaticaal niet juist.

– Moeilijkheid.Is het item, gezien het doel van de toets, te moeilijk of te gemakkelijk? Er moet in elke toets enigevariatie in moeilijkheidsgraad van de opgaven zijn om een goed beeld te krijgen van de prestatiesvan de leerlingen, maar extreem gemakkelijke of moeilijke vragen hebben weinig zin.De belangrijkste zonden tegen deze eis zijn:. sommige vragen zijn zo gemakkelijk dat alle leerlingen het goede antwoord weten,. sommige vragen zijn zo moeilijk dat geen enkele leerling het goede antwoord weet.

7.1.4 Relevante aspecten om aandacht aan te besteden bij standaard–meerkeuzevragen

– Inhoudelijke aspecten.. Lees en beantwoord de vraag zonder naar de sleutel te kijken.. Als het antwoord fout is, ligt dat dan aan het item?

Controleer hiervoor of:

91

Page 96: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

a er wel een goed antwoord is;b er misschien meer goede antwoorden zijn;c de vraag onduidelijkheden bevat,d de alternatieven onduidelijkheden bevatten.

. Voer de controle b t/m d ook uit als het antwoord goed was.

. Is de vraag belangrijk genoeg om te stellen? (Raakt hij aan hoofdzaken, past hij in detoetsmatrijs?)

. Meet de vraag ook wat de toetsconstructeur wilde meten? (Is het doel duidelijk?)Formuleer de stam doelgericht. Ga ook achteraf na of de inhoud van de vraag past bij dedoelstelling en of de vaardigheid overeenkomt met de doelstelling.

. Is de vraag alleen te beantwoorden op basis van vakinhoudelijke kennis?

– Toetstechnische aspectenTen aanzien van de stam kunnen de volgende zaken opgemerkt worden:. Bevat de stam een duidelijke vraag of opdracht?. Bevat de stam voldoende informatie om het item te beantwoorden?

Omschrijf het referentiekader van de vraag zo duidelijk mogelijk. De leerling moet weten vanuitwelke invalshoek geantwoord moet worden.

. Bevat de stam geen overbodige informatie?Neem in de stam alleen noodzakelijke informatie op. Overbodige informatie verlengt de leestijdonnodig. Bovendien is overbodige leestijd voor de leerling verwarrend: het is niet duidelijk ofde informatie gebruikt moet worden bij de oplossing van het probleem.Een surplus aan informatie is alleen gewenst wanneer het de bedoeling is dat de leerling uit eenveelheid van gegevens een selectie moet maken die nodig is om het probleem op te lossen. Dedoelstelling die getoetst wordt zal bijvoorbeeld zijn: de leerling kan selecteren.

. Is de stam precies, beknopt en grammaticaal juist geformuleerd?Formuleer de stam helder en ondubbelzinnig. Voorkom dat de probleemstelling voor meerinterpretaties vatbaar is.

. Als de stam een ontkenning bevat, is die dan onderstreept of gecursiveerd?

. Bevat de stam geen dubbele ontkenning?

Ten aanzien van de alternatieven moet men rekening houden met de volgende zaken:. De meest bekende meerkeuzevorm is die van een stam met vier alternatieven (de vierkeuze-

vraag). Het is echter ook heel goed mogelijk een meerkeuzevraag met minder of meeralternatieven te construeren (tot zes alternatieven zijn de vragen te verwerken tot toets- enitemanalyses). Ook is het niet noodzakelijk dat een toets bestaat uit allemaal meerkeuzevragenmet eenzelfde aantal alternatieven.

. Slechts één van de alternatieven mag juist zijn.

. De alternatieven moeten zo duidelijk zijn dat de essentiële verschillen ertussen goed uitkomen.

. Stel altijd eerst het juist alternatief op en pas daarna de afleiders.

. De afleiders moeten geloofwaardig zijn voor die leerlingen die de stof niet goed beheersen.

. Gebruik als afleiders ook leermoeilijkheden en veel voorkomende vergissingen.

. Rangschik de alternatieven in een logische volgorde, zoals opklimmende getalsgrootte ofalfabetische volgorde, om te zorgen dat het goede antwoord op een willekeurige plaats komt.

. Alle alternatieven van een item moeten overeenkomen in uitgangspunt, grammaticale structuuren algemene indruk (lengte!).

. Het alternatief ’geen van bovengenoemde’ of ’alle bovengenoemde’ is niet wenselijk, omdat ditmeestal onjuist is.

. Wanneer de verschillen tussen de alternatieven groot zijn, is het item meestal gemakkelijk. Hetitem kan moeilijker gemaakt worden door de verschillen tussen de alternatieven te verfijnen.

92

Page 97: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

. Er komen geen termen uit de stam terug in het goede alternatief.

. In de afleiders staan geen woorden als ’altijd’ of ’nooit’.

. Tussen de stam en een of meer afleiders ontstaat geen dubbele ontkenning.

. De alternatieven sluiten elkaar niet uit.

. De alternatieven sluiten grammaticaal en inhoudelijk goed aan op de stam.

7.1.5 Correctievoorschrift

Bij elke toets met gesloten vragen moet een correctievoorschrift worden opgesteld dat bestaat uit :– een beoordelaarsinstructie, waarin algemene richtlijnen staan voor de beoordeling.

Voorbeeld:. Voor ieder juist antwoord wordt 1 punt toegekend.. Wanneer geen alternatief als juist is aangegeven of meer alternatieven zijn gekozen, worden geen

punten toegekend.– de sleutel. Dit is een lijst met een overzicht per vraag van het juiste alternatief.

Een apart aspect bij het scoren van gesloten vragen is de onzekerheid die er is over het al dan niet radenvan het juiste antwoord. Er bestaan verschillende manieren om daarmee om te gaan:– gedwongen raden: een niet beantwoorde vraag wordt fout gerekend, zodat leerlingen altijd iets zullen

invullen. Een juist antwoord levert 1 punt op, een fout of niet beantwoorde vraag levert 0 punten op.Bij het bepalen van de cesuur moet de docent er rekening mee houden dat een leerling die niets weetalleen door blind gokken een bepaald percentage van de vragen goed kan beantwoorden. Bijvierkeuzevragen is dat 25%, bij tweekeuzevragen zelfs 50%. Vanzelfsprekend moet hiermee bij hetvaststellen van de testlengte rekening worden gehouden.

– een zekerheidsscore: naast het aankruisen van het (vermoedelijk) juiste alternatief moet de leerlingook aangeven of hij het antwoord zeker weet. Een goed antwoord waarvan de leerling zeker is, levertdan 2 punten op, terwijl een goed antwoord dat de leerling kennelijk gegokt heeft slechts 1 puntoplevert. Voor foute antwoorden geldt dan: als er gegokt is 0 punten en als de leerling dacht zekerte zijn van het antwoord −1 punt. Dit systeem levert een vrij complexe scoring op en wordt dan ookweinig toegepast.

– niet gokken: leerlingen krijgen de instructie om vragen waarop zij het antwoord niet weten open telaten, aangezien een fout antwoord −1 punt oplevert en een niet beantwoorde vraag 0 punten. Hoeweldit systeem pedagogisch wellicht de voorkeur verdient (het voorkomt gokgedrag), maar doordatverschillende leerlingen bij de beantwoording verschillende strategieën zullen hanteren, zijn detoetsresultaten vaak moeilijk onderling te vergelijken.

7.1.6 Screening

Na het opstellen van de vragen en het correctievoorschrift volgt het controleren van de toets. Hieronderstaat puntsgewijs aangegeven waarop gelet moet worden.

– Taalgebruik.. De vraag is grammaticaal juist geformuleerd.. De zinsconstructies zijn eenvoudig (zonder bijzinnen).. De vraag bevat geen dubbele ontkenning.. De woordkeus is eenvoudig.. De vraag is niet onnodig negatief gesteld.. De formulering is ondubbelzinnig.. Er bestaat geen gevaar dat door klemtoonverschuiving de vraag van betekenis verandert.

93

Page 98: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

– Informatie.. De vraag bevat voldoende informatie om het antwoord te kunnen geven.. De informatie en de probleemstelling zijn duidelijk te onderscheiden.

– Relevantie en inhoudsvaliditeit.. De vraagvorm is geschikt voor de te toetsen doelstelling.. De vraag is geen strikvraag (het suggereren van een probleem dat er niet is).. De vraag bevat geen onbedoelde hints voor het juiste antwoord.. De vraag bevat geen onbedoelde hints voor het juiste antwoord van een andere vraag.. De gegevens die vermeld worden zijn allemaal van belang voor het oplossen van de vraag.. Er wordt in de stam niet naar de mening van de leerling gevraagd.. De vraag bevat geen dubbele ontkenning.. De stam bevat geen overbodige informatie.. Er worden geen woorden als ’nooit’, ’alleen’, ’altijd’, ’alle’ gebruikt.. Het juiste alternatief is niet langer of korter dan de overige alternatieven.. De alternatieven staan in alfabetische volgorde.. Alle alternatieven sluiten aan op de stam (logisch of grammaticaal).. Er komen geen woorden uit de stam terug in het juiste alternatief.. De alternatieven sluiten elkaar niet uit.. De stam met alternatieven staat op één bladzijde.

– Het gebruik van contextmateriaal.. De toelichting bij de afbeeldingen is duidelijk, kort en helder geformuleerd. Het gebruik van plaatjes, grafieken etcetera is functioneel.. De afbeeldingen zijn duidelijk en voorzien van korte toelichting.. Er wordt correct naar de afbeeldingen/bijlagen verwezen.

– Presentatie/lay-out.. De vragen en vraagonderdelen zijn duidelijk van elkaar onderscheiden.. De nummering van de vragen is correct en inzichtelijk.. De algemeen geldende conventies wat betreft symboolgebruik, interpunctie en spelling zijn

aangehouden.

– Totaliteit van de toets.. De goede alternatieven zijn (zoveel mogelijk) random over de plaatsen a t/m d verdeeld. De items zijn onafhankelijk van elkaar: bevat het ene item geen cue voor het andere item?. Het hele item staat op dezelfde bladzijde.. De moeilijkheidsgraad als geheel komt overeen met de eisen.. De toets is een redelijke afspiegeling van de te toetsen doelstellingen.

– Correctievoorschrift.. Er zijn beoordelaarsinstructies.. Van elke vraag is het juiste antwoord aangegeven.. Het antwoord zelf is eenduidig juist.. Het juiste antwoord is het enig juiste alternatief.

94

Page 99: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

7.2 Open vragen

Een open vraag is een vraagtype waarbij een leerling het antwoord zelf moet formuleren.Bij open vragen hoort een correctievoorschrift of een beoordelingsschema. Een vast onderdeel van ditcorrectievoorschrift wordt gevormd door het antwoordmodel.Open vragen kunnen op verschillende manieren worden ingedeeld:– naar de lengte van het antwoord– naar complexiteit van het antwoord– naar de verlangde gedragscategorie

7.2.1 Vraagvormen naar lengte van het antwoord

– In- en aanvulvraag.Bij een in- en aanvulvraag wordt van de leerling verwacht dat hij een onvolledige zin, berekeningof tekening completeert.Voorbeelden van in- en aanvulvragenDe Nederlandse naam voor parotitis epidemica is ... .Het ademtype volgens ... wordt aangetroffen bij patiënten met een metabole acidose.

– Kort-antwoord-vraag.Dit is een vraag die met één woord/getal/symbool, een korte opsomming of met een kort zinnetjebeantwoord kan worden. Dit type vraag combineert enkele van de voordelen van open en geslotenvraagvormen. De constructie is vrij eenvoudig, de beantwoording neemt weinig tijd in beslag zodater veel vragen gesteld kunnen worden. Bij de beantwoording speelt raden nauwelijks een rol en debeoordeling kan vrij objectief geschieden. Nadeel is dat dit type vraag minder geschikt is om vastte stellen in hoeverre leerlingen de leerstof begrijpen. Wanneer uitsluitend gebruikgemaakt wordt vandit vraagtype, loopt men het risico dat leerlingen zich eenzijdig voorbereiden op het memoreren vanfeitenkennis.

De kort-antwoord-vraag kent in principe twee verschijningsvormen:1 De leerling krijgt een vraag of opdracht voorgelegd.

Voorbeeld:Noem drie verschijnselen die vaak optreden bij een hartinfarct.

2 De leerling krijgt een bewering voorgelegd waaruit een relevant woord is weggelaten.Voorbeeld:Angst, benauwdheid en pijn in de borst zijn verschijnselen die wijzen op een mogelijk ...

Voor de tweede vorm is het vaak eenvoudiger om tot een objectieve beoordeling te komen. Maar hetnadeel is dat de constructie meer tijd in beslag zal nemen in verband met het bewerkstelligen van dieobjectiviteit. De constructeur moet de bewering namelijk zodanig zien te formuleren dat elke leerling dievoldoende op de hoogte is van het onderwerp, tot het juiste antwoord zal komen.Bij de eerste vorm is het van groot belang dat alle verschijnselen die in aanmerking kunnen komen,worden opgenomen in een antwoordmodel. Het antwoordmodel bevat het juiste antwoord of deelementen die deel uit kunnen maken van het juiste antwoord. Tevens wordt in het antwoordmodel eenscoringsvoorschrift opgenomen: wat is een correct antwoord of deels correct antwoord waard?Van de leerling wordt verwacht dat hij de vraag beantwoordt door middel van een citaat (mag ook doorbegin- en eindaanduidingen van dit citaat), enkele woorden, een enkelvoudige zin, getal, (eenvoudige)tekening of formule.

95

Page 100: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

– Voorbeelden van kort-antwoord-vragen. (Naar aanleiding van een tekst:)

Welk verpleegsysteem wordt op deze afdeling gehanteerd?. Noem 3 belangrijke symptomen van mazelen.

N.B.: Een in- en aanvulvraag is ook een voorbeeld van een kort-antwoord-vraag!

– Lang-antwoord-vraag.De lang-antwoord-vraag wijkt af van de kort-antwoord-vraag in de lengte van het antwoord, maarvooral in de diversiteit van de responsen. Het antwoord op een dergelijk vraagtype kan vaak optalloze manieren geformuleerd worden. In verband met een zo objectief mogelijke beoordelingworden hoge eisen gesteld aan de formulering van de vraag/opdracht en het antwoordmodel. Devraag/opdracht mag de leerling niet in het ongewisse laten over wat de vragensteller nu eigenlijk vanhem wil weten. Duidelijk aangegeven moet worden over welk onderwerp het gaat, welke vraag deleerling moet beantwoorden en van welke omvang dit moet zijn. Het antwoordmodel moet minimaalaangeven welke elementen in het antwoord aanwezig moeten zijn en hoe er gescoord moet worden.

Fout voorbeeld:Geef een beschrijving van het spijsverteringsstelsel.Goed voorbeeld:Iemand eet een bruine boterham met boter en kaas. Beschrijf welke delen van het darmkanaal hetvoedsel achtereenvolgens passeert en welke voedingsstoffen daar verteerd worden (max. 50woorden).

Bij een lang-antwoord-vraag wordt van de leerling verwacht dat hij de vraag beantwoordt doormiddel van een samengestelde zin of een toelichting, een gecompliceerde berekening of tekening,of een bewijs bestaande uit verschillende stappen.Voorbeeld:Een functioneringsgesprek en een beoordelingsgesprek verschillen op een aantal belangrijke puntenvan elkaar.Noem 3 van deze verschillen.

– Opstelvraag.Bij een opstelvraag moet een leerling een aanzienlijk stuk tekst, gestructureerd bijvoorbeeld naarinleiding, midden en slot, of een zeer gedetailleerde tekening of berekening produceren, die beideals een afgerond geheel beschouwd kunnen worden.Voorbeeld:Beschrijf aan de hand van de verschillende fasen uit het verpleegkundig proces waar de verantwoor-delijkheden en bevoegdheden liggen van de eerst verantwoordelijke verpleegkundige.

N.B. Het verdient in alle gevallen aanbeveling om aan de leerling duidelijk te maken hoeuitgebreid het antwoord moet worden. Hierdoor wordt het gegeven antwoord ook beter tebeoordelen. Dit kan bereikt worden door een complexe vraag op te delen in afzonderlijkesubvragen.

96

Page 101: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

7.2.2 Indeling naar complexiteit van het antwoord

Wanneer de vraag al dan niet opgedeeld wordt in subvragen, ontstaan de volgende vraagvormen:

– Enkelvoudige vraag. Hiervan is sprake als er maar naar één antwoord gevraagd wordt.– Meervoudige vraag. Van een meervoudige vraag is sprake als er expliciet naar meer dan één

antwoord gevraagd wordt. Echter ook als een leerling in zijn antwoord met meer facetten van eenprobleemstelling rekening moet houden, of wanneer het werk aan meer dan één, van tevorenomschreven, criterium moet voldoen.

Voorbeeld van een serievraag(naar aanleiding van een inleidende tekst:)A Noem 1 consequentie die deze ontwikkeling heeft voor het verzorgingstehuis als organisatie.B Noem 1 consequentie die deze ontwikkeling heeft voor de verzorgenden van het verzorgingste-

huis.

Voorbeeld van een samengestelde vraag(naar aanleiding van een casus:)Beschrijf een mogelijke aanpak om Wouter meer bij de groep te betrekken.Motiveer je antwoord.

7.2.3 Indeling open vragen naar gedragscategorie

Kijkend naar de verlangde gedragscategorie, kunnen de volgende vraagtypen worden onderscheiden:– reproductievraag;– identificatievraag;– productievraag;– vrije verwerkingsvraag.Bij de eerste twee soorten ligt het accent op de geheugenfunctie. Bij de laatste twee soorten op het actiefomgaan met de opgedane kennis en ervaring.Hierbij is het goed dat men zich realiseert dat bij deze indeling uitsluitend gekeken wordt naar hetgedrag dat de vraag beoogt uit te lokken. En dus niet naar het feitelijke gedrag van de leerling bij hetbeantwoorden van de vragen, zo dat al te constateren zou zijn.

– ReproductievraagKenmerken:. Er wordt gevraagd naar jaartallen, definities, namen, etcetera.. Er wordt gevraagd naar een gestandaardiseerde werkwijze.Voorbeelden:Wat is de oorzaak van een pernicieuze anemie?Hoeveel ml moet je toedienen aan een patiënt die 50 mg van een antibioticum moet hebben uit eenampul met een 4%-oplossing?

– Identificatievraag.Kenmerk. In de vraag zelf is informatie in de vorm van een tekst, tekening, grafiek, tabel, partituur,

etcetera.

97

Page 102: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

Voorbeelden:In de onderstaande tabel staat de vochtbalans zoals die vandaag voor mevrouw Dommisse isingevuld. Er zitten 8 fouten in.Zoek hiervan 6 fouten op.

tabel 31 - Uitgangsmateriaal voor een identificatievraag

VOCHTBALANS

Naam :

Datum :

TIJD

VOCHTOPNAME VOCHTVERLIES

BIJZONDERHEDENopgegeven

cc per os

soort (op)genomen

cc per os

parenteraal urine braken defaecatie

8.00 150 ml thee 150 ml

9.00 150 ml melk

100 ml

12.00 150 ml bouillon 100 ml

15.00 100 ml thee 100 ml

16.00 1 glas sap 100 ml

17.00 150 ml thee 100 ml 100 ml is heftig gaan men-

strueren

18.00 100 ml sap 100 ml

20.00 100 ml vla 100 ml

21.00 150 ml sap 100 ml 200 ml transpiratie

TOTAAL 950 ml 400 ml

– Productievraag.Kenmerken:. Probleemstelling is min of meer nieuw voor de leerlingen.. De gevraagde handeling is niet-routinematig van karakter.Voorbeelden:(naar aanleiding van een casus over een leerling:)Pieter begon als jongen die alleen met de beste resultaten tevreden was. Eenmaal begonnen met deopleiding blijkt het toch niet helemaal te gaan zoals hij had gedacht.Leg in je eigen woorden uit waarom het niet zo gaat als Pieter gedacht had en maak daarbij gebruikvan gegevens uit de casus.(naar aanleiding van een gegeven menu:)Noteer een gelijkwaardig en een volwaardig vegetarisch vervangingsmenu.

98

Page 103: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

– Vrije verwerkingsvraag.Kenmerken:. De oplossing van het probleem is individueel bepaald.. De vraag bevat nieuwe probleemsituaties en/of is ongebruikelijk wat oplosmethode betreft.Voorbeeld:... (enkele citaten uit kranten met betrekking tot een bepaald onderwerp) ...Schrijf, uitgaande van deze citaten, in maximaal 1500 woorden jouw visie op dit onderwerp.Deze visie is bedoeld als ingezonden stuk voor een van de geciteerde kranten.

7.2.4 Eisen voor de formulering

– Doelgericht vragen stellen.Stel de vragen doelgericht. Ga ook achteraf na of de inhoud van de vraag past bij de doelstelling enof de vaardigheid overeenkomt met de doelstelling. Een inzichtdoelstelling kan niet getoetst wordenmet een kennisvraag.

– Referentiekader duidelijk stellen.Omschrijf het referentiekader van de vraag zo duidelijk mogelijk. De leerling moet weten vanuitwelke invalshoek geantwoord moet worden.Fout voorbeeld:Waarom wordt bij een patiënt met aambeien de temperatuur tweemaal daags axillair opgenomen?Deze vraag kan veel antwoorden oproepen die op zichzelf correct zijn, maar die niet gewenst zijn,zoals:. levert informatie voor het verpleegplan;. is nu eenmaal routine in het ziekenhuis;. vaker temperatuur opnemen zou te belastend zijn voor de patiënt;. temperatuurgegevens zijn onmisbaar bij beoordeling van het ziekteverloop;. de lichaamstemperatuur is ’s morgens anders dan ’s avonds.

Door het referentiekader aan te geven kunnen de antwoordmogelijkheden ingeperkt worden waardoorde vraag gericht wordt op de eigenlijke doelstelling.Goed voorbeeld:Bij een patiënt met aambeien wordt de temperatuur tweemaal daags axillair opgenomen.Geef één reden waarom dat tweemaal daags gebeurt.Geef één reden waarom dat axillair gebeurt.

– Duidelijk aangeven wat verlangd wordt?Geef duidelijk aan wat van de leerling verlangd wordt. Vermijd dus termen als ’minimaal’ en’maximaal’. In plaats van een vraag als ’Geef minimaal 3 redenen die...’ kan beter gevraagd worden’Geef 4 redenen die...’. De toevoeging ’minimaal’ maakt het voor de leerling en voor de docentonduidelijk hoeveel redenen gegeven moeten worden om het maximum puntenaantal te behalen.Als hulpmiddel:. Als het aantal elementen vastligt en de leerling moet dit weten, dan wordt het aantal niet

vermeld.Voorbeeld:Noem de gehoorbeentjes.

99

Page 104: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

. Als het aantal elementen vastligt, maar de leerling hoeft het aantal niet te weten, wordt het aantalwel vermeld inclusief het lidwoord.Voorbeeld:Noem de 3 gehoorbeentjes.

. Als het aantal elementen niet vastligt of als de leerling niet alle (vastliggende) elementen hoeftte noemen, wordt het aantal zonder lidwoord vermeld.Voorbeeld: Noem 2 gehoorbeentjes.

. Wanneer bij een berekening ook de berekening zelf door de leerling genoteerd moet worden,moet hier ook expliciet naar gevraagd worden.Voorbeeld:Geef de berekening van ... ofToon met een berekening aan dat ...

Wanneer hier niet naar gevraagd wordt, kunnen er bij de beoordeling geen punten gegeven wordenvoor een gedeeltelijk goed antwoord (bijv. rekenfout).

– Alleen noodzakelijke informatie opnemen.Neem in de vraag alleen noodzakelijke informatie op. Overbodige informatie verlengt de leestijdonnodig. Bovendien is overbodige leestijd voor de leerling verwarrend: het is niet duidelijk of deinformatie gebruikt moet worden bij de oplossing van het probleem.Een surplus aan informatie is alleen gewenst wanneer het de bedoeling is dat de leerling uit eenveelheid van gegevens een selectie moet maken die nodig is om het probleem op te lossen. Dedoelstelling die getoetst wordt zal bijvoorbeeld zijn: de leerling kan selecteren.

– Punten vermelden.Geef bij de vragen aan hoeveel punten er te verdienen zijn.

– Helder en ondubbelzinnig formuleren.Formuleer de vraag helder en ondubbelzinnig. Voorkom dat de probleemstelling voor meerinterpretaties vatbaar is, waardoor én de leerling én de docent vragen krijgen bij het beantwoordendan wel bij het corrigeren van de antwoorden. Een leerling maakt vaak voor één diploma meerexamens. Het formuleren van de examenvragen vindt plaats in de afzonderlijke examencommissies.Daardoor bestaat het gevaar dat eenzelfde soort antwoord verwacht wordt terwijl de vragen zeerverschillende geformuleerd zijn. Voor de leerling kan dit verwarrend zijn.Om dit te voorkomen is het van belang uit te gaan van richtlijnen voor het formuleren van devragen. Hieronder staat aangegeven welke formulering gekozen zou moeten worden bij welk soortvraag. Er is aangegeven of bij de formulering een lang of een kort antwoord wordt verwacht.

Formulering eventuele aanwijzing met voorbeeld

Noem Dit is een kort-antwoord-vraag die te gebruiken is bij een vraag naar iets concreetszoals term, plaats, gebeurtenis; bijvoorbeeld:– Noem 4 mogelijke acties van de verpleegkundige om in deze situatie verbetering

te brengen.– Noem 5 kenmerken van ...

Geef (aan) ’Geef..’ kan een kort- of een lang-antwoord-vraag zijn die te gebruiken is bij eenvraag naar iets abstracts zoals een reden, oorzaak. (Dus niet: waarom...) Bijvoorbeeld:– Geef 1 voordeel en 1 nadeel van de non-directieve gesprekstechniek.– Geef de formule van ..

100

Page 105: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

Hoe... Deze kort-antwoord-vraag is te gebruiken bij kwantitatieve vragen; bijvoorbeeld:– Hoeveel °C moet men bij axillaire temperatuuropname bij de gemeten waarde

optellen?– Hoe lang moet bij axillaire temperatuuropname de thermometer in de okselholte

blijven?

Wie ’Wie’ kan gebruikt worden in combinatie met voorzetsels; een voorbeeld van dezekort-antwoord-vraag:– Wie was de ontdekker van de penicilline?

Wat Dit is een kort-antwoord-vraag; bijvoorbeeld:– Wat is de betekenis van de letters in de afkortingCARA?– Wat wordt verstaan onder ...?

Waar ’Waar’ kan gebruikt worden in combinatie met voorzetsels en heeft dan betrekking opeen concrete plaatsaanduiding; voorbeelden van deze kort-antwoord-vraag:– Waar staat de oudste Nederlandse inrichting voor het verplegen van psychisch

zieken?– Waarin ...

Welke ’Welke’ kan worden gebruikt in combinatie met voorzetsels. ’Welke’ is bij voorkeureen vraag naar een concreet object of een concrete categorie; voorbeelden van dezekort-antwoord-vraag:– In welk document is de bescherming geregeld van de gegevens van de patiënt?– Voor welke waarde van .. geldt ..?

Wanneer Een voorbeeld van deze kort-antwoord-vraag:– Wanneer is Florence Nightingale geboren?

Leg uit Dit is een lang-antwoord-vraag; een voorbeeld:– Leg uit waarom het niet zo gaat als Pieter gedacht had en maak daarbij gebruik

van gegevens uit de casus.

Beschrijf Bij ’beschrijf’ moet een antwoordrestrictie worden opgenomen. De restrictie bij dezevraag is: ’met betrekking tot haar psychisch functioneren’. Een voorbeeld van dezelang-antwoord-vraag:– Beschrijf de 3 belangrijkste verpleegproblemen, verpleegdoelen en de verpleeg-

kundige interventies bij Wilma met betrekking tot haar psychisch functioneren.

7.2.5 Correctievoorschrift

Bij elke toets met open vragen moet een correctievoorschrift worden opgesteld. Dit is een lijst metrichtlijnen voor de docenten, waardoor de beoordeling zo objectief mogelijk wordt. Een correctievoor-schrift bestaat uit:– de beoordelaarsinstructies;– een algemeen scoringsvoorschrift;– scoringsvoorschrift per vraag.

101

Page 106: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

– De beoordelaarsinstructies.Dit zijn de algemene richtlijnen die gegeven worden over de wijze waarop de toets beoordeeld moetworden.Voorbeelden van algemene richtlijnen over de wijze van beoordelen zijn:. De beoordeling dient door twee beoordelaars onafhankelijk van elkaar te geschieden.. Het werk dient anoniem (via een leerlingnummer o.i.d.) nagekeken te worden.. Het werk dient per vraag nagekeken te worden.. Om ongewenste beoordelingseffecten tegen te gaan, dient de corrector de beoordeling van het

werk van de leerlingen per vraag uit te voeren en tijdens de correctie de volgorde vanexamenwerken enkele keren te wijzigen.

. Bij lange antwoorden mag de correctie per vraag niet onderbroken worden.

. Bij de beoordeling van een vraag worden slechts hele punten toegekend.

. Ontbreekt voor een vraag elke prestatie of is er sprake van een volledig foutief antwoord, danworden voor deze vraag nul punten toegekend.

. Indien een gegeven antwoord niet in het antwoordmodel voorkomt en dit antwoord op grond vanaantoonbare vakinhoudelijke argumenten als ’juist’ of ’gedeeltelijk juist’ gekwalificeerd kanworden, moet het aantal beschikbare punten geheel of gedeeltelijk aan het gegeven antwoordworden toegekend naar analogie van het antwoordmodel.

. Indien een leerling meer antwoorden (in de vorm van voorbeelden, redenen, argumenten e.d.)geeft dan er expliciet gevraagd worden, komen alleen de eerstgenoemde antwoorden voorbeoordeling in aanmerking. Indien er slechts één antwoord expliciet gevraagd wordt, wordt dusalleen het eerst gegeven antwoord in de beoordeling betrokken.

. Indien een leerling het juiste eindantwoord vermeldt zonder de berekening, wordt demaximumscore toegekend. Bij een eindantwoord dat niet juist is en waarbij geen berekeningvermeld staat, dienen nul punten toegekend te worden.

. Voor een correcte uitkomst van een berekening wordt alleen een deelscore toegekend indien deberekeningswijze ook correct is.

. Indien een andere oplossingsmethode is gehanteerd dan aangegeven in het antwoordmodel, moethet aantal beschikbare punten geheel of gedeeltelijk worden toegekend naar analogie van hetantwoordmodel.

– Algemeen scoringsvoorschriftHierin worden de volgende zaken vermeld:. de maximale toetsscore;. het aantal scorepunten per vraag;. de scoring van gedeeltelijk goede antwoorden.Ook zijn richtlijnen opgenomen voor het behandelen van algemene fouten als spelfouten ofrekenfouten.Als het aantal vragen groot genoeg is om te spreken van een voldoende dekking van alledoelstellingen in een toets, is het beter om de ongewogen scoring toe te passen.

– Het antwoordmodel of beoordelingsschemaHet antwoordmodel is een opsomming van goede, soms ook gedeeltelijk goede en onjuisteantwoorden bij open vragen. Zij zijn bedoeld als richtlijn voor de beoordelaar.In het antwoordmodel worden ook voorschriften opgenomen voor de beoordeling en het doorwerkenvan fouten bij afhankelijke vragen.Hierbij gaat het erom dat de corrector precies moet weten welk antwoord goed gerekend moetworden. Het gaat er dus niet om dat het antwoordmodel zo volledig mogelijk moet zijn, maar datduidelijk is welk antwoord nog net goed gerekend moet worden.

102

Page 107: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

Zo mogelijk moeten ook andere goede antwoordmogelijkheden worden aangegeven en wordenbedacht welke antwoorden door zwakke leerlingen gegeven zouden kunnen worden: de minder goedeen de foute antwoorden.Het formuleren van antwoordmogelijkheden leidt vaak tot het bijstellen van de vraag, omdat menzich dan gaat realiseren hoe een vraag ook uitgelegd kan worden. De vraag moet dan zodanigworden bijgesteld dat de niet bedoelde antwoorden worden uitgesloten.

– Scoringsvoorschrift per vraagDoor bij de antwoordonderdelen te vermelden welke score moet worden toegekend, wordt eerderbereikt dat verschillende correctoren hetzelfde leerlingwerk met eenzelfde puntenaantal beoordelen.Hierbij is het aan te bevelen aan elk antwoordelement één scorepunt toe te kennen. Bijvoorbeeld:per kenmerk 1 punt.Dit om te voorkomen dat er onduidelijkheid ontstaat bij een antwoord dat ’een beetje goed’ is. Steldat aan het goede antwoord 2 punten mogen worden toegekend, dan is onduidelijk of aan eengedeeltelijk goed antwoord misschien 1 punt kan worden toegekend. Uit onderzoek blijkt datdocenten hier heel verschillend mee om gaan.

7.2.6 Screening

Na het opstellen van de vragen en het correctievoorschrift volgt het controleren van de toets. Hieronderstaat puntsgewijs aangegeven waarop gelet moet worden.

– Taalgebruik.. De vraag is grammaticaal juist geformuleerd.. De zinsconstructies zijn eenvoudig (zonder bijzinnen).. De vraag bevat geen dubbele ontkenning.. De woordkeus is eenvoudig.. De vraag is niet onnodig negatief gesteld.. De formulering is ondubbelzinnig.. Er bestaat geen gevaar dat door klemtoonverschuiving de vraag van betekenis verandert.. De vraag bevat geen onnodige tussenvoegsels.. De formulering van de vraag kan geen aanleiding geven tot misverstanden.

– Informatie.. De vraag bevat voldoende informatie om het antwoord te kunnen geven.. De vraag geeft de gewenste lengte van het antwoord aan.. De vraag geeft de gewenste vorm (tekening, beschrijving etc.) aan.. Uit de vraag blijkt of het antwoord gemotiveerd moet worden.. De informatie en de probleemstelling zijn duidelijk te onderscheiden.

– Relevantie en inhoudsvaliditeit.. Uit de vraag blijkt duidelijk welke stof en/of welke vaardigheid getoetst wordt.. De vraag heeft een aanvaardbare moeilijkheidsgraad.. De moeilijkheidsgraad wordt niet nodeloos verhoogd door irrelevante gegevens?. De vraagvorm is geschikt voor de te toetsen doelstelling.. De vraag is geen strikvraag (het suggereren van een probleem dat er niet is).. De vraag bevat geen onbedoelde hints voor het juiste antwoord.. De gegevens die vermeld worden zijn allemaal van belang voor het oplossen van de vraag.

103

Page 108: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

– Het gebruik van contextmateriaal.. De toelichting bij de afbeeldingen is duidelijk, kort en helder geformuleerd.. Het gebruik van plaatjes, grafieken etc. is functioneel.. De afbeeldingen zijn duidelijk en voorzien van korte toelichting.. Er wordt correct naar de afbeeldingen/bijlagen verwezen.

– Presentatie/lay-out.. De vragen en vraagonderdelen zijn duidelijk van elkaar onderscheiden.. De nummering van de vragen is correct en inzichtelijk.. De tabellen, grafieken, formules e.d. zijn op fouten gecontroleerd.. Bij iedere vraag is het maximaal te behalen aantal punten vermeld.. De algemeen geldende conventies wat betreft symboolgebruik, interpunctie en spelling zijn

aangehouden.

– De totaliteit van de toets.. De moeilijkheidsgraad als geheel komt overeen met de eisen.. De toets is een redelijke afspiegeling van de te toetsen doelstellingen.. De ene vraag bevat geen onbedoelde hints voor het juiste antwoord van een andere vraag.. De moeilijkheidsgraad van de toets als geheel is aanvaardbaar voor het betreffende schooltype.. De toets als geheel vormt een redelijke representatie van de doelstellingen, zoals die voorkomen

in het ’toets’programma.

– Het correctievoorschrift.. Bij elke vraag is een antwoordmodel opgesteld.. De antwoorden in het antwoordmodel zijn waarschijnlijk.. Er is duidelijk aangegeven wat gedeeltelijk juist of onjuist gerekend moet worden.. Richtlijnen van algemene aard zijn opgenomen.. Er zijn duidelijke beoordelaarsinstructies opgenomen.. Het correctievoorschrift is niet te globaal.. Het correctievoorschrift is niet zo gedetailleerd dat het onhanteerbaar is geworden.. De lay-out van het correctievoorschrift is zodanig dat de beoordelaar snel inzicht kan krijgen in

zijn beoordelaarstaak.. Er zijn beoordelaarsinstructies.. Voor elke vraag is een antwoord opgesteld.. Het antwoord zelf is juist.. Het is duidelijk welke elementen minimaal genoemd moeten worden om het antwoord goed te

keuren.. Antwoorden waarover twijfel kan bestaan of ze goed of fout gerekend moeten worden, staan

aangegeven.. Het is duidelijk hoeveel punten aan elk antwoordelement toegekend moeten worden.

104

Page 109: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

7.3 Casustoets

In het kader van de toetsing verstaan wij onder een casus een beschrijving van een aan de praktijkontleende situatie, waaraan vanuit een of meer vakgebieden (of leergebieden) vragen gekoppeld zijn.Uitgangspunt hierbij is dat de vragen niet los van de beschrijving te beantwoorden zijn.

7.3.1 Randvoorwaarden

Enerzijds biedt een casustoets meer mogelijkheden dan een traditionele vaktoets, anderzijds levert deconstructie ook meer moeilijkheden op:– Er moet interdisciplinair samengewerkt worden, waarbij de juiste deskundigheden in de constructie-

groep aanwezig moeten zijn.– Men moet elkaars producten bekritiseren en kritiek op eigen producten kunnen accepteren.– Er moet regelmatig overleg zijn over de tussenproducten, zodat voorkomen wordt dat in een

vergevorderd stadium materiaal afgekeurd moet worden.– Men moet voldoende tijd beschikbaar hebben en een strakke planning opzetten voor het hele proces.Het is aan te bevelen om één coördinator als centrale figuur aan te stellen, die met name ook deadministratie voert en de voortgang bewaakt.

7.3.2 De drie pijlers van een casus

Een casus rust in feite op drie pijlers: de doelstellingen, de beschrijving (of casustekst) en de vragen.Deze drie zijn onderling sterk van elkaar afhankelijk. Tijdens de constructieprocedure ligt het accentweliswaar afwisselend op een bepaalde pijler, maar ze moeten toch steeds in samenhang met elkaarbekeken worden. Hieronder wordt het proces van casusconstructie stap voor stap beschreven, waarbijduidelijk wordt dat het niet om een lineair proces gaat: steeds wordt teruggesprongen naar de anderepijlers.

7.3.3 De doelstellingen

– Formuleer eerst duidelijk welke delen van de leerstof aan de orde moeten komen: raadpleeg deeindtermen, de eindtermenuitwerking, het leerplan en/of de lesdoelen. Het kan raadzaam zijn omhiervoor een toetsmatrijs op te stellen: welke onderwerpen moeten op welke wijze en in welke matein de toets aan de orde komen.

7.3.4 Van doelstellingen naar beschrijving

– Ga na in welke praktijksituatie de te toetsen leerstof aan de orde komt. Is de leerstof meer gerichtop meso- en/of macro-niveau, dan kan het nodig zijn een meer theoretische verhandeling te schrijven.Een casusbeschrijving kan veel verschillende vormen hebben:. een beschrijving van een patiënt of bewoner;. een agenda of de notulen van een multidisciplinair overleg;. een verslag van een groepsgesprek;. een advertentie voor een vacature in een zorginstelling;. een verpleegkundige dagrapportage;. een tijdschriftartikel;Het zal niet altijd mogelijk zijn een beschrijving te maken waarin alle geselecteerde doelstellingenaan bod komen. Enige creativiteit is hierbij gewenst, maar kijk uit voor al te gekunsteldebeschrijvingen. Er blijft altijd een spanningsveld bestaan tussen de relevantie voor de praktijk en de

105

Page 110: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

dekking van de theorie. Noteer welke onderwerpen blijven liggen en probeer die op een ander tijdstipmet een andere casus of op een andere manier te toetsen.

– Noteer in steekwoorden welke informatie de beschrijving moet bevatten. Bij het uitschrijven van decasustekst bestaat anders het gevaar dat bepaalde belangrijke informatie vergeten wordt of minderbelangrijke zaken onevenredig veel aandacht krijgen.

– Analyseer, na het uitschrijven van de casustekst, de beschrijving in die zin, dat systematisch wordtnagegaan welke doelstellingen aan de casustekst gekoppeld kunnen worden. Zo wordt direct duidelijkwelke passages van de casustekst eventueel kunnen worden geschrapt (tenzij ze voor de opbouw vande rest van het verhaal essentieel zijn). Bij deze analyse is het verstandig om de eerder genoemdeleerdoel-documenten opnieuw te raadplegen: het kan nieuwe ideeën opleveren.Het maken van de beschrijving en het formuleren van de doelstellingen is een iteratief proces: hetanalyseren van de beschrijving in doelstellingen betekent een heroverweging van de aanvankelijkvoor de casus geselecteerde doelstellingen. Hierbij bestaat wel het gevaar dat van de oorspronkelijkeopzet wordt afgedwaald. Wees daar alert op.

7.3.5 De opbouw van een beschrijving

– Probeer, zeker als er vaker casussen gemaakt moeten worden, een vaste opbouw voor de casustekstte vinden. Het voordeel is dat leerlingen aan zo’n stramien gewend raken, waardoor ze zich meerop de essentie van de casus kunnen richten en niet onnodig in verwarring worden gebracht door deonverwachte vorm of lengte. Ze weten dan op een gegeven moment hoe ze hun tijd moeten indelen.Zo is het mogelijk elke casus, waarin een of meer patiënten/bewoners centraal staan, te latenbeginnen met wat algemene informatie over de aard en de grootte van de instelling waar het verhaalzich afspeelt en de positie van de leerling: zo wordt duidelijk vanuit welke invalshoek de leerlingende casus moeten lezen.Hierna wordt de specifieke situatie beschreven, met achtergrondinformatie over de patiënten/bewo-ners, de persoonlijke en sociale gegevens en een schets van de huidige situatie, waarin de medischeen verpleegkundige gegevens gepresenteerd worden.Hierbij kan een bepaalde volgorde gehanteerd worden die parallel loopt met de zorggebieden zoalsdie bijvoorbeeld door Gordon beschreven zijn. Dat is tevens een middel om te controleren of allebelangrijke informatie ook genoemd wordt.

– Schrijf het verhaal of het artikel in voor de leerling begrijpelijke taal en houd hierbij de omvang vande casustekst in de gaten.Wanneer er te weinig informatie in de casustekst staat, zullen veel vragen slechts speculatiefbeantwoord kunnen worden. Een teveel aan informatie doet een te groot beroep op de leesvaardig-heid en het tekstbegrip van de leerling. Maak de zinnen niet nodeloos lang, vermijd woorden die deleerlingen mogelijk niet weten en ook niet hoeven te weten.

– Probeer een beschrijving levendig te maken: dit leest prettiger en biedt meer aanknopingspunten voorvragen. Beschrijf het reilen en zeilen op de afdeling, de interacties tussen de verpleegkundige en depatiënt/bewoner, concretiseer de gedragingen van de patiënt in plaats van dit te omschrijven.

7.3.6 Van doelstellingen naar vragen

– Probeer nu bij de geformuleerde doelstellingen een eerste aanzet tot vragen te formuleren.Het is onverstandig om direct te proberen een volmaakte vraag op papier te krijgen. De exacteformulering kost vaak veel tijd en kan daarom beter in tweede instantie plaatsvinden, wanneer al watafstand van de eerste aanzet is genomen: misschien is de vraag bij nader inzien toch niet zo goed.

– Bij het formuleren van die eerste aanzet valt ook de beslissing of het een meerkeuzevraag of eenopen vraag moet worden. Dit is deels afhankelijk van het belang dat gehecht wordt aan dedoelstelling (open vragen worden over het algemeen zwaarder meegewogen in het eindresultaat),

106

Page 111: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

deels van de praktische mogelijkheden die de doelstelling biedt: moeten de leerlingen bijvoorbeeldzelf iets onder woorden brengen of beargumenteren, dan is een meerkeuzevraag minder geschikt.Anderzijds is het niet efficiënt om een open vraag te stellen wanneer hetzelfde doel via eenmeerkeuzevraag getoetst kan worden.

– Bij het uitwerken van de doelstellingen moet de spreiding van de vragen over de beschrijving in degaten worden gehouden. Maak in eerste instantie niet te veel vragen over een en dezelfde passage.Als het echt een belangrijke passage blijkt te zijn, kan dat altijd nog.

– Uiteindelijk zal blijken dat bepaalde doelstellingen niet omgezet kunnen worden in een zinvollevraag, niet omdat de vraag niet relevant zou zijn, maar veeleer omdat het antwoord niet eenduidigte geven is.Vlucht dan niet in een open vraag, want ook op open vragen moet een eenduidig antwoord te gevenzijn, althans een antwoord dat met enige mate van objectiviteit te beoordelen is.

7.3.7 De relatie tussen de beschrijving en de vragen

– Wanneer bepaalde vragen niet gesteld kunnen worden, kan dat op zich weer consequenties hebbenvoor de beschrijving: nagegaan moet worden of bepaalde passages in de uiteindelijke vragenhelemaal niet aan de orde komen. Hier geldt weer hetzelfde als wat bij de analyse in doelstellingenis gezegd: ongebruikte passages moeten zo mogelijk geschrapt worden.

– Mede met het oog op hetgeen bij het vorige punt genoemd is, is het handig de regels van debeschrijving te nummeren. Tijdens de constructiefase verduidelijkt dit de onderlinge communicatieover de beschrijving en tijdens de toetsafname is het prettig voor de leerlingen, omdat ze bij devragen verwezen kunnen worden naar de desbetreffende passage in de casustekst, zeker als decontext van de beschrijving bij de beantwoording van de vraag extra van belang is of als de vraagbegint met een korte samenvatting van een passage.

– Zorg zoveel mogelijk dat de volgorde van de vragen synchroon loopt met de beschrijving.Dit maakt het eenvoudiger om te kijken of de vragen dekkend zijn voor de casus. Voor de leerlingenis het prettiger, omdat zij minder hoeven te zoeken en geen rare gedachtesprongen hoeven te maken.Veel leerlingen vinden het echter onprettig om steeds van vraagsoort en antwoordstrategie te moetenwisselen; dat pleit er weer voor om meerkeuze- en open vragen apart aan te bieden.

– Houd in de gaten dat bij het maken van de vragen geen nieuwe wending aan de beschrijving wordtgegeven. De vragen mogen in principe geen nieuwe informatie bevatten, omdat daarmee de overigevragen opeens in een geheel ander licht kunnen komen te staan. Wanneer dit in een vraag wordtgesignaleerd, kan het beste getracht worden deze nieuwe informatie in de beschrijving in te passen.1

– Wees kritisch op de koppeling van de vragen met de casustekst.Het zal blijken dat bepaalde vragen eenvoudig zonder de casustekst te beantwoorden zijn. Deafweging moet dan gemaakt worden om die vraag al dan niet in de casus op te nemen. Zo niet, dankan zo’n vraag nog in een andere toets worden opgenomen.Probeer geen vragen naar parate kennis maar juist motiveringsvragen te stellen, waarbij meer toetsingvan inzicht en toepassing mogelijk is.Probeer daarbij de motiveringen (per alternatief) te ontlenen aan de beschrijving: zo ontstaan echtecasusgekoppelde vragen.

1 Een geheel andere vorm krijgt een casus, wanneer de beschrijving doelbewust in stukken is gehakt. Het voordeel hiervan is,dat de leerlingen direct die vragen krijgen die over de zojuist gelezen passage gaan. Bovendien kan het verhaal eendynamischer karakter krijgen. Wel stelt deze keuze geheel eigen eisen aan de casus als geheel: de draad van het verhaalmoet door de fragmenten heen logisch zijn, de leerlingen moeten op basis van de nieuwe stukken informatie niet gaantwijfelen over eerder gegeven antwoorden, het moet geen kwaad kunnen als de leerlingen eerst alle tekstgedeeltendoorlezen, etc.

107

Page 112: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

– Wees niet bang dat bepaalde leergebieden niet voldoende bevraagd worden: probeer vakgerichtekennisvragen niet per se aan de casus te koppelen.Uiteraard kunnen naast de casus zonder bezwaar gewone vaktoetsen worden afgenomen, waariniedere betrokken docent een naar zijn mening voldoende aandeel uit zijn vakgebied kan krijgen.Uiteraard is zo’n verzameling vaktoetsen (ook wel ’nietjestoets’ genoemd) niet integratief, maar daaris op zich niets tegen. Men moet zich echter wel realiseren dat op die manier niet dezelfde(geïntegreerde) doelstellingen getoetst kunnen worden.

7.3.8 De vragen

– Controleer of de vragen elkaar overlappen of zelfs beantwoorden: het kan gebeuren dat het antwoordvan de ene vraag te vinden is in de vraagstelling van een andere vraag.Ook moet al te grote overlap vermeden worden, tenzij het een onderwerp betreft dat extra aandachtmoet krijgen.Een ander gevaar is, dat vragen afhankelijk van elkaar zijn: een vraag kan alleen beantwoord worden,wanneer de voorafgaande vraag goed beantwoord is. Wanneer dat gesignaleerd wordt, moet getrachtworden deze twee zaken in één vraag onder te brengen, bijvoorbeeld een open vraag met subvragen.

– Maak afspraken over het aantal vragen in een casus.Probeer een onder- en een bovengrens vast te stellen voor het aantal vragen: er moet recht wordengedaan aan de casustekst. Twee bladzijden tekst met 5 vragen is zeer inefficiënt, een half A4-tje met50 vragen zou weleens een versierde vaktoets kunnen blijken te zijn. In beide gevallen komt de toetsniet overeen met de verwachting die leerlingen zullen hebben na het lezen van de casustekst.

– Wees kritisch op de kwaliteit van de vragen.De vragen die bij de casus gesteld worden, moeten aan dezelfde eisen voldoen als die welke aangewone meerkeuze- en open vragen gesteld worden. Deze eisen zijn uitgebreid beschreven in de tweevoorafgaande paragrafen.

108

Page 113: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

7.4 Potlood-en-papier-toets

Zoals aangegeven in paragraaf 4.2.4 is een goede potlood-en-papier-toets meer dan alleen maar eenkennistoets, hoewel de vorm (vragen en antwoorden worden schriftelijk gepresenteerd) daar sterk aandoet denken. Met de hier bedoelde toetstechniek kunnen met name ontwerpvaardigheden enafleesvaardigheden vastgesteld worden. Hieronder worden enkele voorbeelden gegeven van de manierwaarop dergelijke vaardigheden, die over het algemeen in werkelijkheid niet schriftelijke getoondworden, toch schriftelijk getoetst kunnen worden.

7.4.1 Ontwerpvaardigheden

De leerling moet voor de komende week een werkrooster opstellen voor een afdeling. Gegeven wordenhet aantal en soort patiënten, de kwalificaties van de beschikbare medewerkers, de aantallen dagen datdoor de verschillende medewerkers inmiddels gewerkt is, eventuele wensen voor vrije dagen etcetera.Hoewel deze activiteit over het algemeen met behulp van een planbord of computer wordt gedaan, biedtde schriftelijke vorm de mogelijkheid om in korte tijd een groot aantal leerlingen te toetsen. Het productwordt beoordeeld op de mate waarin de leerling erin geslaagd is om rekening te houden met het socialeaspect (de wensen en voorkeuren van de medewerkers), het technische aspect (de formatieberekening:het aantal diensten dat een full-time medewerker kan draaien, de minimaal vereiste bezetting) en hetbeleidsmatige aspect (de kwaliteit van zorg: voldoende deskundigheid, gewaarborgde continuïteit,rekening houdend met het beschikbaar budget).

7.4.2 Afleesvaardigheden

De leerling krijgt een aantal cardiogrammen voorgelegd en moet deze vervolgens analyseren op puntenals frequentie, regelmatigheid, hoogte van de toppen, eventuele extrasystolen, fibrillaties etcetera. Totslot moet hij het gepresenteerde beeld benoemen.Een soortgelijke opgave is te maken met röntgenfoto’s of foto’s van een monitor.

7.4.3 Combinatie van vaardigheden

Hieronder volgt een voorbeeld van een opgave waarbij zowel ontwerpen als aflezen aan de orde komt.De opgave is weliswaar niet direct relevant voor de sector zorg en welzijn, maar wel heel illustratiefvoor de mogelijkheden van de potlood-en-papier-toets. De getoetste vaardigheid is ’het kunnen hanterenvan een spreadsheet-programma’, iets wat verpleegkundigen en ziekenverzorgenden weinig zullen doen.Om de herkenbaarheid zo groot mogelijk te maken, is hetgeen berekend wordt ontleend aan deverpleegkundige praktijk: de gebruiksduur van een zuurstofcilinder.In dit voorbeeld wordt geprobeerd de volgende vaardigheden vast te stellen:– enkele belangrijke commando’s en functies van een spreadsheetprogramma toepassen;– het functioneren van een gegeven spreadsheet controleren en verbeteren;– een gegeven spreadsheet uitbreiden of efficiënter maken;– basale rekenregels toepassen.De structuur van de opgave is als volgt (zie afb. 23): de leerling krijgt een spreadsheet te zien, zoals dieook aangetroffen zou kunnen worden op een beeldscherm. Daaronder staan de belangrijkste formulesafgedrukt. Deze zijn nodig voor het uitvoeren van de opdracht(en).Voor het maken van deze opdrachten moet de leerling enerzijds de inhoud van de cellen en degehanteerde formules kunnen aflezen. Anderzijds wordt ook gevraagd om voor het verbeteren van hetspreadsheet nieuwe formules te ontwerpen.

109

Page 114: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

Vragen:

afb. 23 - Spreadsheet voor het berekenen van de gebruiksduur van een zuurstofcilinder

W1 A B C D E

1 BEREKENEN GEBRUIKSDUUR ZUURSTOFCILINDER

2

3 inhoud gasfles (liter): 10

4 druk (bar): 120

5 voorgeschreven dosering (l/min): 2

6 verwisselen na (uur): 10

7

8 verwisselen (ja/nee): nee

9 voorschrift arts nakijken (ja/nee): nee

10

11

12

13

14

15 formules:

16

17 B6=((B3*B4)/B5)/60

18 B8=ALS(B4<5;"ja";"nee")

19 B9=ALS(B5>10;"ja";"nee")

20

1 a In welke cel mag geen 0 (nul) worden ingevuld, omdat anders een foutmelding volgt?b In welke cel verschijnt de bij 1a bedoelde foutmelding?

2 In welk geval moet volgens bovenstaand rekenblad het voorschrift van de arts gecontroleerd worden?

3 In B6 wordt aangegeven na hoeveel uur de zuurstofcilinder verwisseld moet worden. Uit de overigegegevens is echter op te maken dat de gehanteerde formule niet helemaal juist is. Hoe zou deformule wél moeten luiden?

Antwoorden:1 a B5

b B62 Als de voorgeschreven dosering meer is dan 10 liter per minuut.3 B6=((B3*(B4-5)/B5)/60

110

Page 115: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

7.5 Computersimulatie

De hier beschreven toetsvorm zal door een opleiding niet snel zelf gemaakt worden. Daarom wordtvolstaan met de beschrijving van een voorbeeld van een computersimulatie op basis van een beeldplaat.Het hoofdstuk wordt afgesloten met enkele opmerkingen over de bruikbaarheid en de kwaliteit van debeschreven toets. Met deze overwegingen kan rekening worden gehouden bij de eventuele aanschaf vaneen dergelijke toets.

7.5.1 Doelgroep en toetsdoel

De toets is vervaardigd voor gebruik in de studierichting ’Apothekersassistent’ van de afdelingAG

(Assistenten in de Gezondheidszorg) binnen hetMDGO.De vaardigheid die geëvalueerd wordt is ’dispenseren geïntegreerd’ in de apotheek. Aan deze vaardigheidkunnen de volgende deelvaardigheden onderscheiden worden:– aannemen van recepten;– inbrengen van gegevens in de computer en interpreteren van schermmeldingen;– voorraadbeheer;– etiketteren;– controleren van het geneesmiddel en het etiket;– afleveren van het geneesmiddel aan de cliënt.Bij de uitvoering van deze deelvaardigheden in de reële werksituatie wordt een beroep gedaan op zowelcognitieve, psychomotorische, reactieve als interactieve vaardigheden. Maar in de toetssituatie wordt ditgereduceerd tot vrijwel alleen cognitieve vaardigheden. De leerling neemt een groot aantal beslissingenop elk van de hierboven genoemde deelvaardigheden en krijgt vervolgens terugkoppeling over hetresultaat daarvan. Met de toets wordt dus vastgesteld of leerlingen in staat zijn op systematische,efficiënte wijze de kennis van het vakgebied toe te passen op praktijkgevallen. De leerling geeft daarbijalleen zijn intenties aan: ’Ik wil nu zus of zo doen.’, maar voert de acties dus niet echt uit.De toets is bedoeld als formatief instrument: de toetsscore moet aanknopingspunten bieden voor hetbijstellen van het onderwijs of van het studiegedrag van de leerlingen.

7.5.2 Toetsbeschrijving

De toets bestaat uit vijf casussen die qua inhoud ontleend zijn aan de praktijk van een apotheek. Elkecasus toetst in hoeverre de leerling in staat is om cliënten die met een recept aan de balie komen opefficiënte en effectieve wijze te helpen. Elke casus is zodanig ontworpen dat alle handelingen dieachtereenvolgens moeten plaatsvinden als in de apotheek een recept wordt aangeboden, aan bod kunnenkomen. Of ze inderdaad aan bod komen, hangt af van de beslissingen die de leerling neemt en van despecifieke problematiek in de casus zelf.De natuurgetrouwheid van de toetsing wordt bevorderd door informatie zoveel mogelijk over te dragenin een natuurlijke vorm:– als een cliënt een vraag stelt kun je hem zien en horen;– als een bepaald geneesmiddel gepakt moet worden, dient de leerling dit aan te wijzen op de

schappen.Om een indruk te krijgen van de wijze waarop de relevante vaardigheden worden uitgelokt en van deverschillende manieren waarop gerespondeerd kan worden, worden hieronder enkele typerende situatiesweergeven. Onder de foto van het beeldscherm staat steeds een beschrijving van de dialoog of de actiedie op dat moment plaatsvindt of zou kunnen plaatsvinden.

111

Page 116: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

Situatie 1 Aan de balie moet aan de patiënt de relevante informatie gevraagd worden.

Situatie 2 Ingeval van twijfel kan eerst de apotheker geraadpleegd worden.

112

Page 117: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

Situatie 3 Wanneer bijvoorbeeld een medicijn niet op voorraad is, wordt overlegd metde arts.

Situatie 4 Tot slot moeten op de verpakking de noodzakelijke stickers geplakt worden.

113

Page 118: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

7.5.3 Beschrijving van het scoringssysteem

De toets is ontworpen om sterke en zwakke aspecten van de leerling met betrekking tot de vaardigheidin kaart te brengen, zodat daar in het onderwijs op ingespeeld kan worden. Daarom wordt nietgerapporteerd met behulp van één totaalscore, maar in de vorm van een profiel. Voor elke deelvaardig-heid (aannemen van het recept; invoeren in de computer en interpreteren van schermmeldingen;klaarmaken/pakken van een geneesmiddel; voorraadbeheer; afleveren) wordt gerapporteerd hoeveelprocent van de maximaal haalbare score behaald is. Daarbij wordt onderscheid gemaakt tussen deeffectiviteitsscore en de efficiëntiescore. Deeffectiviteitsscoregeeft aan in welke mate de leerling eringeslaagd is de voorgelegde problemen op te lossen. Daarbij maakt het niet uit langs welke weg dieoplossing tot stand kwam. Deefficiëntiescoregeeft aan in hoeverre de leerling is afgeweken van deideale aanpak. Ter illustratie een voorbeeld van een scoringsrapportage voor een fictieve leerling:

tabel 32 - Scoringsrapportage computersimulatie

AANNEMEN: 100% goedwaarbij efficiënt werken 42% goed

COMPUTER: 94% goedwaarbij efficiënt werken 85% goed

KLAARMAKEN/PAKKEN/ETIKETTERING: 95% goedwaarbij efficiënt werken 88% goed

CONTROLE/PARAFEREN: 100% goedwaarbij efficiënt werken 100% goed

Naast de effectiviteits- en efficiëntiescore wordt aangegeven of en zo ja welke cruciale fouten gemaaktzijn. Dit zijn fouten die een bedreiging (kunnen) vormen voor de cliënt. De cruciale fouten wordenafzonderlijk vermeld opdat onmiddellijk na afloop van de toets correctief kan worden ingegrepen.

tabel 33 - Feedback over cruciale fouten

Je hebt 2 ernstige fouten gemaakt:

• Op het recept voor Dhr van der Mey stond digi-

toxine van 0,25 mg. Jij hebt digoxine van 0,25mg gepakt.

• Je hebt de interactie tussen lasix en digitoxinegenegeerd.

7.5.4 Bruikbaarheid

De toets kan zowel collectief als individueel worden afgenomen. Het aantal leerlingen dat tegelijkgetoetst kan worden, zal echter doorgaans klein zijn. Dit vanwege het feit dat de meeste opleidingen devereiste hardware niet in grote aantallen beschikbaar zullen hebben. Dit probleem kan de komende jarensnel worden opgelost als bijvoorbeeld deDVI-techniek massaal doorbreekt op de markt.DVI staat voorDigital Video Interactive: een systeem dat bewegende beelden kan digitaliseren, comprimeren en kan

114

Page 119: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

presenteren op een computermonitor. EenPC met eenCD-ROM speler is dan een voldoende configuratievoor een toets als die van de apothekersassistent.

Eventuele capaciteitsproblemen met de hardware worden nog versterkt door de afnameduur. Debeeldplaattoets bestaat uit vijf casussen, voorafgegaan door een introductiecasus waarin de leerling leertomgaan met het programma. Uit onderzoek is gebleken dat twee uur toetstijd niet voldoende is om vijfcasus door te werken. Uitgaande van een gemiddelde doorlooptijd van 3 uur, de beschikbaarheid van éénhardware configuratie en 25 leerlingen, resulteert dit in een toetstijd van acht werkdagen continu. Voorde meeste docenten zal dit onaanvaardbaar lang zijn.Een belangrijk voordeel is dat er nauwelijks voorbereidingen getroffen hoeven te worden voor eentoetsafname. Er hoeft niet gesurveilleerd te worden, geen spullen te worden klaargezet, e.d. Instructiesdie voor de toetsafname van belang zijn, worden door het programma verstrekt. Het enige dat de docentmoet regelen is de reservering van de hardware en het ’klaarzetten’ van het programma.De toetsen worden automatisch gescoord zodat docenten geen beoordelingstaak hebben. De uitslag volgtonmiddellijk na beëindiging van de laatste casus.

7.5.5 Kwaliteitsbeschrijving

De toets is ontwikkeld met als doel onderzoek te doen naar de mogelijkheden van de beeldplaat tenbehoeve van toetsdoeleinden. In dat kader is ook de toetstechnische kwaliteit onderzocht, maar helaasalleen op basis van technieken die vooral geschikt zijn voor kennistoetsen. De betekenis van de resultatendaarvan voor vaardigheidstoetsen is onduidelijk. Wél kan worden aangegeven welke maatregelengenomen zijn bij de constructie om de betrouwbaarheid en de validiteit van de toetsscores te bevorderen.

De betrouwbaarheid van de toetsscores wordt bevorderd door het aanbieden van gestandaardiseerdetaaksituaties. De moeilijkheidsgraad van de toets kan daardoor niet variëren van leerling tot leerling.Toetsscores zijn daardoor beter onderling vergelijkbaar. Verder wordt een bijdrage geleverd aan debetrouwbaarheid door de objectieve scoring (de computer verzorgt de scoring op grond van van tevorenopgestelde scoringsregels).

De validiteit van de toetsscores wordt positief beïnvloed door het gegeven dat leerlingen in principe vijfverschillende taaksituaties krijgen voorgelegd. Die taaksituaties zijn dermate verschillend dat het niet ergwaarschijnlijk is dat die zich in een echte apotheek binnen korte tijd zouden voordoen. Praktisch gezienechter valt het te betwijfelen of alle vijf taaksituaties in één toetsafname kunnen worden voorgelegd: deafnameduur zou meer dan vijf uur vergen.

Over het algemeen is de natuurgetrouwheid van dit soort toetsen erg beperkt. Echter, door demultimedia-aanpak konden in de onderhavige toets diverse voorzieningen worden ingebouwd die denatuurgetrouwheid in positieve zin beïnvloed hebben. Enkele voorbeelden daarvan zijn:– Cliënten richten zich rechtstreeks tot de leerling in gesproken taal. De leerling kan de cliënt daarbij

ook zien. Dat is belangrijk omdat in de reële werksituatie ’het zien van de cliënt’ aanleiding kan zijntot het stellen van bepaalde vragen of het nemen van bijzondere maatregelen (In een van de casus,bijvoorbeeld, is een cliënte duidelijk zwanger).

– De leerling moet weten waar hij bepaalde geneesmiddelen van de plank kan halen in de apotheek.In de toets wordt dit niet vastgesteld door de leerling dit te laten verwoorden, maar door hem hetbetreffende geneesmiddel op de planken te laten aanwijzen.

– Het computerprogramma kan natuurlijke taal verwerken zodat met ’open vragen’ gewerkt kanworden. In de meeste computersimulaties wordt met ’gesloten vragen’ gewerkt. Het nadeel daarvanis dat de antwoordalternatieven de onvoldoende vaardige leerling hints geven voor de beantwoording.

115

Page 120: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

7.5.6 Toepassingen

De computersimulatie is een toetsvorm die in veel verschillende typen van gezondheidszorgonderwijskan worden ingezet. Door de gereduceerde complexiteit kan al vrij vroeg in de opleiding integratiefgetoetst worden, zonder dat er gevaar is voor cliënten/patiënten en zonder al te grote organisatorische/lo-gistieke problemen (bijv. geen patiënt met ziektebeeld X voorhanden). De ontwikkelingskosten van eencomputersimulatie zijn niet gering. Voor de bekostiging zal daarom samenwerking tussen meerdereopleidingen vaak noodzakelijk blijken te zijn. Bij een eventuele investeringsbeslissing is het goed zichte realiseren dat computersimulaties behalve voor toetsing ook voor instructiedoeleinden kunnen wordeningezet. Als tijdens de ontwerpfase hiermee rekening wordt gehouden, kan een computersimulatie zoveelfeedback geven dat leerlingen kennis en vaardigheid verwerven door de casus ’door te werken’.

116

Page 121: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

7.6 De simulator

De hier beschreven toetsvorm zal door een opleiding niet snel zelf gemaakt worden. Daarom wordtvolstaan met de beschrijving van een voorbeeld van het gebruik van een simulator in een toetssituatie.Het hoofdstuk wordt afgesloten met enkele opmerkingen over de bruikbaarheid en de kwaliteit van debeschreven toets. Met deze overwegingen kan rekening worden gehouden bij de eventuele aanschaf vaneen dergelijke toets.Hierna zal de te bespreken toetsvorm voor het gemak worden aangeduid als ’fantoomkop-toets’.

7.6.1 Doelgroep en toetsdoel

De fantoomkop-toets wordt ingezet bij leerlingen tandheelkunde die in de preklinische fase van hunstudie zijn. De fantoomkop-toets is een verzamelterm voor een groot aantal toetsen die op verschillendetijdstippen in de preklinische fase worden afgenomen met als doel vast te stellen of leerlingen bepaaldetechnische vaardigheden voldoende beheersen om toegelaten te kunnen worden tot de kliniek waar echtepatiënten behandeld moeten worden in het kader van hun verdere opleiding.

7.6.2 Toetsbeschrijving

Als voorbeeld wordt een beschrijving gegeven van een van de fantoomkop-toetsen: de klasse II-tweevlakspreparatie. In de opleiding voor tandarts neemt het prepareren (boren) en restaureren (vullen)van elementen (tanden en kiezen) een belangrijke plaats in in het preklinisch onderwijs. Preparatiesworden ingedeeld in een aantal klassen. De klassen verschillen van elkaar in vorm en in de plaats waarde preparatie in het element vervaardigd moet worden (bijv. in het kauwvlak en/of in één van dewanden). De hieronder te beschrijven toets is ontwikkeld om vast te stellen of leerlingen voldoendevaardigheid hebben in het prepareren van (pre)molaren (kleine of grote kiezen), waarbij zowel hetkauwvlak als een van beide wanden die grenzen aan een buurelement ’opengelegd’ moeten worden.

De toets kan groepsgewijs worden afgenomen in de prekliniek. In de prekliniek zijn voldoendebehandelunits opgesteld om alle leerlingen van een jaargang tegelijk te laten oefenen en te toetsen. Debehandelunit in de prekliniek wijkt af van die in de kliniek: er is geen stoel waar patiënten in kunnenplaatsnemen. In plaats daarvan is er een fantoomkop: een ijzeren replica van het menselijk hoofd. In deopengesperde mond kunnen kunststof kaken geplaatst worden met daarin plastic tanden en kiezengemonteerd. De leerling voert de toets uit onder toetscondities. Dat wil onder andere zeggen dat– het te prepareren element in de voorgeschreven positie in de kunststof kaak gemonteerd is;– de leerling zelf een positie inneemt die gebruikelijk is;– er gewerkt wordt met de voorgeschreven materialen;– het werkstuk binnen de gestelde tijd wordt vervaardigd.

Opdracht: Vervaardig onder toetscondities een klasse II-tweevlakspreparatie voor amalgaam in de 161.Toetstijd: 45 minuten.

1 ’16’ is een codering die aangeeft welk element behandeld moet worden: het eerste cijfer van de code verwijst naar dekaakhelft, in dit geval de linker bovenkaak; het tweede cijfer geeft de positie aan van het element in de betreffendekaakhelft gerekend vanaf de eerste snijtand.

117

Page 122: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

7.6.3 Beschrijving van het scoringssysteem

Een preparatie moet aan bepaalde kwaliteitseisen voldoen alvorens tot restauratie (’vullen’) kan wordenovergegaan. Deze kwaliteitseisen hebben te maken met de begrenzing (outline) van de preparatie (niette veel maar ook niet te weinig weefsel wegboren), met de diepte (niet te diep vanwege het risico opwortelbeschadiging maar ook niet te ondiep vanwege het risico op breuk van de vulling als er druk opuitgeoefend wordt), de hoek waaronder geboord is (bepaalde wanden moeten ondersneden zijn om tevoorkomen dat de vulling eruit kan vallen) en met de afwerking.

De beoordeling van de werkstukken (de vervaardigde klasse II-tweevlakspreparaties) gebeurt met behulpvan een zogenoemd ’beoordelingsprotocol’. Dit is een leidraad voor beoordelaars waarin beschreven is:a aan welke eisen een werkstuk moet voldoen (de prestatiecriteria);b hoe vastgesteld moet worden of een werkstuk aan de criteria voldoet;c hoe het resultaat van die vaststelling (zoals bedoeld onder b) in een score omgezet moet worden.

De prestatiecriteria zijn ontleend aan subjectieve en wetenschappelijke inzichten over de invloed van deafzonderlijke kwaliteitsaspecten op de kwaliteit van het totale werkstuk. Geprobeerd is om bij elk aspecthet kwaliteitscriterium in meetbare termen te omschrijven; waar mogelijk met behulp van getallen(afmetingen, hoeken).

Het beoordelingsprotocol verstrekt gedetailleerde aanwijzingen over de wijze waarop vastgesteld moetworden of een werkstuk aan de gestelde eisen voldoet. Daartoe zijn voorschriften opgenomen metbetrekking tot:– de beoordelingsmethode;– de plaats (in het werkstuk) waar gemeten/geschat moet worden;– de hulpmiddelen die daarbij gebruikt moeten worden.

Er wordt gebruikgemaakt van drie beoordelingsmethoden: meten, schatten en vergelijken. De breedte endiepte van een preparatie worden gemeten. Hoeken, gevormd door op elkaar staande wanden, wordengeschat. De afwerking van een werkstuk wordt beoordeeld door die te vergelijken met de afwerking vaneen referentiewerkstuk.Waar nodig wordt de plaats aangegeven waar de beoordelaar zijn meting of schatting moet uitvoeren,bijvoorbeeld door aan te geven waar precies een meetinstrument in het werkstuk ingebracht moetworden. Een voorbeeld uit het beoordelingsprotocol kan dit verduidelijken: ’Plaats de rechte sonde inde opening tussen het geprepareerde element en het buurelement. De juiste plaats om in te steken ligthalverwege de afstand tussen het occlusale vlak en de bodem van de box.’ Vaak verduidelijkt eenillustratie de omschrijving.Bij het beoordelen worden hulpmiddelen gebruikt. Tandheelkundig instrumentarium wordt gebruikt bijde beoordelingsmethoden ’meten’ en ’schatten’. Referentiewerkstukken worden gebruikt als hulpmiddelbij de beoordelingsmethode ’vergelijken’. Referentiewerkstukken zijn door eerstejaars leerlingenvervaardigde werkstukken die net voldoende zijn afgewerkt.

Het beoordelingsprotocol bestaat uit 32 beoordelingsaspecten die gescoord worden op een nominaledriepuntsschaal. Score 2 betekent dat het werkstuk aan de gestelde eisen voldoet. Score 1 en score 3houden in dat het werkstuk niet aan de gestelde eisen voldoet, maar ze verwijzen elk naar een anderegeconstateerde fout. Het belangrijkste voordeel van deze scoringsmethode is dat leerlingen zinvolleinformatie krijgen over op welke punten hun vaardigheid tekortschiet. Een nadeel is dat er geen anderedifferentiatie mogelijk is in prestaties dan tussen voldoende en onvoldoende.

118

Page 123: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

7.6.4 Bruikbaarheid

De fantoomkop-toets is een bij uitstek geschikt instrument om grote aantallen leerlingen gelijktijdig tetoetsen op hun beheersing van complexe vaardigheden. De voorbereiding voor een toetsing kost zeerweinig tijd aangezien de installaties permanent staan opgesteld in de prekliniek. De leerlingen hebbenzelf de kunststofkaken in hun bezit waarin ze de voorgeschreven elementen moeten monteren. Hetzelfdegeldt voor het instrumentarium (boortjes, sondes, e.d.). De taak van de toezichthouders beperkt zich totcontrole op handhaving van de toetscondities.

Het gebruik van het beoordelingsprotocol leidt tot behoorlijk betrouwbare beoordelingen, zeker als inaanmerking wordt genomen dat beoordelaars vaak uitspraken moeten doen over aspecten in het werkstukdie met het blote oog nauwelijks waarneembaar zijn (bijv. bepalen of een wandje van 2 mm involdoende mate ondersneden is). Uit onderzoek is gebleken dat de overeenstemming tussenonafhankelijke beoordelaars gemiddeld rond de 0.80 ligt (1.00 is maximale overeenstemming). Eenuitzondering daarop vormen de aspecten die te maken hebben met de afwerking van het werkstuk; deovereenstemming tussen beoordelaars was daar flink lager (gemiddeld 0.60).Een gevoelig nadeel van het beoordelingsprotocol heeft betrekking op de aanzienlijke investering in tijddie het gebruik ervan met zich meebrengt. Uit onderzoek is gebleken dat beoordelaars gemiddeld 15minuten nodig hebben om een werkstuk te beoordelen aan de hand van het beoordelingsprotocol. Bij eenjaargang van 40 leerlingen betekent dit een investering van 10 uur. Een mogelijke oplossing hiervoorzou kunnen zijn dat leerlingen hun eigen werkstukken aan de hand van het beoordelingsprotocol gaanbeoordelen. Daarna worden in een steekproef van 25% van de werkstukken opnieuw beoordeeld dooreen docent. Bij ernstige afwijkingen met de beoordeling van de leerling (overeenstemming kleiner dan70%) wordt het werkstuk door nog een andere docent beoordeeld. Als de docenten het eens zijn in hunafwijzing van de beoordeling van de leerling, zullen de werkstukken van de betreffende leerling vakeraan een controle onderworpen worden.

7.6.5 Kwaliteitsbeschrijving

De betrouwbaarheid van de toetsscores wordt bevorderd door de verregaande standaardisatie van detaaksituatie. Doordat die voor elke leerling identiek is, is het mogelijk om ook de beoordeling volgenseen voorgeschreven standaard uit te voeren (het beoordelingsprotocol). Dit reduceert de kans opmeetfouten, hetgeen in onderzoek bevestigd werd door de hoge overeenstemming tussen onafhankelijkvan elkaar werkende beoordelaars.

De fantoomkop-toets wordt ingezet om de vaardigheid ten aanzien van prepareren en restaureren vastte stellen. Daartoe moet over langere tijd een groot aantal verschillende werkstukken onder toetsconditiesvervaardigd worden. Elk werkstuk moet als voldoende beoordeeld zijn om tot de klinische patiëntbehan-deling te kunnen worden toegelaten. De validiteit van de fantoomkop-toets wordt daarom hoog ingeschat:het aantal verschillende taaksituaties waarmee leerlingen in de kliniek geconfronteerd kunnen worden,is in voldoende mate afgedekt met de toetsopdrachten, dat wil zeggen elke toetsopdracht is eencombinatie van een bepaald type (klasse) preparatie of restauratie, een type element (molaar, premolaar,hoektand, snijtand) en de locatie in de kaak (linker of rechter onder-/bovenkaak).

De natuurgetrouwheid van de fantoomkop-toets is redelijk, althans in technische zin. Leerlingen die totde kliniek worden toegelaten hebben bewezen standaardpreparaties en standaardrestauraties te kunnenvervaardigen. Maar echte patiënten hebben doorgaans tanden en kiezen die qua vorm en positie afwijkenvan de plastic elementen in de fantoomkop. Het is de kunst om de standaardpreparaties aan te passenaan de situatie in de mond van een willekeurige patiënt. Daarnaast is er een verschil in het bewerken vanivoor in vergelijking tot plastic. En ten slotte mag niet uit het oog worden verloren dat het behandelen

119

Page 124: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

van een echte patiënt niet te vergelijken is met het werken in een fantoomkop. In de eerste plaats isprepareren een pijnlijke ingreep en in de tweede plaats betekent een verkeerde preparatie dat de patiëntmet een minder behandelingsresultaat genoegen zal moeten nemen dan mogelijk was. Deze wetenschaproept stress op en kan de (bewezen) vaardigheid van de leerling om te prepareren en te restaureren innegatieve zin beïnvloeden.

7.6.6 Toepassingen

De fantoomkop-toets is uiteraard alleen toepasbaar binnen de tandartsopleiding en wellicht binnen deopleiding voor tandartsassistent of mondhygiënist. Maar het achterliggende concept van de simulator isook in andere opleidingen in de gezondheidszorg bruikbaar. Massagetechnieken in de fysiotherapie,injecteren of het aanleggen van een infuus in de verpleegkunde, beademen van ’dummy’s’ als onderdeelvan de EHBO-cursus binnen een of andere opleiding voor gezondheidszorg: het zijn slechts enkelevoorbeelden van vaardigheden die geoefend en getoetst kunnen worden met behulp van een simulator.

120

Page 125: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

7.7 Skill sample test

7.7.1 Inleiding: stationsmodel

Naar aanleiding van de resultaten van een vaardigheidstoets worden uitspraken gedaan over debekwaamheid van een kandidaat ten aanzien van (een aspect van) een vaardigheid. Door slechts éénspecifieke taaksituatie aan te bieden om de vaardigheid te bepalen, bestaat het gevaar dat de prestatieniet gegeneraliseerd kan worden naar vergelijkbare taaksituaties. Van een leerling-verpleegkundige kanbijvoorbeeld niet worden gezegd dat hij de vaardigheid ’medicijnen toedienen’ beheerst, wanneer hij metgoed gevolg een simulatiepatiënt een bepaald (nep)medicijn heeft laten slikken. Medicijnen kunnennamelijk op verschillende wijzen worden toegediend. Voor een correcte uitspraak over de beheersing vande vaardigheid zullen deze varianten ook in de toets aan bod moeten komen.Dit probleem van de generaliseerbaarheid ook wel aangeduid alstaakspecificiteit. Het is te vergelijkenmet het maken van items in een meerkeuzetoets. Het maken van één item heeft nauwelijks eenvoorspellende waarde voor het maken van een tweede item. Daarom bestaat een multiple choice-test uiteen groot aantal items. Zo zou ook de beoordeling van praktische vaardigheden uit meer taaksituatiesmoeten bestaan.Bij (patiënt)simulaties wordt daarom vaak gebruikgemaakt van een specifieke organisatievorm, namelijkhet stationsmodel1. In een dergelijke opzet kunnen meerdere aspecten van een vaardigheid, taak of groterleerstofdomein worden getoetst. De aspecten worden in aparte stations getoetst. Een station kan wordengezien als een afgebakende ruimte waar een opdracht moet worden uitgevoerd.Deze taken kunnen zeer van elkaar verschillen in complexiteit en samenstelling. Sommige taken doeneen beroep op het geïntegreerd toepassen van motorische, cognitieve, perceptuele en sociaal-communicatieve componenten. Andere zijn gereduceerd tot één of twee componenten (meestal gaat hetdaarbij om technische/instrumentele taken).Taken die een beroep doen op een groot aantal componenten vereisen vaak de aanwezigheid van eenpersoon op wie de uitvoering van de taak gericht is. Dat kan een echte patiënt zijn alhoewel hetorganisatorisch erg lastig is om echte patiënten op de stations te zetten. Ook toetstechnisch leidt dit vaaktot problemen vanwege de onvoorspelbaarheid van de patiënt-leerling interacties, waardoor voorgestructu-reerde beoordelingsprotocollen niet of niet volledig bruikbaar zijn. Ook simulatiepatiënten komen omorganisatorische redenen niet in aanmerking. Daarom wordt meestal gewerkt met surrogaatpatiënten: ditzijn willekeurige personen die niet handelen volgens een script, zoals bij de patiëntsimulatie het gevalis (zie par. 7.8).

7.7.2 Toetsbeschrijving

Hieronder worden als voorbeeld van een skill sample test twee stations beschreven die deel uitmakenvan het centraal examen voor het onderdeel verpleegkunde in de studierichting ’doktersassistent’ van hetMDGO. Het examen bestaat uit negen stations (opdrachten), waarvan drie processtations (de leerling wordtbeoordeeld op de uitvoering van een vaardigheid), drie productstations (de leerling wordt beoordeeld ophet tastbare resultaat van een handeling) en drie theoriestations (de leerling wordt beoordeeld optheoretische kennis). Om het aantal leerlingen dat tegelijk geëxamineerd kan worden op te voeren,kunnen wachtstations (maximaal 3) ingericht worden. Op een wachtstation kan een leerling even opadem komen. In een sessie kunnen dus maximaal 12 leerlingen gelijktijdig geëxamineerd worden. Elkeleerling begint op een ander station.Er wordt hier volstaan met de beschrijving van twee typerende stations, een processtation en eenproductstation.

1 Er wordt vaak gesproken over een ’stationstoets’, maar het is strikt genomen geen toetstechniek maar een organisatievorm.

121

Page 126: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

Station 6 (processtation)In dit station wordt gebruikgemaakt van een surrogaatpatiënt. De leerling treft een persoon aan met eenverband om de linker onderarm. Hij krijgt de volgende opdracht:

De patiënt heeft een ontstoken schaafwond aan de linker onderarm. Verwijder het oudezalfverband en de zalfresten. Verzorg de wond opnieuw met betadinezalf, steriele gazen en wittewatten. Fixeer met een elastisch hydrofiel zwachtel.

De grootte en de exacte plaats van de wond zijn door de examinator/observator aangegeven. Al hetbenodigde materiaal ligt tussen andere materialen (die niet per se nodig zijn) gereed.

tabel 34 - Checklist voor een processtation

CHECKLIST Station 6 (processtation) ja nee min

1 wast de handen voor de behandeling -2

2 informeert de patiënt op de juiste wijze omtrent de handeling

3 plaatst een onderlegger onder de arm

4 de arm van de patiënt heeft steun

5 heeft handschoenen aan

6 verwijdert het oude verband op de juiste wijze -2

7 gebruikt nieuwe handschoenen of pincetten

8 maakt het wondgebied op de juiste wijze schoon

9 gebruikt hierbij de juiste vloeistof

10 brengt de betadinezalf op de juiste wijze aan

11 brengt steriel gaas op de juiste wijze aan

12 brengt witte watten op de juiste wijze aan

13 de breedte van de zwachtel is aangepast aan de dikte van de onderarm

14 de zwachtel is elastisch hydrofiel

15 legt de zwachtel op de juiste wijze aan

16 fixeert het verband op de juiste wijze

17 het verband is functioneel aangebracht -3

18 wast de handen na de handeling

19 de steriliteit is voor het overige gehandhaafd

20 de hygiëne is voor het overige gehandhaafd -3

21 informeert de patiënt op de juiste wijze over het vervolg van de behandeling

22 de leerling heeft ordelijk gehandeld -2

Behaalde score op station 6: 22 - ____ = ____

122

Page 127: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

Station 7 (productstation)In dit station moet de leerling materialen en instrumenten klaarleggen voor twee verschillendeonderzoeken. De opdrachten luiden als volgt:

Opdracht A: Zet de materialen en instrumenten klaar voor een vaginaal speculumonderzoek.Opdracht B: Tref de voorbereidingen voor het maken van elektrocardiogram. Maak de

cardiograaf bedrijfsklaar, bevestig de elektroden op een fantoom.N.B: Van de C-elektroden wordt alleen de eerste beoordeeld.

7.7.3 Beschrijving van het scoringssysteem

Station 6 (processtation)De beoordeling vindt plaats aan de hand van een checklist welke tijdens de uitvoering van de opdrachtwordt ingevuld (zie tabel 34). Een uitvoering zonder fouten levert het maximum van 22 punten op. Bijfouten in de uitvoering wordt er over het algemeen één punt afgetrokken, maar soms twee (zie criterium1, 6 en 22) of drie (zie criterium 17 en 20). De behaalde score wordt berekend door het aantalstrafpunten af te trekken van de maximumscore.

Station 7 (productstation)

tabel 35 - Checklist voor een productstation (opdracht A)

CHECKLIST Station 7 (productstation)

Opdracht A: vaginaal speculumonderzoek ja nee

1 bekken

2 desinfectans

3 watten of deppers

4 vaginaal speculum

5 handschoenen

N.B. NIET OVERBODIG ZIJN:- onderlegger- glijmiddel- verstelbare lamp- kom

per overbodig instrument of materiaal -1 ....

Behaalde score op station 7A: 5 - ____ = ____

Het productstation bestond uit twee opdrachten. Voor de beoordeling daarvan zijn dan ook twee lijstennodig. Voor de totale opdracht kunnen maximaal 14 punten behaald worden, voor elk correct aspect 1punt (bij 7A maximaal 5 punten, bij 7B maximaal 9 punten). Ook hier kunnen weer aftrekpunten wordentoegekend (zie tabel 35 en tabel 36).

Als voor elk station de score berekend is, kan een eindcijfer vastgesteld worden voor het examenonder-deel Verpleegkunde. Daarvoor wordt gebruikgemaakt van een tabel zoals is afgebeeld in tabel 37.

123

Page 128: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

7.7.4 Bruikbaarheid

Het stationsmodel is speciaal ontwikkeld om bij een groep leerlingen een groot aantal verschillendevaardigheden te toetsen, zonder dat dit leidt tot onaanvaardbaar hoge investeringen in tijd. De opdrachtenzijn zodanig samengesteld dat ze binnen tien minuten uitgevoerd kunnen worden. In totaal neemt eentoetsing van 12 leerlingen ongeveer drie uur in beslag (exclusief de voorbereidingstijd die gemoeid ismet het inrichten van de stations). Grote voordelen van deze toetsvorm zijn:– doorgeven van informatie is praktisch gezien niet meer mogelijk (alle leerlingen die er belang bij

kunnen hebben ’zitten’ op een of ander station);– de opdrachten zijn voor elke leerling gelijk waardoor er geen onbedoelde verschillen in moeilijk-

heidsgraad kunnen optreden;– stations zijn eenvoudig uitwisselbaar: met drie à vier complete stations kunnen veel verschillende

varianten samengesteld worden.

tabel 36 - Checklist voor een productstation (opdracht B)

CHECKLIST Station 7 (productstation)

Opdracht B: voorbereidingen treffen voor het maken van een elektrocardiogram ja nee

1 de cardiograaf is correct aangesloten

a de stekker in het stopcontact

b de juiste kabel aan de juiste elektrode

c aardkabel correct aangesloten

2 de cardiograaf is bedrijfsklaar

a papiertransport is mogelijk

b schrijver in het midden

3 het fantoom heeft de juiste houding

4 de enkels, polsen zijn ontbloot

5 het bovenlichaam is ontbloot

6 voldoende geleidingsmiddel tussen huid en elektroden

7 elektroden op de juiste plek op polsen, enkels aangebracht

8 de eerste C-elektrode op de juiste plek op de borstkas aangebracht

9 ijkblokje is correct

N.B. NIET OVERBODIG ZIJN:- bekken- watten/gazen- reinigingsmiddel- scheermateriaal

per overbodig instrument of materiaal -1 ....

Behaalde score op station 7: 9 - ____ = ____

124

Page 129: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

tabel 37 - Voorbeeld van omzettingstabel

behaalde score tot en met cijfer

0 42 1

43 54 2

55 65 3

66 76 4

77 87 5

88 98 6

99 109 7

110 120 8

121 131 9

132 135 10

De ’bottleneck’ bij toepassing schuilt in de organisatie: er zijn evenveel observatoren nodig als stationsin de toets. Een toets met bijvoorbeeld twaalf stations doet dus een beroep op een flink deel van hetdocentenkorps.

7.7.5 Kwaliteitsbeschrijving

Een indicatie van de kwaliteit moet door het ontbreken van afnamegegevens gebaseerd worden op eenbeschrijving van de maatregelen die getroffen zijn om de betrouwbaarheid en validiteit te waarborgen.

De betrouwbaarheid van de toetsscores wordt gewaarborgd door het feit dat leerlingen gestandaardiseerdetaaksituaties krijgen voorgelegd. Deze taaksituaties zijn zodanig samengesteld dat ze het gedrag waarnaarde interesse uitgaat, kunnen uitlokken. Door de voorspelbaarheid van het gedrag van de leerling is hetmogelijk tamelijk eenduidige beoordelingscriteria te formuleren. De verwachting is dan ook dat deovereenstemming tussen twee of meer beoordelaars over de vaardigheid van een leerling tamelijk hoogzal zijn.

De validiteit is gebaat bij de verschillende taaksituaties die de leerling krijgt voorgelegd. Hoe groter hetaantal verschillende taken, des te kleiner wordt de kans dat de toetsprestatie alleen geldigheid bezit vooreen bepaald onderdeel van de verpleegkunde. In dit verband zou het raadzaam zijn de theoriestations inte ruilen voor proces- of productstations. De validiteit neemt daardoor nog toe. Bovendien wordt metproces- en productstations ook theoretische kennis getoetst: aan elke vaardigheid ligt theoretische kennisten grondslag. Wie een vaardigheid correct uitvoert, heeft daarmee bewezen ook over de daarvoorbenodigde theoretische kennis te beschikken.

De overdraagbaarheid van de examensituatie naar de reële werksituatie wordt ingeschat als ’redelijk’.De leerling voert de taken voor een deel uit zoals die in de reële werksituatie ook uitgevoerd zoudenworden. Dat wil zeggen dat waar mogelijk de handelingen zich richten op een persoon (meestal eenandere leerling). Alleen bij vervelende en/of bedreigende behandelingen wordt gekozen voor eenfantoom. De richtlijnen vermelden expliciet dat leerlingen zich dienen te gedragen alsof ze dienst doenin een echte praktijksituatie. Echter, de stress van de reële werksituatie ontbreekt: er zijn geen doodzieke,vervelende of niet-begrijpende patiënten die met veel geduld en overtuigingskracht benaderd moetenworden. Dit probleem geldt meer voor de processtations dan voor de productstations, waar dehandelingen minder vaak gericht zijn op een patiënt (vooral klaarleggen van materialen).

125

Page 130: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

7.8 Patiëntsimulatie

De patiëntsimulatie is een toetsvorm waarbij vaardigheden in een realistische maar gestandaardiseerdesituatie worden getoetst. Realistisch is de toets, omdat de toetssituatie grote overeenkomsten vertoont metde praktijk (bijv. in vergelijking met een schriftelijke casus). Gestandaardiseerd is de toets, omdat detoetssituatie voor iedere leerling gelijk is. Bij een patiëntsimulatie is de omgeving waarin de leerling devaardigheden moet tonen nagebootst. Een belangrijk aspect in deze nagebootste realiteit is de patiënt.Een getraind persoon zal volgens een script de rol van de patiënt spelen. Deze personen worden ook welde simulatiepatiënten genoemd.

7.8.1 Geschiktheid

De toetsmethodiek waarbij gebruik wordt gemaakt van een simulatiepatiënt, is in niet alle gevallen evengeschikt. Wanneer het standaardiseren van de toetssituatie minder belangrijk is, kan eenvoudiger gekozenworden voor praktijktoetsing op de werkplek. Wanneer de natuurgetrouwheid niet zo groot hoeft te zijn,kan gebruik worden gemaakt van medeleerlingen of docenten.Ook niet alle taken zijn geschikt voor beoordeling via een patiëntsimulatie. In tabel 38 zijn enkelecriteria te zien op grond waarvan taken al dan niet in aanmerking komen.

De eerste twee criteria betreffen de vraag of de investering van tijd en geld om de taak te analyseren in

tabel 38 - Criteria voor vaardigheidsbeoordeling middels een patiëntsimulatie

positief negatief

1. Is een juiste taakuitvoering cruciaal? toedienen medicijnen opmaken bed

2. Komt de taak frequent voor? wassen sputumkweek maken

3. Is er een ethisch risico voor de simulatiepati-ent?

nagels knippen rectaal onderzoek doen

4. Is er een medisch risico voor de simulatie-patiënt

mitella aanbrengen reanimeren

5. Is de rol uitvoerbaar voor de simulatiepatiënt? krampen bloeddrukschommelingen

6. Heeft de simulatie een meerwaarde? wassen bed opmaken

verhouding staat tot het belang van de taak. De taak moet cruciaal zijn en/of frequent voorkomen.Cruciale taken zijn taken die nadelige gevolgen hebben voor de patiënt wanneer ze niet goed wordenuitgevoerd.Een tweede categorie criteria heeft betrekking op de (on)mogelijkheden van de simulatiepatiënt. Dezepersoon dient tijdens de simulatie beschermd te worden tegen mogelijke geestelijke en lichamelijkeschade en dient de rol op een zo natuurgetrouw mogelijke manier weer te geven. Dit betekent dat deontwerper van een patiëntsimulatie in de eerste plaats een ethische verantwoordelijkheid heeft over desimulatiepatiënt. Sommige verpleegkundige en verzorgende taken kunnen derhalve niet metsimulatiepatiënten geleerd en getoetst worden, omdat uitvoering van de taken net als bij actuele (echte)patiënten te veel risico voor de gezondheid van de simulatiepatiënten met zich meebrengt. De ontwerpervan een patiëntsimulatie dient ook rekening te houden met de uitvoerbaarheid van de nabootsing doorde simulatiepatiënt van bepaalde symptomen van ziekten die verder geen medische of ethische risico’smet zich meebrengen.Het laatste criterium is de meerwaarde die een simulatie moet hebben boven andere instructie- oftoetsvormen. Voor het toetsen van complexe vaardigheden is een patiëntsimulatie uitermate geschikt.

126

Page 131: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

Wanneer echter een geïsoleerde enkelvoudige vaardigheid aangeleerd en/of getoetst moet worden zijner veel eenvoudiger en goedkopere instructie- en/of toetsmethoden voorhanden.

De patiëntsimulatie wordt gebruikt voor het vaststellen van de beheersing van vaardigheden ondernagebootste werkomstandigheden. Hierbij gaat het om vaardigheden die gericht zijn op de tegemoetko-ming aan de behoeften van patiënten. Dit zijn doorgaans complexe vaardigheden, waarbij de interactiemet de patiënt een belangrijke plaats inneemt. Afhankelijk van het stadium van de opleiding waarin deleerling zich bevindt en het doel van de toetsing (bijv. summatief of formatief) worden bij eenpatiëntsimulatie componenten van vaardigheid, de vaardigheid in zijn geheel, of de vaardigheidgeïntegreerd met andere vaardigheden getoetst. De patiëntsimulatie die in het begin van een opleidingwordt ingezet zal zich meestal beperken tot de toetsing van relatief eenvoudige vaardigheden ofcomponenten van een vaardigheid. Een patiëntsimulatie waarbij een eerstejaars leerling-verpleegkundigeeen patiënt uit bed moet helpen, kan bijvoorbeeld bedoeld zijn voor het toetsen van een aantalgeselecteerde psychomotorische en interactieve componenten van de vaardigheid, die voor deze fase vande opleiding relevant worden gevonden. De toetsing kan zich in dit geval richten op uitvoering van devaardigheid in een aantal relatief eenvoudige zorgsituaties, waarin naast ingewikkelde varianten van depsychomotorische en interactieve vaardigheid, de affectieve component (de attitude) niet wordtbeoordeeld. Dit komt dan later in de opleiding aan bod.

7.8.2 De simulatiepatiënt

Ter bevordering van de natuurgetrouwheid van een patiëntsimulatie is het aan te raden de rol vansimulatiepatiënt te laten vervullen door personen die niet bekend zijn bij de student. Voor de wervingvan simulatiepatiënten vallen hierdoor medestudenten en docenten af. Wanneer de patiëntsimulatie echtervoor het eerst wordt geïmplementeerd in het curriculum kan toch worden overwogen om personen uitdeze groepen als simulatiepatiënt in te zetten. Het opzetten van een compleet bestand van simulatiepati-enten die uit personen van buitenaf bestaat, vergt namelijk een gedegen organisatie en kost tijd.

7.8.3 Voorbeeld

Hieronder wordt een voorbeeld besproken van een patiëntsimulatie. Achtereenvolgens komen aan de ordede taak en de varianten die daarbij te onderscheiden zijn, het beoordelingsinstrument en enkele logistiekezaken.Met nadruk zij vermeld dat de agogische vaardigheden hier buiten beschouwing worden gelaten. Hetaccent heeft bij de taakanalyse gelegen op de instrumenteel-technische of psychomotorischevaardigheden. De psychomotorische vaardigheid bestaat uit motorische vaardigheden die waarneembaarzijn en cognitieve vaardigheden (de beslissingen) die niet waarneembaar zijn.

De taakEr is een beoordelingsinstrument ontwikkeld voor de beoordeling van de taak ’Het uit en in bed helpenvan een patiënt’. Deze taak kan worden onderverdeeld in vier fasen:– de taakvoorbereiding,– de taakuitvoering van ruglig bed naar zit in stoel,– de taakuitvoering van zit in stoel naar ruglig bed en– de taakafronding.Afhankelijk van de mogelijkheden van de patiënt wordt de taak op verschillende manieren uitgevoerd.Standaard bestaan er vier varianten die zich van elkaar onderscheiden doordat er verschillendetiltechnieken worden gehanteerd:

127

Page 132: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

a Actieve tiltechnieken. Bij actieve tiltechnieken worden bewegingen die verband houden met het uiten in bed verplaatsen van de patiënt door de patiënt zelf uitgevoerd. De rol van de hulpverlener isom de bewegingen te ondersteunen met verbale aanwijzingen, ofwel instructies.

b Geleid actieve tiltechnieken. Bij geleid actieve tiltechnieken ondersteunt de hulpverlener alleen daarwaar de kracht van de patiënt ontbreekt.

c Passieve tiltechnieken met één hulpverlener. Bij passieve tiltechnieken worden de handelingenvolledig door de hulpverlener uitgevoerd. De hulpverlener geeft wel telkens aan wat er gaatgebeuren. Zodoende zal de hulpverlener minder worden tegengewerkt, wat het tillen minder zwaarmaakt.

d Passieve tiltechnieken met twee hulpverleners. Net als bij c worden de handelingen volledig doorde hulpverlener uitgevoerd. Omdat het zelfzorgtekort van de patiënt groter is, moet een tweedehulpverlener worden ingeschakeld om de patiënt te verplaatsen. Een belangrijk criterium om eentweede hulpverlener in te schakelen is het feit dat de patiënt geen sta-moment meer kent (bijv. tengevolge van een verlamming).

In de toets worden de hierboven genoemde vier varianten getoetst. Hiervoor is het stationsmodel alsorganisatievorm gekozen (zie par. 7.7.1). Voor elke variant van de taak is een station gereserveerd waarde handelingen van de leerling worden geobserveerd en beoordeeld. Tijdens deze toets bezoeken deleerlingen vier stations waarbij telkens de opdracht luidt de patiënt uit en in bed te helpen.

Het beoordelingsinstrumentHet beoordelingsinstrument bestaat uit vier beoordelingslijsten die gerelateerd zijn aan de vier casussen.De beoordelingslijsten hebben de vorm van een checklist (zie tabel 30). Wordt een beoordelingsaspectvertoond dan kan tevens in de checklist worden aangegeven of dit correct of niet correct wordt gedaan.Achter ieder beoordelingsaspect zijn daarom de volgende scorecategorieën mogelijk: a goed, b fout enc niet.Om te bepalen of aspecten van het uitvoeringsproces goed of fout zijn is het van belang dat er criteriaworden opgesteld. In enkele gevallen zijn deze criteria opgenomen in de items.– Bijvoorbeeld: [de leerling] zet bed op hoogte stoel

Hierbij is het criterium (de juiste hoogte) gegeven. In bepaalde gevallen is het criterium zo triviaalvoor een beoordelaar die inhoudelijk deskundig is, dat het niet wordt vermeld in het item.

– Bijvoorbeeld: [de leerling] legt de arm van de patiënt over het lichaam.De deskundige weet in dit geval zelf wel wanneer dit goed of fout wordt uitgevoerd. In debeoordelingslijsten worden echter ook items beschreven die nadere uitleg behoeven wat betreft decriteria. Vanwege de hanteerbaarheid van de lijst zijn namelijk enkele items vereenvoudigd. De redenvoor vereenvoudiging is dat anders 1 het aantal items te omvangrijk zou worden en 2 deomschrijvingen te uitgebreid zouden worden waardoor de aandacht te veel van de observatie zouworden afgeleid. In de beoordelaarstraining dienen zulke criteria nader besproken te worden.

Deze taak bestaat uit vier fasen. De beoordelingslijsten zijn volgens deze fasen opgebouwd.De taakvoorbereiding verloopt voor de vier varianten van de taak ’Het in en uit bed helpen van eenpatiënt’ identiek. Iedere beoordelingslijst bevat daarom dezelfde items voor de beoordeling van deze fase.Onderdelen die daarin worden onderscheiden zijn:– Informatieverzameling. Bij de verzameling van informatie gaat het erom dat op basis van deze

informatie de juiste tiltechnieken worden gekozen.– Informeren patiënt. De patiënt heeft er recht op te weten wat er gaat gebeuren. Ook voor een goede

medewerking is informatieverstrekking over de interventie van belang.– Werkomgeving en patiënt in gereedheid brengen.

Voor de taakafronding geldt hetzelfde als voor de taakvoorbereiding: voor iedere casus is deze hetzelfdeen kent de volgende onderdelen:

128

Page 133: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

– Rondt taakuitvoering af. Hierbij wordt onder andere goed gescoord wanneer de patiënt aangeeft dathij of zij comfortabel ligt.

– Brengt werkomgeving in orde. Het bed is op juiste hoogte gebracht wanneer de patiënt in bed ligten gemakkelijk bij het nachtkastje kan.

In de checklists worden bij de formulering van de items werkwoorden gebruikt die gerelateerd zijn aande gehanteerde tiltechnieken (actief, geleid actief, passief).In de checklist voor het uit en in bed helpen van een actieve patiënt worden items genoemd waarin hetwerkwoord ’instrueren’ voorkomt. Instrueren betekent hier: 1 de patiënt vragen om de handeling uit tevoeren en 2 indien de vraag niet wordt begrepen, extra aanwijzingen geven.– Bijvoorbeeld: [de leerling] instrueert [de patiënt] linkerknie te buigen

De leerling vraagt om de linkerknie te buigen. De patiënt die dit begrijpt en de handeling zelf kanuitvoeren zal dit doen. De patiënt die de handeling wel zou kunnen uitvoeren, maar niet weet hoe,zal extra aanwijzingen moeten krijgen, bijvoorbeeld: ’De linkervoet in de richting van je linker bilschuiven’ of ’de linkerknie naar je toe trekken’.Elk item waarbij sprake is van instrueren wordt pas goed gescoord als volgens de bovenstaandeprocedure is gehandeld.

In de checklist voor het uit en in bed helpen van een patiënt met behulp van geleid actieve tiltechniekenworden bepaalde items waarbij de patiënt zich verplaatst of verplaatst wordt, aangeduid met hetwerkwoord ’ondersteunen’. Ondersteunen betekent hier: 1 de patiënt vragen om de handeling uit tevoeren, 2 te observeren wat de fysieke mogelijkheden zijn van de patiënt en 3 op basis van de observatiebesluiten om de beweging fysiek te ondersteunen, waarbij de patiënt in staat is zelf mee te werkentijdens de handeling– Bijvoorbeeld: [de leerling] ondersteunt de patiënt bij kantelen door lichte druk aan de buitenzijde van

de linkerknieDe leerling vraagt de patiënt om te kantelen door hem te vragen zich af te laten zetten met delinkerknie. De voorgaande handelingen kon de patiënt ook al zelf uitvoeren. Maar nu blijkt dat dittoch veel moeite kost. Daarom ondersteunt hij de beweging door lichtjes druk te geven aan debuitenzijde van de linkerknie: in wezen een passieve actie, echter in het kader van de voorgaandehandelingen en het feit dat de patiënt zelf ook kracht zet is er sprake van een geleid actieve techniek.

Bij passieve tiltechnieken worden de handelingen volledig door de hulpverlener uitgevoerd. In deformulering van de items komt dit tot uiting door gebruik te maken van duidelijk observeerbarewerkwoorden. Voorbeelden van dergelijke werkwoorden zijn: ’[de leerling] buigt linkerknie van depatiënt’ of ’[de leerling] fixeert de knieën’. Het correct scoren van deze items houdt meer in dan alleenhet uitvoeren van handelingen. Voorafgaand aan de acties geeft de hulpverlener geeft wel telkens aanwat er gaat gebeuren. Zodoende zal de hulpverlener minder worden tegengewerkt wat het tillen minderzwaar maakt.– Bijvoorbeeld: [de leerling] begeleidt de patiënt tot sta-houding, waarbij voeten patiënt worden

gefixeerd door eigen voeten voor voeten patiënt te zetten.De leerling legt eerst kort uit wat er gaat gebeuren om vervolgens de actie uit te voeren.

Om te illustreren dat voor het beoordelen van de taakuitvoering in de verschillende varianten ookverschillende beoordelingslijsten noodzakelijk zijn, zijn op de volgende bladzijden deze onderdelenvan twee beoordelingslijsten opgenomen. De eerste wordt gehanteerd in het station met de actievepatiënt, de tweede bij een passieve patiënt.

129

Page 134: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

Rolomschrijving voor de simulatiepatiëntIn de rolomschrijving komen twee aspecten aan de orde:– de achtergrondinformatie: enkele persoonlijke gegevens, medische gegevens, symptomen en

kenmerken van de omgeving– de rolvertolking: hierin wordt vastgelegd op welke wijze de simulatiepatiënt zich in de verschillende

omstandigheden moet gedragenVoorbeelden van een uitwerking van deze twee aspecten zijn terug te vinden in tabel 41 en tabel 42.

Opdracht voor de leerlingDe leerling krijgt bij elk station de opdracht om de patiënt uit en in bed te helpen. Een voorbeeld vande omschrijving van zo’n opdracht is te vinden in tabel 43.Vervolgens moet de leerling het dossier van de patiënt bestuderen om op basis daarvan een bepaaldetiltechniek te kiezen. Na bestudering van het dossier moet de beoordelaar aan de leerling vragen welketechniek hij het meest geschikt acht voor de desbetreffende patiënt. De (on)juistheid van het antwoordwordt op de beoordelingslijst aangetekend. Vervolgens krijgt de leerling onmiddellijk feedback op zijnkeuze: bij een juiste keuze krijgt hij te horen dat de gekozen techniek mag gaan uitvoeren; is de keuzeonjuist, wordt hem dit verteld en daarbij wordt aangegeven welke techniek hij wél moet hanteren. Hetdossier van de geleide actieve patiënt is opgenomen in tabel 44.

130

Page 135: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

tabel 39 - Beoordeling taakuitvoering met een actieve patiënt

Fase:TAAKUITVOERING

Deeltaak:Van lig naar (rol)stoel

Leerdoelen:actieve patiënt

goed fout niet

1. Laat patiënt kantelen

1.1 gaat naast bed staan, aan kant waar patiënt uit bed gaat1.2 instrueert linkerarm over lichaam te leggen1.3 instrueert linkerknie te buigen1.4 instrueert zich om te draaien door met gebogen been af te zetten

2. Laat patiënt tot zit op bedrand komen

2.1 instrueert beide knieën op te trekken en op bedrand te schuiven2.2 instrueert tot zit te komen door benen buiten bed te laten glijden en

tegelijkertijd met de linkerhand af te laten zetten

3. Vraagt hoe patiënt zich voelt

4. Besluit door te gaan met mobiliseren

5. Laat patiënt tot stand komen

5.1 stelt bedhoogte zodanig in dat voeten patiënt grond kunnen rakenin geval dat patiënt op de bedrand zou zitten (indien het instelpe-daal aan de zijkant zit waar de patiënt uit bed gaat kan deze actietussen 5.4 en 5.5 worden uitgevoerd)

5.2 gaat voor patiënt staan in spreidstand5.3 instrueert schoeisel aan te doen5.4 instrueert naar bedrand te ’zigzaggen’ (bil voor bil)5.5 instrueert te gaan staan

6. Laat patiënt van sta-houding tot zit in (rol)stoel komen

6.1 begeleidt patiënt naar (rol)stoel6.2 instrueert tot zit in (rol)stoel ((a) patiënt voelt rand stoel met achter-

kant benen; (b) pakt leuningen vast; (c) beweegt romp naar vorenen (d) komt langzaam tot zit)

131

Page 136: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

tabel 40 - Beoordeling taakuitvoering passieve patiënt

Fase:TAAKUITVOERING

Deeltaak:Van lig naar (rol)stoel

Leerdoelen:passieve patiënt

goed fout niet

1. Kantelt patiënt

1.1 gaat naast bed staan, aan kant waar patiënt uit bed gaat1.2 legt linkerarm over lichaam1.3 buigt linkerknie patiënt1.4 legt hand onder schouder van patiënt (deze blijft liggen t/m 2.3)1.5 gaat in schredestand staan1.6 kantelt door lichte druk aan buitenzijde linkerknie patiënt1.7 verplaatst hierbij gewicht van voorste naar achterste been1.8 brengt gewicht op voorste been, zodat geen ruimte tussen bed en

zichzelf ontstaat

2. Brengt patiënt tot zit op bedrand

2.1 Buigt knieën patiënt en legt onderbenen op de bedrand2.2 gaat in spreidstand staan2.3 voert koppelbeweging uit door met vrije hand de onderbenen van de

bedrand te verplaatsen en met de andere hand de patiënt via deschouder omhoog te duwen

2.4 verplaatst hierbij gewicht van linker- naar rechterbeen (= van hoofd-einde richting voeteneind)

3. Vraagt hoe patiënt zich voelt

4. Besluit door te gaan met mobiliseren

5. Brengt patiënt tot sta-houding

5.1 stelt bedhoogte zodanig in dat voeten patiënt grond raken in geval datde patiënt op de bedrand zou zitten (indien het instelpedaal aan dezijkant zit waar de patiënt uit bed gaat kan deze actie tussen 5.5 en 5.6worden uitgevoerd)

5.2 gaat voor patiënt staan in spreidstand5.3 trekt schoeisel aan bij patiënt5.4 pakt patiënt op de billen vast5.5 laat patiënt bil voor bil naar de rand van het bed ’zigzaggen’ (billiften)5.6 fixeert de knieën van de patiënt door eigen knieën voor de knieschij-

ven van de patiënt te plaatsen5.7 begeleidt patiënt tot sta-houding, waarbij voeten patiënt worden ge-

fixeerd door eigen voeten voor voeten patiënt te zetten.

6. Brengt patiënt van sta-houding tot zit in (rol)stoel

6.1 draait patiënt naar (rol)stoel, waarbij patiënt onderlangs bij schouder-bladen vastgepakt wordt

6.2 fixeert knieën6.3 ondersteunt bij tot zit komen in (rol)stoel ((a) patiënt voelt rand stoel

met achterkant benen; (b) romp naar voren en (c) langzaam tot zitkomen)

tabel 41 - Rolomschrijving geleid actieve patiënt: achtergrondinformatie

doel

Het doel van de patiëntsimulatie is om de vaardigheid ’het uit en in bed helpen van een patiënt’ te toetsen bijeerstejaars leerlingen verpleegkunde (MBO-niveau, richting beroepsbegeleidend leren – voorheen de inserviceopleidingen). Tijdens de toets moeten de leerlingen vier keer een casus oplossen. Elke casus is een variantvan de vaardigheid.De casus waarop uw rol van toepassing is, is gericht op de variant van de vaardigheid waarbij de leerling-verpleegkundige bij de taakuitvoering gebruik maakt van zogenaamde geleid actieve tiltechnieken. Dit wilzeggen dat u als patiënt in een zodanige lichamelijke en/of geestelijke conditie verkeert dat u niet al degevraagde handelingen zelf uit kunt voeren. In gevallen waarin u zich erg moet inspannen, heeft u fysiek

132

Page 137: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

tabel 42 - Rolomschrijving geleid actieve patiënt: rolvertolking

algemeen

U speelt een bereidwillige patiënt. U volgt de instructies van de verpleegkundige op. In enkele gevallen lukthet u niet om handelingen te verrichten. In die gevallen ondersteunt de verpleegkundige u. De verpleegkundi-ge zal u bij het uit en in bed helpen allerlei informatie verschaffen. Zowel bij de instructie als bij de reactie opgestelde vragen dient deze uitleg duidelijk te zijn. Is informatie duidelijk, dan geeft u dit aan. Is informatieonduidelijk, dan geeft u dit ook aan, zodat als het goed is extra uitleg volgt.

uitgangspositie

U ligt op uw rug in bed. U hebt uw pyjama aan. Schoeisel ligt onder het bed.

gedrag tijdens de taakvoorbereiding

Tijdens de taakvoorbereiding verzamelt de verpleegkundige informatie over u. Op basis van deze informatiebeslist de verpleegkundige of u als patiënt in en uit bed mag worden geholpen. Indien dit is geoorloofd,maakt de verpleegkundige een keuze welke technieken hij of zij zal gebruiken tijdens het uit en in bed helpen.Naast het verkrijgen van informatie verstrekt de verpleegkundige zelf ook informatie. Zo wordt u geïnfor-meerd over wat u te wachten staat. Vervolgens worden de werkomgeving en u als patiënt in gereedheidgebracht voor de taakuitvoering. U handelt tijdens de taakvoorbereiding als volgt:– wanneer de verpleegkundige u vraagt hoe u zich voelt, antwoordt u dat u wat benauwd en moe bent. Hetgaat echter al wel weer een stuk beter dan een uur geleden toen de benauwdheid veel heviger was. Wat dereden van het bezoek van de verpleegkundige ook mag zijn, u bent bereid mee te werken;– wanneer de verpleegkundige vraagt of u de reden van het bezoek weet, antwoordt u negatief, zodat nadereuitleg volgt.– wanneer de verpleegkundige vraagt of u het doel van het in en uit bed helpen weet (de taak), antwoordt unegatief, zodat nadere uitleg volgt;– wanneer de verpleegkundige vraagt of u het verloop van de taak weet, antwoordt u negatief, zodat nadereuitleg volgt.

gedrag tijdens verplaatsing van lig naar zit in stoel

Nadat u bent ingelicht en de werkomgeving in orde is gebracht, wordt u allereerst van lig in bed naar zit inde stoel geholpen. Hierbij handelt u als volgt:– de eerste handelingen in bed kunt u na instructie zelf verrichten: het leggen van de linkerarm over hetlichaam en het buigen van de linkerknie. Deze laatste handeling ging echter al iets moeizamer (hoestje erbij);– het kantelen gaat nog iets moeizamer. Daarom helpt (als het goed is) de verpleegkundige u enigszins doorlichte druk te geven aan de buitenzijde van de linkerknie. U ligt nu op de rechterzij;– het optrekken van de knieën en het schuiven van de onderbenen naar de bedrand lukt u ook;– met het tot zit komen op de bedrand hebt u problemen. De benen kunt u wel de bedrand af laten glijden,maar het tegelijkertijd opdrukken van het lichaam door af te zetten met de linkerhand lukt niet. Daarom wordtu door de verpleegkundige verder tot zit geholpen;– u zit op de bedrand. Wanneer u wordt gevraagd hoe u zich voelt, antwoordt u dat u wat vermoeid bent. Debenauwdheid is niet erger geworden (u hoest wat). U voelt zich een beetje duizelig. U hoest wat.– het schoeisel aandoen laat u doen. U laat zich ook ondersteunen bij het komen van zit op bedrand (metbillen midden op matras) naar zit op bedrand (met billen op rand van matras);– u volgt vervolgens de instructies van de verpleegkundige op waardoor u uiteindelijk in de stoel belandt.

gedrag tijdens verplaatsing van zit in stoel naar lig in bed

Nadat u in de stoel zit, wordt u direct weer in bed geholpen. Hierbij handelt u als volgt:– u volgt de instructies op. Tijdens de handelingen waarbij u van zit in stoel naar zit op bed laat u merken datu wat onzeker bent in de beweging. De verpleegkundige zal u hierdoor fysiek ondersteunen;– u laat zich ook fysiek ondersteunen tot lig op de zij;– de handelingen om te komen van zijlig tot ruglig voert u na instructie weer geheel zelf uit.

gedrag tijdens taakafronding

Tijdens de taakafronding wordt ervoor gezorgd dat de patiënt comfortabel in bed ligt, wordt de gegeven zorggeëvalueerd en wordt de werkomgeving in orde gebracht.U handelt in deze fase als volgt:* wanneer u wordt gevraagd of u comfortabel ligt antwoordt u waarheidsgetrouw: ja of nee.

133

Page 138: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

tabel 43 - Opdracht voor de leerling

Opdracht

Het is middag. Het is de bedoeling dat de patiënt uit en in bed wordt geholpen.

Aandachtspunten bij de opdracht:- Nadat je voldoende informatie over de patiënt hebt ingewonnen en voordat je de patiënt uit bed helpt

meld je de beoordelaars welke techniek je gaat gebruiken: a actief, b geleid actief c passief met 1hulpverlener of d passief met twee hulpverleners.

- Nadat de patiënt uit bed is geholpen volgt er een korte time-out. Hierna kun je de patiënt in bed helpen.

tabel 44 - Voorbeeld van een patiëntendossier

Dossier

Gegevens van de patiënt:

1 PersonaliaNaam: Dhr. J. Franssen (Joost)Leeftijd: 45 jaarBurg. staat: Getrouwd, 2 kinderenBeroep: arbeidsongeschikt (voormalig administratief medewerker bank)

2 Situatie van patiënt voor de opnameMeneer Franssen is sinds een jaar arbeidsongeschikt. Daarvoor werkte meneer als administratief medewerkerbij een bank. Ten gevolge van chronische bronchitis en astma heeft meneer zo’n vijf jaar een longemfyseem.Door toename van de klachten (vaak benauwd en kortademig door verminderde longfunctie) moest meneernoodzakelijkerwijs stoppen met zijn werkzaamheden. De laatste tijd nemen de klachten steeds meer toe:meneer is erg vaak kortademig en moet veelvuldig zijn hulpademhalingsspieren gebruiken om de uitademingte bevorderen. Dit is de reden dat meneer ter observatie is opgenomen in het ziekenhuis.

3 Opname-indicatiesControle hart en longen naar aanleiding van toename klachten longemfyseem.Lichte rugklachten (onderrug).

4 BehandelplanOm bedcomplicaties te voorkomen en ter ontspanning na de onderzoeken dient meneer enkele malen perdag uit en in bed te worden geholpen.

5 Informatie over vorig contact met de patiëntNa de eerste onderzoeken in de ochtend is meneer door een fysiotherapeut uit en in bed geholpen. Omdatmeneer enige last heeft van zijn onderrug is meneer via zijlig uit bed geholpen. Meneer was enigszinsbenauwd. Bewegingen die veel kracht vergden dienden door de fysiotherapeut ondersteunt te worden.Meneer was erg humeurig.

134

Page 139: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

7.8.4 Kwaliteitsbeschrijving

Er is onderzoek gedaan naar de kwaliteit van de beschreven patiëntsimulatie als toetsinstrument(Wopereis, 1996). Hierbij hebben vier leerlingen alle vier de stations doorlopen. Zij werden daarbijgeobserveerd door steeds twee beoordelaars. Door nu de prestaties onder de verschillende condities metelkaar te vergelijken, kon een indruk worden verkregen van de betrouwbaarheid (i.c. de interbeoorde-laarsovereenstemming) en de validiteit (i.c. de mate waarin de prestaties van de leerlingen consistent zijnover de verschillende stations).

In het algemeen kan worden gesteld dat de beoordelingslijsten goed hanteerbaar zijn. De lay-out isduidelijk en de detaillering wordt niet als een nadeel ervaren, mits van tevoren met de lijsten is geoefend.De betrouwbaarheid van de lijsten is redelijk. De overeenstemming in station 1 is middelmatig, deovereenstemming in station 2 en 3 is behoorlijk en de overeenstemming in station 4 is aanzienlijk.Hieruit kan worden geconcludeerd dat ten aanzien van de betrouwbaarheid verbeteringen mogelijk zijn.Een deel van de verbetering zal liggen in het reviseren en/of verwijderen van items en het verduidelijkenvan de scorecriteria en -categorieën tijdens de training van de beoordelaars.De lage kwaliteitsscore van sommige items heeft grotendeels te maken met het feit dat deze items teweinig discrimineerden. Een item kan dan te gemakkelijk zijn (dus triviaal), maar het kan ook zijn datalle proefpersonen het item goed scoorden, omdat ze het aspect goed uitvoerden. In veel gevallen golddit laatste.

Volgens de docenten is de inhoudsvaliditeit redelijk. De toets dekt de leerstof die van tevoren voor deinstructie is geselecteerd. Ondanks het feit dat het houdingsaspect niet tot de geselecteerde leerdoelenbehoorde, wordt dit toch aangemerkt als een aspect dat in de toetsing wordt gemist. De vraag kan nuworden gesteld of het houdingsaspect in het onderwijs en dus ook in de toets aanwezig moet zijn. Voorde toetsing is de toevoeging van het houdingsaspect geen groot probleem. Men pleit zelfs vaak voor eengeïntegreerde toetsing waar zoveel mogelijk aspecten van een vaardigheid aan bod komen.

Wat betreft de generaliseerbaarheid kan worden gezegd dat de beoordelingssituaties gezamenlijkvoldoende informatie geven over de vaardigheid. Omdat deze conclusie gebaseerd is op het oordeel vaneen (klein) aantal docenten, dient naar dit aspect verder onderzoek verricht te worden. Hierbij kanbijvoorbeeld worden gedacht aan een test-hertest-onderzoek, waarbij de hertest bestaat uit anderetaaksituaties dan de originele test, die echter wel representatief zijn voor de vast te stellen vaardigheid.Uit het generaliseerbaarheidsonderzoek bleek echter dat de verschillende stations niet allemaal met elkaarsamenhangen. Dit betekent dat ieder station dus een component van de algemene vaardigheid meet enzodoende een onderdeel van de toets moet zijn.

135

Page 140: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

7.9 Work sample test

De work sample test (praktijktoetsing op de werkplek) heeft een aantal kenmerkende voordelen:– De verpleeg- of zorgsituaties waarin toetsing plaatsvindt, zijn levensecht, waardoor niet alleen de

vaardigheid op zich beoordeeld kan worden maar ook de inpassing daarvan in het volledigeverpleegkundig handelen (m.n. de omgang met de patiënt, het rekening houden met het gehanteerdeverpleegsysteem e.d.). Een voorwaarde is dan wel dat de leerling het niveau van een beginnendberoepsbeoefenaar heeft. De leerling moet immers niet alleen de vaardigheid op zich beheersen maarook voldoende kennis hebben van bijvoorbeeld de aandoening van de patiënt.

– De verpleeg- of zorgsituaties waarin toetsing plaatsvindt, zijn vrijwel altijd voorhanden, tenzij hetom zeer zeldzame vaardigheden gaat. Het gaat immers niet om een nieuw toetsmoment, maar omhet verbeteren van de huidige methode van ’observeren en aftekenen’: iedere leerling wordt opdezelfde aspecten beoordeeld, waardoor een grotere mate van standaardisatie (en daarmee vanobjectiviteit) in de beoordeling ontstaat. Door het vastleggen van procedures en expliciteren vanvoorwaarden kan de betrouwbaarheid worden bevorderd.

Niet alle vaardigheden komen echter in aanmerking om op de werkplek beoordeeld te worden: sommigevaardigheden, met name de cognitieve en psychomotorische (instrumenteel-technische) vaardighedenkunnen beter (betrouwbaarder) via andere toetsvormen aan de orde komen. Andere vaardigheden(conflicthantering) kunnen niet altijd getoetst worden, omdat de vereiste situatie zich niet voordoet.Omdat er sprake is van echte patiënten, is niet elke situatie geschikt als beoordelingssituatie: soms is hetimmers medisch of ethisch onverantwoord om een leerling in een acute of emotionele situatie tebeoordelen.Ook is het niet haalbaar om voor alle vaardigheden die in aanmerking komen, ook daadwerkelijk eenbeoordelingsinstrument te ontwikkelen. Er zal dus een keuze gemaakt moeten worden. Overwegingendie daarbij een rol spelen zijn het belang van de vaardigheid voor een goede beroepsuitoefening, defrequentie waarmee de vaardigheid in de praktijk voorkomt en de mate waarin soortgelijke vaardighedenal op enigerlei andere wijze beoordeeld worden.

7.9.1 De analyse van de vaardigheid in aspecten en eventuele criteria

Wanneer gekozen is voor een bepaalde vaardigheid die cruciaal is, vaak voorkomt of aspecten bevat dienog niet getoetst worden, zal een nadere analyse van de gekozen vaardigheid moeten plaatsvinden. Ditkan aan de hand van geconcretiseerde eindtermen, leerstofomschrijvingen of taakanalyses.Tijdens deze fase is het belangrijk om gebruik te maken van de expertise van een groep van docentendie de verschillende tussenproducten becommentariëren en het instrument mede vormgeven.Er moet nauwkeurig omschreven worden aan welke eisen de toetssituatie moet voldoen en onder welkeomstandigheden de leerling de gevraagde vaardigheid moet laten zien.Vervolgens moet besloten worden of er een gedetailleerde lijst met criteria kan worden opgesteld of datvolstaan moet worden met globale aandachtspunten. Hierbij speelt ook een rol of er bij het uitvoeren vande handeling een of meer producten ontstaan of dat vooral het proces belangrijk is. Tussen deze uiterstenzijn allerlei nuances denkbaar.Het verdient aanbeveling om naast de gedragsaspecten een ruimte vrij te laten waarin tijdens het gesprekaantekeningen gemaakt kunnen worden. Dit voorkomt enerzijds dat men zaken vergeet en anderzijds datmen te snel tot uitspraken komt.De beoordelingsaspecten moeten zo mogelijk chronologisch aan het verloop van de handelingengeordend worden. Wanneer dat niet kan moet gezocht worden naar een logische ordening en clusteringvan aspecten.

136

Page 141: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

7.9.2 De beoordelaars

De wijze waarop de beoordelingslijst is uitgewerkt (globaal of gedetailleerd) bepaalt of gekozen moetworden voor deskundige beoordelaars. Wanneer er sprake is van globale aandachtspunten, zal het nodigblijken te zijn dat de gebruiker van het instrument inhoudelijk deskundig is. Soms kan niet preciesomschreven worden aan welke criteria de leerling moet voldoen. De praktijkvaardigheid is dan weluiteengerafeld in deelvaardigheden of beoordelingsaspecten, maar het is vervolgens aan de beoordelaarom te beslissen of de leerling op de afzonderlijke aspecten een voldoende prestatie levert. Dit geldt metname in praktijksituaties waarin een patiënt betrokken is. Omdat de patiëntensituatie nauwelijksgestandaardiseerd kan worden, moeten bij de beoordeling allerlei situationele factoren meegewogenworden: een bepaald gedrag kan in de ene situatie adequaat zijn, terwijl hetzelfde gedrag onder andereomstandigheden inadequaat is. Het moge duidelijk zijn dat slechts een deskundige zo’n beoordeling kanuitvoeren.Dit betekent dat de inbreng van de beoordelaar groot is, hetgeen omwille van de betrouwbaarheid eenonwenselijk situatie is. Het is daarom bij het ontbreken van eenduidige criteria aan te bevelen, wanneerdat organisatorisch mogelijk is, te kiezen voor een tweede beoordelaar. Zo worden de individuelebeoordelaarsfouten enigszins uitgemiddeld.Bovendien moet getracht worden met elkaar tot enige mate van consensus te komen over de meerimpliciete criteria.Er kan ook voor gekozen worden om de beoordeling door een leek te laten doen. In veel gevallen is datdan de patiënt zelf. Vanzelfsprekend kan dat alleen als de patiënt daartoe bereid is. Verder dient er indat geval sprake te zijn van een gedetailleerde lijst die minder (deskundige) interpretatie vereist. Ookmoeten dergelijke beoordelaars van tevoren getraind zijn.Het blijft de vraag in hoeverre een patiënt bereid is om eerlijke beoordelingen te geven over een leerlingdie toch z’n best heeft gedaan.In tabel 46 is terug te vinden hoe de beoordelingen in de verschillende situaties georganiseerd kunnenzijn:

Het verdient in ieder geval aanbeveling om voor de beoordelaar een uitgebreide handleiding op te stellen,

tabel 45 - Organisatie van de beoordelingen in verschillende situaties

twee deskundigebeoordelaars

één deskundigebeoordelaar

een leken-beoordelaar

globale beoordelingsaspecten

gedetailleerde criteria

zodat deze zich optimaal op zijn beoordelingstaak kan voorbereiden.

7.9.3 Onderzoek

Schotten en Stolk hebben in 1995 onderzoek gedaan naar de mogelijkheden van praktijktoetsing op dewerkplek. Als praktijkhandeling voor dit onderzoek werd gekozen voor een (opname-)gesprek ’tusseneen leerling-verpleegkundige/verzorgende en een patiënt/cliënt/bewoner in de eerste fase van hetverpleeg-/zorg-proces, waarin het verzamelen van gegevens centraal staat.’De nadere analyse van de gekozen vaardigheid vond plaats aan de hand van de geconcretiseerdeeindtermen voor A, B, Z en ZV (Cito in opdracht van het Ministerie vanWVC, 1991) en detussenproducten van het project dat zich bezighield met de vergelijking van de verschillende eindtermen(in 1994 gepubliceerd).

137

Page 142: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

Voor de structurering van de verschillende deelvaardigheden die tijdens een gesprek een rol spelen werdgebruikgemaakt van de indelingen zoals die in de literatuur gevonden kunnen worden.Tijdens de constructiefase is gebruik gemaakt van de expertise van een groep van zeven docenten uitde A, de B en de ZV. Deze docenten hebben, vaak in samenspraak met collega’s, de verschillendetussenproducten becommentarieerd en het instrument mede vormgegeven.Het uiteindelijke beoordelingsinstrument bestond uit een beoordelingslijst met 27 gedragsaspecten en eenaantekenblad dat tijdens het gesprek gehanteerd zou kunnen worden. Voor de beoordelaar was erbovendien een uitgebreide handleiding voor het gebruik.

In de eerste versie van de beoordelingslijst moesten alle gedragsaspecten dichotoom worden gescoord(1 = ’passend gedrag’; 0 = ’niet passend gedrag’): het gedrag van de leerling ten aanzien van eenbepaald aspect is ’passend’ wanneer de beoordelaar de indruk heeft dat de leerling het betreffende gedragbewust wél of niet vertoont. Bij de meeste instrumenten voor gedragsbeoordelingen volgt een positievescore alleen als het gevraagde gedrag wordt vertoond. In de onderhavige beoordeling kan de leerlingevenwel ook een positieve score krijgen als hij het betreffende gedrag niet heeft gedemonstreerd omdathij dit niet in het belang van de verpleegkundige situatie achtte.De gebruiker van het instrument wordt verondersteld inhoudelijk deskundig te zijn. Het is niet debedoeling (voor zover het al mogelijk is!) dat precies omschreven wordt aan welke criteria de leerlingmoet voldoen. De praktijkvaardigheid wordt in het instrument uiteengerafeld in deelvaardigheden ofbeoordelingsaspecten, maar het is vervolgens aan de beoordelaar om te beslissen of de leerling op deafzonderlijke aspecten een voldoende prestatie levert. En juist omdat de patiëntensituatie nauwelijksgestandaardiseerd kan worden, moeten bij die beoordeling allerlei situationele factoren meegewogenworden: een bepaald gedrag kan in de ene situatie adequaat zijn, terwijl hetzelfde gedrag onder andereomstandigheden inadequaat is. Het moge duidelijk zijn dat slechts een deskundige zo’n beoordeling kanuitvoeren.

Uit het onderzoek bleek dat een oordeel dat gebaseerd is op het instrument, wat betreft de betrouwbaar-heid en de validiteit, net zo goed is als het oordeel zonder instrument. Het instrument kan echter omaantal redenen toch een verbetering van de beoordeling betekenen:– De beoordeling wordt systematischer en gestructureerder uitgevoerd.– Doordat de beoordelingscriteria op papier staan kunnen de beoordelaars onderling effectiever

communiceren over de gehanteerde normen bij het beoordelen; dit bewust nadenken over waardenen normen en het discussiëren hierover komt de kwaliteit ten goede.

– Als de leerling vooraf op de hoogte is van de criteria waarop hij beoordeeld wordt (hetgeen idealiterhet geval is) kan hij zich beter voorbereiden op de te leveren prestatie.

– Voor de beoordelaar is het gemakkelijker om met de leerling de tijdens de beoordelingssituatiegeleverde prestatie na te bespreken; dit maakt het tot een bruikbaar hulpmiddel in het onderwijsleer-proces.

– Aan de hand van de criteria is af te meten of een geselecteerde zorgsituatie geschikt is alsbeoordelingssituatie.

Uit een nadere evaluatie van het onderzoek leek op twee fronten nog een verbetering van de beoordelingbereikt te kunnen worden, namelijk door het instrument beter hanteerbaar te maken en door debeoordelaars te trainen. Op beide punten wordt hieronder nader ingegaan.

Hanteerbaarheid van het instrumentUit de evaluatieformulieren, die door alle beoordelaars die aan het onderzoek hebben deelgenomenwerden ingevuld, bleek dat het onderscheid tussen passend en niet passend gedrag, zoals dat in deexperimentele lijst was aangebracht, lastig te hanteren was: men moest immers in één score aangeven

138

Page 143: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

of men het gedrag al dan niet had waargenomen en welke waardering men daaraan vervolgens gaf.Bovendien vond men het moeilijk om over alle 27 gedragsaspecten een uitspraak te doen.

In de tweede versie van het beoordelingsinstrument zijn de 27 gedragsaspecten niet langer onderverdeeldvolgens het verloop van het gesprek, maar samengebracht in 7 rubrieken: voorbereiding, opening,gegevensverzameling, interactie, techniek, professionaliteit en afsluiting.In plaats van per aspect moet nu per rubriek een beoordeling (voldoende/onvoldoende) wordenuitgesproken. Dit oordeel richt zich op twee elementen van het leerlinggedrag: de inhoud en deuitvoering.De geconsulteerde beoordelaars waren unaniem positief over de richting van de wijzigingen en op hunvoorstel zijn zelfs nog enkele verdere vereenvoudigingen aangebracht. Zo is op hun advies afgestapt vanhet idee dat de lijst tijdens het gesprek ingevuld moet worden. Een gelijktijdige beoordeling leidt deaandacht te veel af van het gesprek. Bovendien volgt de nieuwe lijst niet meer strikt het verloop van hetgesprek. Pas na afloop is per rubriek een afgewogen oordeel te geven. Wel wordt aanbevolen om zomogelijk tijdens het observeren aantekeningen te maken, die bij het uiteindelijke oordeel van pas kunnenkomen.Het huidige beoordelingsformulier is terug te vinden op bladzijde 142 (tabel 46). Op de bladzijdendaaraan voorafgaand is een toelichting op de lijst te vinden met daarbij per rubriek een korte toelichting.

Training van de beoordelaarsUit de resultaten werd duidelijk dat er onvoldoende overeenstemming bij beoordelaars bestaat over hetgewenste leerlinggedrag.Tijdens een sessie met een aantal beoordelaars is geprobeerd om hen, voorafgaand aan de beoordelingmet het bijgestelde instrument, consensus te laten bereiken over het gewenste leerlinggedrag. Hoewelde tijd te kort was om tot echte overeenstemming te komen, onderschreven allen de noodzaak van eendergelijk overleg tussen beoordelaars: opleidingen die hun beoordeling daadwerkelijk betrouwbaarderwillen maken, zullen zich eerst intern moeten beraden op de criteria die enerzijds bij het aanleren vande vaardigheden en anderzijds bij de beoordeling ervan gehanteerd worden.

De leerlingenVan de leerlingen die op de werkplek beoordeeld worden, wordt verondersteld dat zij (althans voor deaspecten waarop zij beoordeeld worden) het niveau van beginnend beroepsbeoefenaar bereikt hebben endus in staat zijn op basis van kennis en inzicht de juiste keuzen te maken en prioriteiten te stellen.In sommige gevallen zal de beoordeling om praktische redenen niet plaatsvinden aan het einde van deopleiding maar op het moment dat de leerlingen voor het laatst met dit onderwerp te maken hebben.In elk geval gelden de volgende basisvoorwaarden:– De leerlingen hebben alle theorie met betrekking tot het onderwerp ’opnamegesprek’ gehad en

hebben dit ook voldoende kunnen oefenen. Ze hebben van tevoren kennis genomen van hetbeoordelingsinstrument zodat ze weten op welke beoordelingsaspecten gelet wordt.

– Tijdens het gesprek mag door de leerlingen gebruik gemaakt worden van een anamneseformulier ofeen andere standaard-vragenlijst.

– Eerder in de opleiding is de theorie over de problematiek van de patiënt en het te verwachtenpatiëntengedrag aan de orde geweest. De gekozen zorgsituatie (de problematiek en het te verwachtengedrag van de patiënt/cliënt/bewoner) waarop de beoordeling betrekking heeft, sluit aan bij hetopleidingsniveau van de leerlingen.

De selectie van de praktijksituatie voor de beoordelingOmdat de beoordelingssituatie zo natuurlijk mogelijk moet zijn, kan dit betekenen dat de ene situatiemoeilijker is dan de andere. Om dit bezwaar te ondervangen moet elke leerling gedurende zijn opleiding

139

Page 144: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

minimaal tweemaal een bepaalde praktijksituatie aangeboden krijgen en dus ook minimaal tweemaal opde desbetreffende praktijkvaardigheid beoordeeld worden.Verder werden de volgende richtlijnen geformuleerd ten aanzien van het selecteren van een geschiktebeoordelingssituatie:– de situatie moet aansluiten bij het opleidingsniveau van de leerling (zie ook hierboven).– de situatie moet representatief zijn: extreme situaties moeten vermeden worden, dat wil zeggen de

patiënt moet een gedrag vertonen dat vaak voorkomt in dergelijke situaties.

Het beoordelingsinstrumentIn tabel 47 is alleen de beoordelingslijst opgenomen. Het volledige beoordelingsinstrument bestaat uit:– het voorblad, waarop ruimte voor administratieve gegevens;– de beoordelingslijst, waarop alle beoordelingsaspecten in rubrieken zijn ondergebracht;– een aantekenblad, dat tijdens de observatie gebruikt kan worden.Gebleken is dat het niet verstandig is om tijdens de observatie de beoordelingslijst in te vullen: men mistdan al gauw een deel van de interactie. Ook kan men over een rubriek pas een afgewogen oordeel gevenna afloop van het gesprek. Om toch bepaalde observaties vast te leggen tijdens het gesprek, kan hetaantekenblad gebruikt worden.

Direct aansluitend aan het gesprek en gebruikmakend van de aantekeningen op het aantekenblad moetper rubriek een oordeel worden gegeven over enerzijds de inhoud en anderzijds de uitvoering.Met inhoud wordt gedoeld op de verpleegkundige en vakinhoudelijke kwaliteit van het handelen van deleerling: klopt de informatie die verstrekt wordt, zijn de vragen die gesteld worden relevant voor de doelvan het gesprek etcetera.Bij de uitvoering gaat het veeleer om de wijze waarop het gesprek gevoerd wordt: wordt de gegeveninformatie afgestemd op het bevattingsvermogen van de patiënt, wordt er echt contact gelegd etcetera.Het oordeel moet per rubriek en per aspect gegeven worden in de vorm van een ’+’ (voldoende) of een’−’ (onvoldoende). Vooraf moeten afspraken gemaakt worden over het aantal onderdelen dat voldoendemoet zijn om als eindoordeel een voldoende te kunnen krijgen.Hieronder worden de onderscheiden rubrieken voor zover nodig nader toegelicht:

Voorbereiding– Aandacht hebben voor het gespreksklimaat: geschikte omgeving, koffie e.d., beschikbare tijd,

etcetera.– Hanteren van beschikbare gegevens van de patiënt: persoonlijke gegevens, opname-indicatie,

ziektegeschiedenis, eventueel eerdere opnamesOf de leerling zich in voldoende mate op het gesprek heeft voorbereid, blijkt onder meer uit de matewaarin het gesprek ongestoord kan plaatsvinden: is er een rustige ruimte gereserveerd, is er voldoendetijd uitgetrokken voor het gesprek. Tijdens het gesprek wordt bovendien duidelijk of de leerling aansluitbij en gebruikmaakt van de beschikbare gegevens: de leerling vraagt geen informatie die de patiënt aleerder heeft verstrekt, brengt de beschikbare gegevens op een soepele manier in in het gesprek en vraagtdaarop door voor zover dat voor het zorgproces noodzakelijk is.

Opening– zich voorstellen met naam en functie;– het doel van het gesprek uitleggen;– informatie geven over de gespreksprocedure (tijdsduur, verloop, eventuele gebruik van standaardfor-

mulier);– informatie geven over aard, werkwijze, regels, verpleegsysteem, hulpverleners van ziekenhuis/

instelling en de eventueel gevolgen daarvan voor de patiënt; folders aanbieden;– informatie geven over de rechten en plichten van de patiënt en daarbij uitleg geven;

140

Page 145: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

– aangeven wat de (on)mogelijkheden zijn van de afdeling (materialen, personeel, procedures).De opening van het gesprek bestaat vooral uit het verstrekken van informatie: de leerling maakt duidelijkwie hij is en wat het gesprek zal gaan inhouden. De informatie wordt vooral gedoseerd gegeven om tevoorkomen dat de patiënt overvoerd wordt: welke zaken daarbij echter essentieel zijn is iets wat debeoordelaar vooraf in overleg met zijn collega’s bepaald moet hebben.Nog enkele aandachtspunten voor de beoordelaar zijn:– Wanneer de leerling de patiënt uit een wachtruimte heeft opgehaald of wanneer de patiënt al enige

dagen op de afdeling verblijft, mag verondersteld worden dat het voorstellen al gebeurd is. Dit aspecttelt in dat geval niet mee bij de beoordeling van deze rubriek.

– Met de leerling zal vooraf een duidelijke afspraak gemaakt moeten worden over het al dan nietmelding maken aan de patiënt van het feit dat het een beoordelingssituatie betreft.

Gegevensverzameling– vragen naar de contactpersoon;– informeren naar de mate van zelfredzaamheid en eventuele. mantelzorg;– gericht informatie vragen over leefgewoonten en eventuele beperkingen daarin;– gericht informatie vragen over de somatische gesteldheid en eventuele beperkingen daarin;– gericht informatie vragen over de psychosociale gesteldheid en eventuele beperkingen daarin.Na het geven van informatie uit de vorige rubriek, wordt nu aan de patiënt de gelegenheid geboden omop zijn beurt informatie te verstrekken. Het is met name bij deze rubriek dat al dan niet het hanteren vaneen anamneseformulier een rol gaat spelen. Wanneer een dergelijk formulier wordt gebruikt, moet geletworden op de wijze waarop de leerling daarmee omgaat: wordt de vragenlijst strikt en systematischafgewerkt en direct ingevuld of gebruikt de leerling het formulier op soepele wijze als geheugensteun.Ook ten aanzien van dit punt zullen beoordelaars tot een uitspraak moeten komen over de beste manierom het anamneseformulier te hanteren.Wanneer geen anamneseformulier wordt gebruikt, is vooral belangrijk om na te gaan of de leerling geenrelevante onderwerpen overslaat.

Interactie– Observeren van en reageren op non-verbale signalen;– rekening houden met de somatische en psychosociale gesteldheid;– rekening houden met de persoonlijke achtergrond (niveau, cultuur, religie etc.);– patiënt en/of relaties gelegenheid geven vragen te stellen en wensen/gevoelens kenbaar te maken c.q.

daartoe voorwaarden scheppen;– doorvragen op uitspraken en ingaan op vragen, wensen en/of emoties van patiënt en/of diens relaties.Bij deze rubriek gaat het om de vaardigheid van de leerling om het gedrag van de ander te observerenen daarop adequaat te reageren. Ziet een leerling dat de patiënt te moe is om het gesprek voort te zettenof niet? Merkt een leerling dat de patiënt met vragen of gevoelens zit of is hij te druk met zijn eigenaandeel in het gesprek? Wat hierin adequaat gedrag is, is sterk afhankelijk van de specifieke situatie. Hetvastleggen van normen ten aanzien van deze rubriek zal slechts in algemene termen kunnen gebeuren.

Techniek– Hanteren van de gekozen gesprekstechnieken: vragen (niet suggestief), parafraseren, reflecteren, etc.);– actief luisteren: aanmoedigen, bevestigend knikken, hummen, oogcontact, gebaren, houding,

gelaatsuitdrukking, etcetera;– zich verstaanbaar maken: structuur van verhaal, zinsbouw, toonhoogte, volume, dialect, gesprekstem-

po;– de tijdsduur van het gesprek bewaken.Afhankelijk van de gewenste informatie stelt de leerling open of gesloten vragen, maar stuurt daarbij nietaan op een bepaald antwoord. Hij laat in zijn houding zien dat hij luistert. Door te parafraseren en te

141

Page 146: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

reflecteren kan hij niet alleen laten merken dat hij luistert maar ook direct controleren of hij de patiëntgoed begrepen heeft. De leerling drukt zich helder en duidelijk uit.Het bewaken van de tijdsduur vindt tijdens het hele gesprek plaats: een patiënt die lang van stof is, wordtop subtiele wijze tot beknoptheid aangezet, terwijl de leerling ook zelf zijn tijd efficiënt indeelt en nietnodeloos diep op één aspect ingaat.

Professionaliteit– Verstrekken van informatie over het ziektebeeld, de behandeling etcetera (voor zover dit tot de taak

van de verpleegkundige hoort);– vertrouwen wekken (zowel op basis van vakdeskundigheid als op basis van houding/gedrag);– blijk geven van een professionele beroepshouding en empathisch vermogen;– prioriteiten stellen indien de omstandigheden dit noodzakelijk maken.De leerling laat in zijn optreden zien dat hij een professionele beroepsbeoefenaar is, die weet wat degrenzen van zijn beroep zijn en die zowel zijn deskundigheid als zijn mens-zijn wil inzetten ten dienstevan de hulpvrager. Bij het geven van informatie over het ziektebeeld moet hij ervoor waken zich op hetterrein van de arts te begeven.Verder moet hij hier laten blijken dat hij weet dat er een mens tegenover hem zit. Op basis daarvan moetde leerling de verantwoordelijkheid durven nemen om het gesprek af te breken als duidelijk wordt datde patiënt het gesprek niet kan of wil voortzetten.

Afsluiting– Regelmatig controleren of de informatie goed begrepen is (door patiënt + door leerling);– tussentijds en aan het eind een samenvatting geven van het gesprek of delen daarvan;– informatie geven over de fase na het gesprek en eventuele vervolgafspraken maken;– informeren of de patiënt nog vragen te stellen heeft;– een natuurlijk einde aan het gesprek maken.De rubriek afsluiting komt niet alleen in beeld aan het einde van het gesprek, maar ook bij de afrondingvan onderdelen van het gesprek. Eerder is al genoemd dat de leerling van tijd tot tijd controleert of deinformatie begrepen is. Bij de afsluiting van het gesprek zorgt de leerling ervoor dat de patiënt duidelijkweet wat er verder gaat gebeuren door de relevante informatie samen te vatten en na te gaan of depatiënt nog vragen heeft. Het gesprek heeft een natuurlijk einde als beide partijen een afgerondehoeveelheid informatie hebben uitgewisseld.

142

Page 147: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

GESPREKSONDERDELEN

tabel 46 - Beoordelingslijst praktijktoetsing op de werkplek

Inh

ou

d

Uit

vo

eri

ng

Voorbereiding

• aandacht hebben voor gespreksklimaat: geschikte omgeving, koffie e.d., beschikbare tijd, etc.• hanteren van beschikbare gegevens van de patiënt: persoonlijke gegevens, opname-indicatie, ziektegeschie-

denis, evt. eerdere opnames

Opening

• zich voorstellen met naam en functie• doel van het gesprek uitleggen• informatie geven over de gespreksprocedure (tijdsduur, verloop, evt. gebruik van standaardformulier)• informatie geven over aard, werkwijze, regels, verpleegsysteem, hulpverleners van ziekenhuis/ instelling en

de evt. gevolgen daarvan voor de patiënt; folders aanbieden• informatie geven over rechten en plichten van de patiënt en daarbij uitleg geven• aangeven wat de (on)mogelijkheden zijn van de afdeling (materialen, personeel, procedures)

Gegevensverzameling

• vragen naar contactpersoon

• informeren naar de mate van zelfredzaamheid en evt. mantelzorg• gericht informatie vragen over leefgewoonten en evt. beperkingen daarin• gericht informatie vragen over de somatische gesteldheid en evt. beperkingen daarin• gericht informatie vragen over de psychosociale gesteldheid en evt. beperkingen daarin

Interactie

• observeren van en reageren op non-verbale signalen

• rekening houden met de somatische en psychosociale gesteldheid

• rekening houden met de persoonlijke achtergrond (niveau, cultuur, religie etc.)• gelegenheid geven vragen te stellen en wensen/gevoelens kenbaar te maken• doorvragen op uitspraken en ingaan op vragen, wensen en/of emoties van patiënt en/of diens relaties

Techniek

• hanteren van de gekozen gesprekstechnieken: vragen (niet suggestief), parafraseren, reflecteren, etc.)• actief luisteren: aanmoedigen, knikken, hummen, oogcontact, gebaren, houding, gelaatsuitdrukking, etc.• zich verstaanbaar maken: structuur van verhaal, zinsbouw, toonhoogte, volume, dialect, gesprekstempo• de tijdsduur van het gesprek bewaken

Professie

• verstrekken van informatie over ziektebeeld etc. (voor zover dit tot de taak van de verpleegkundige hoort)• vertrouwen wekken (zowel op basis van vakdeskundigheid als op basis van houding/gedrag)• blijk geven van professionele beroepshouding en empathisch vermogen

• prioriteiten stellen indien de omstandigheden dit noodzakelijk maken

Afsluiting

• regelmatig controleren of de informatie goed begrepen is (door patiënt + door kandidaat)• tussentijds en aan het eind een samenvatting geven van het gesprek of delen daarvan• informatie geven over de fase na het gesprek en eventuele vervolgafspraken maken• informeren of de patiënt nog vragen te stellen heeft• een natuurlijk einde aan het gesprek maken

Doorslaggevende positieve of negatieve aspecten

• gedrag/houding• inhoudelijke informatie etc.

143

Page 148: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

7.10 Beroepspraktijkvorming en de beoordeling daarvan

Een belangrijk onderdeel van elke beroepsopleiding is het onderricht in de praktijk van het beroep.Zowel in de beroepsopleidende leerweg als in de beroepsbegeleidende leerweg is sprake van eenpraktijkcomponent. Bij de beroepsbegeleidende leerweg (’werken/leren’) heeft de leerling eenarbeidsovereenkomst met de praktijkbiedende organisatie; bij de beroepsopleidende leerweg(’leren/stage’) is er sprake van een onderwijsovereenkomst tussen de leerling en opleiding. Hoewel erdus verschillen zijn in rechtspositie en ook in de omvang van de praktijkcomponent, wordt in het vervolgvan deze paragraaf dit onderscheid verder niet meer gemaakt. De term ’beroepspraktijkvorming’ is voorbeide situaties van toepassing.Aan de beoordeling van de beroepspraktijkvorming kunnen twee aspecten worden onderscheiden: demate waarin de praktijkplaats aan bepaalde voorwaarden voldoet en de mate waarin de leerling erinslaagt de voor de praktijkperiode geselecteerde eindtermen te realiseren. Op beide aspecten wordthieronder nader ingegaan.

7.10.1 Beoordeling van praktijkplaatsen

Iedere praktijkplaats moet aan kwaliteitscriteria voldoen. In het hoger beroepsonderwijs is het vaststellenvan deze criteria een aangelegenheid van een hogeschool en de organisatie die een praktijkplaats biedt.In de BVE-sector hebben de landelijke organen beroepsonderwijs (LOB’s) de taak om criteria op testellen waaraan arbeidsorganisaties moeten voldoen om beroepspraktijkvorming te mogen verzorgen. Alseen arbeidsorganisatie, die beroepspraktijkvorming wil verzorgen, aan deze criteria voldoet, wordt zeerkend en als zodanig opgenomen in een openbaar register. Onderwijsinstellingen kunnen dit registerraadplegen wanneer zij op zoek zijn naar geschikte plaatsen voor beroepspraktijkvorming.De stichting OVDB-Landelijk Orgaan van het Beroepsonderwijs Gezondheidszorg, Dienstverlening,Welzijn en Sport heeft voor de desbetreffende sectoren de volgende criteria opgesteld:1 Binnen het normale arbeidsproces van de organisatie kan een substantieel deel van de eindtermen

van een opleiding bereikt worden. Deze eindtermen hebben betrekking op kennis-, vaardigheids- enhoudingsaspecten.

2 De arbeidsorganisatie heeft ten minste één persoon, die belast wordt met de begeleiding van deleerling in de praktijk, aangewezen of aangesteld:a deze beschikt over een relevant diploma of getuigschrift dat ten minste gelijkwaardig is aan het

niveau van de kwalificatie(s) waarvoor wordt opgeleid enb deze heeft tenminste twee jaar van belang zijnde praktijkervaring opgedaan na het behalen van

het diploma of getuigschrift onder a ofc deze kan een combinatie van opleiding en ervaring aantonen die gelijkwaardig kan worden

geacht met het bepaalde onder a en b.3 De arbeidsorganisatie kan inzichtelijk maken dat maatregelen zijn getroffen om voldoende tijd vrij

te maken voor het (doen) begeleiden van de leerling.

De WEB (art. 7.2.8 en 7.2.9) zegt over de beroepspraktijkvorming verder nog dat deze verzorgd wordtop grondslag van een overeenkomst, die gesloten wordt door de instelling, de leerling en het bedrijf datof de organisatie die de beroepspraktijkvorming verzorgt. Bij de beroepsbegeleidende leerweg wordt dezeovereenkomst mede ondertekend door het bestuur van het desbetreffende landelijk orgaan.De praktijkovereenkomst omvat ten minste bepalingen over– de duur van de overeenkomst en de omvang van de periode van de beroepspraktijkvorming;– de begeleiding van de leerling;– dat deel van de eindtermen dat de leerling tijdens de praktijkperiode moet realiseren en de

beoordeling daarvan;– de gevallen waarin en de wijze waarop de overeenkomst voortijdig kan worden ontbonden.

144

Page 149: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

De rollen en taken van de drie partijen, die bij de beroepspraktijkvorming betrokken zijn, moeten goedop elkaar afgestemd zijn om de beroepspraktijkvorming effectief te laten verlopen. Vanuit de opleidingzal de begeleiding en beoordeling van de leerling gebeuren door een functionaris die hier voorlopig depraktijkdocent wordt genoemd; binnen de arbeidsorganisatie zal deze rol vervult worden door depraktijkbegeleider1.De leerling is vanzelfsprekend degene om wie het allemaal draait: hij doet werkervaring op aan de handvan opdrachten, die voortvloeien uit de praktijkdoelen. Doordat hij met allerlei voorkomende zakenwordt geconfronteerd, leert hij nadenken over datgene wat hij meemaakt tijdens de praktijkperiode endaarmee ook over zijn eigen sterke en zwakke kanten voor het beroep. Het is van belang de leerlingactief te betrekken in zijn eigen beoordeling. Dit gebeurt al vaak door hem een praktijkverslag te latenmaken waarin hij zijn leerervaringen gedurende de praktijkperiode bijhoudt. Daarnaast kan bijvoorbeeldook aan de leerling gevraagd worden om zichzelf te beoordelen aan de hand van een voorgestructureerdeobservatielijst. Door de begeleider dezelfde lijst te laten invullen, ontstaat er een bruikbaar hulpmiddelvoor een tussentijds beoordelingsgesprek.

De praktijkdocent, als begeleider vanuit de onderwijsinstelling, heeft tot taak alle betrokkenen hun roltijdens en na de praktijkperiode duidelijk te maken: voorafgaand aan de praktijkperiode zorgt hij er ondermeer voor dat de praktijkvormingsdoelen bekend zijn bij de leerling en de arbeidsorganisatie; tijdens depraktijkperiode vormt hij het contact tussen de opleiding en de arbeidsorganisatie.Tevens zorgt hij voor de registratie van gegevens zoals bezoekdatum, deelnemers gesprek, eventueleopmerkingen over begeleiding door het bedrijf of vragen om hulp of feedback van de leerling en noteerthij in de rubriek ’indruk over de voortgang’ globaal de vorderingen van de leerling.Ten slotte speelt hij zowel tijdens als aan het eind van de praktijkperiode een belangrijke rol bij debeoordeling: hij verzamelt de evaluatiegegevens en de ingevulde beoordelingsinstrumenten (zowel vande praktijkbegeleider als van de leerling als van hemzelf) en verwerkt deze gedurende het afsluitendegesprek met de betrokkenen tot een eindoordeel over de resultaten van de beroepspraktijkvorming.

Op de werkplek speelt depraktijkbegeleidereen belangrijke rol: hij geeft de leerling instructies enbegeleidt en motiveert hem zo goed mogelijk en hij informeert de onderwijsinstelling over het verloopvan de praktijkperiode en de leerresultaten van de leerling. Tevens houdt hij regelmatig tijdens depraktijkperiode informele feedbackgesprekken met de leerling over diens functioneren (zoals werktempo,omgaan met bedrijfsvoorschriften, omgang met collega’s e.d.). Het verdient de voorkeur dezefeedbackgesprekken op vaste momenten te houden. Ook bij de beoordeling speelt de praktijkbegeleidereen rol van betekenis. Doordat hij degene is die de leerling in het algemeen het meest direct meemaakt,legt zijn beoordeling veel gewicht in de schaal. Hij maakt bij de beoordeling gebruik van verschillendeobservatielijsten waarin taken en functie-eisen voor de praktijkperiode opgenomen zijn en geeft daaropaan of de leerling een taak voldoende of onvoldoende beheerst. Als maatstaf voor het beoordelen vande leerling gelden daarbij de eigen taakopvattingen van de begeleider en de normen van de arbeidsorga-nisatie. Het is gebruikelijk dat de praktijkbegeleider ook tijdens het afsluitende gesprek aanwezig is.

7.10.2 Praktijkvormingsdoelen

De basis van de beoordeling van de praktijkperiode wordt gevormd door de praktijkvormingsdoelen.Deze moeten afgeleid zijn van de te realiseren eindtermen. Als doelstellingen ontbreken of vaagomschreven zijn, ontbreekt een heldere leidraad voor zinvolle praktijkopdrachten en is het voor

1 Voor deze functionarissen doen vele benamingen de ronde: praktijkcoördinator, praktijkopleider, werkbegeleider,stagedocent, stagebegeleider etcetera. Verwarrend hierbij is dat bepaalde benamingen in het MBO een andere betekenishebben dan in het HBO.

145

Page 150: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

betrokkenen onduidelijk wat er nu precies bereikt en beoordeeld moet worden. Ook is de leerling tijdensde praktijkperiode effectiever bezig als hij weet welke doelen hij moet realiseren en wat er dus van hemwordt verwacht. Problemen met de beoordeling zijn dan ook vaak terug te voeren op het niet helder voorogen hebben wat men precies met de praktijkperiode wil bereiken.Het verdient aanbeveling om de arbeidsorganisatie zoveel mogelijk te betrekken bij de formulering vande praktijkvormingsdoelen om een goede afstemming tussen onderwijsinstelling en de organisatie tebewerkstelligen en de kans op het realiseren van de doelen zo groot mogelijk te maken.

Aangezien in de praktijkbeoordeling een uitspraak gedaan wordt over de mate waarin de leerling geachtwordt het beroep in de toekomst te kunnen uitoefenen, kunnen er ten aanzien van de beroepspraktijkvor-ming verschillende soorten doelen worden onderscheiden:1 doelen die betrekking hebben op het beroepsmatig functioneren, zoals het aanleren en toepassen van

praktische vaardigheden die nodig zijn om de handelingen te kunnen verrichten die het beroepvereist;

2 doelen die betrekking hebben op het persoonlijk functioneren, zoals het ontwikkelen en vormen vande eigen persoonlijkheid door het beroepsmatig contact met anderen;

3 doelen die betrekking hebben op het functioneren binnen de instelling, zoals het deelnemen aan hetarbeidsproces (wennen aan ritme, regels, verplichtingen etc.)

Als men beoordeelt of een leerling de gestelde doelen heeft bereikt, beoordeelt men in feitevanzelfsprekend ook daadwerkelijk de praktische vaardigheden van de leerling. Dit hoeven niet alleeninstrumenteel-technische vaardigheden te zijn. Het zijn ook sociale vaardigheden, communicatievevaardigheden en dergelijke. Voor het inhoudelijk beoordelen van deze praktische vaardigheden wordtverwezen naar paragraaf 7.9 van dit handboek.

7.10.3 Een verantwoorde praktijkbeoordeling

Voor zover er geen sprake is van externe legitimering beoordeelt de onderwijsinstelling of de leerlingde overeengekomen eindtermen heeft gerealiseerd. Bij die beoordeling wordt het oordeel van dearbeidsorganisatie betrokken.In de onderwijs- en examenregeling kunnen echter nadere regels worden opgenomen over de wijzewaarop de beroepspraktijkvorming beoordeeld wordt.

Alvorens enkele instrumenten voor de beoordeling van de praktijkperiode te bespreken, is het van belangstil te staan bij de algemene eisen die gesteld worden aan een verantwoorde praktijkbeoordeling.De belangrijkste eisen zijn achtereenvolgens (zie ook hoofdstuk 3):– Een verantwoorde praktijkbeoordeling moet transparant zijn

Beoordelingsprocedures moeten voor alle betrokkenen duidelijk en aanvaardbaar zijn en beslissingenover het functioneren van de leerling moeten te rechtvaardigen zijn. Om te voldoen aan ditkwaliteitscriterium moet de praktijkdocent ervoor zorgen dat zowel de leerling als de arbeidsorgani-satie voorafgaand aan de praktijkperiode op de hoogte is van het beoordelingssysteem: men weetwaarop gelet wordt en op welke wijze beslissingen tot stand komen. Deze beslissingen moetenbovendien door derden natrekbaar zijn. Daarom is het van belang de gegevens waarop beslissingengenomen worden, goed te documenteren.

– Een verantwoorde beoordeling moet valide zijnDe beoordelaars moeten zichzelf voortdurend de vraag stellen of datgene beoordeeld wordt wat menbeoogt te beoordelen. Een goed uitgewerkt praktijkleerplan vormt de basis voor een validebeoordeling omdat hierin wordt aangegeven aan welke minimale doelstellingen de leerling moetvoldoen. Het beoordelingsinstrument moet een representatieve afspiegeling zijn van de omschreven

146

Page 151: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

praktijkdoelen. Concreet betekent dit dat de praktijkdoelen terug te vinden moeten zijn in depraktijkbeoordelingslijst.

– Een verantwoorde beoordeling moet betrouwbaar zijnBij validiteit gaat het om de vraag wat er beoordeeld wordt. Bij betrouwbaarheid gaat het om devraag hoe er beoordeeld wordt. Een betrouwbaar oordeel is een noodzakelijke voorwaarde om eenvalide oordeel te krijgen. Informatie die tijdens de praktijkperiode verkregen wordt, moet zo ’waar’mogelijk zijn en mag niet door toeval tot stand gekomen zijn. Het is niet gemakkelijk om een hogebetrouwbaarheid van het oordeel te realiseren omdat elke beroepspraktijkvorming uniek is en quacomplexiteit kan verschillen en omdat beoordelen altijd door mensen gebeurt. Een objectievebeoordeling draagt bij tot een hogere betrouwbaarheid van de beoordeling, maar bij praktijkbeoorde-ling is een volledige objectiviteit niet te realiseren. Wel kunnen er een aantal maatregelen getroffenworden om de subjectiviteit van het beoordelen terug te dringen. Voorbeelden hiervan zijn: hetvooraf specificeren van de doelen (en daarmee ook van de beoordelingsaspecten) en het formulerenvan eenduidige beoordelingscriteria. Beoordelaars weten dan zowel waarop beoordeeld moet worden(beoordelingsaspecten) als ook wat de criteria zijn voor een voldoende/onvoldoende prestatie.Om de betrouwbaarheid van de beoordeling te verhogen kan men voorts gebruikmaken vanverschillende beoordelingsinstrumenten die door de verschillende betrokkenen worden gehanteerd.Ook is het van belang de prestaties van de leerling in verschillende werksituaties en op verschillendemomenten van de praktijkperiode te beoordelen. De kans op een ’toevallige’ niet representatievemeting vermindert hierdoor.

Om een verantwoorde praktijkbeoordeling te realiseren zijn dus de volgende maatregelen te treffen:– gebruikmaken van meerdere beoordelaars: de begeleider, de praktijkdocent en de leerling zelf. Dit

vermindert de kans op meetfouten;– gebruikmaken van meerdere beoordelingsinstrumenten: praktijkverslag, observatielijst, instrumenten

voor zelfevaluatie. Dit doet recht aan de complexiteit van de praktijkdoelen;– op verschillende momenten tijdens de praktijkperiode beoordelen: minimaal tussentijds en aan het

eind. Dit verkleint de kans op ’toevalsfouten’;– een duidelijke toelichting geven op de beoordeling: inhoudelijke uitspraken over het functioneren

van de leerling zijn meer waard dan alleen het toekennen van een cijfer of een waardering. Deleerling krijgt hierdoor meer inzicht in eigen functioneren.

7.10.4 Het praktijkverslag

Een veel gebruikt beoordelingsinstrument is het praktijkverslag. Er zijn verschillende vormen voor zo’nverslag mogelijk: een scriptie rond een praktijkgericht thema, een dag- of weekverslag (zgn.logboekverslag) of de verwerking van praktijkopdrachten.De informatie die door middel van een praktijkverslag verkregen wordt, is moeilijk op zijn waarde teschatten. Vaak is onduidelijk wat men nu moet beoordelen (vormgeving?, inhoud?, beide?).Het is daarbij belangrijk eerst de functie van het praktijkverslag te verduidelijken.Het praktijkverslag kent in feite twee functies:1 informatie bieden over de mate waarin de leerling de theorie kan toepassen in de praktijk. Om dit

te toetsen wordt bij voorkeur gebruik gemaakt van concrete praktijkopdrachten of van de scriptie-opdracht;

2 informatie bieden over het vermogen van de leerling om praktijkervaringen te systematiseren en teverwerken. Het bijhouden van een logboek is hiervoor een geschikt hulpmiddel. De leerlingbeschrijft in een logboek zijn vorderingen en leerervaringen hetgeen een beeld geeft van de diverseaspecten van de beroepshouding, zoals reflectie over en inschatting van het eigen functioneren.

Wellicht ter verduidelijking voorts nog enkele opmerkingen:

147

Page 152: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

Het komt voor dat de beoordelaar met behulp van het praktijkverslag de praktische vaardigheden vande leerling beoordeelt. Dit is niet juist: het kunnen beschrijven van praktische toepassingen isvanzelfsprekend niet hetzelfde als het kunnen uitvoeren van praktijkhandelingen.Verder is het van belang te weten dat het praktijkverslag ook bij tussentijdse beoordelingen(diagnostische functie) functioneel is omdat het een goed aanknopingspunt vormt voor feedback enbijsturing. Als de beoordelaars het verslag als selectief instrument willen gebruiken, zullen er in hetalgemeen hogere eisen aan het gebruik van het instrument gesteld moeten worden, zoals richtlijnen voorinhoud en structuur. Pas dan beschikken de leerling en de beoordelaars over min of meer objectievecriteria voor de beoordeling van het verslag.Ten slotte: Als het praktijkverslag als enig beoordelingsinstrument gebruikt wordt, doet het onrecht aande diversiteit van de praktijkdoelen. Het praktijkverslag is een bruikbaar instrument naast de anderebeoordelingsinstrumenten.

7.10.5 De observatielijst praktisch handelen

Verrichtingen van de leerling kunnen geobserveerd worden. Daarbij kan een voorgestructureerdeobservatielijst, zoals te zien is in tabel 47, van groot nut zijn. Het voordeel van een dergelijke lijst is datde arbeidsorganisatie van tevoren weet op welke aspecten hij moet letten, terwijl de leerling weet waarophij beoordeeld wordt. De observatielijst praktisch handelen bevat een aantal hoofdtaken, die uitgesplitstzijn naar deeltaken. Deze deeltaken moeten observeerbare werkzaamheden van de leerling zijn. Aan dehand van een scoreschaal (cijfer, gekoppeld aan een waardering) moet elke deeltaak worden beoordeeld.Voor een goed gebruik van de lijst is het noodzakelijk dat de praktijkbegeleider vooraf de te beoordelentaken kent en (al dan niet in de vorm van een schriftelijke instructie) op de hoogte is van een aantalzaken, zoals:– De lijst is bedoeld om informatie te krijgen over het functioneren van de leerling. Daarom is het

belangrijk dat het oordeel (cijfer of waardering) steeds wordt toegelicht. Zeker bij iedere taak diede leerling volgens de begeleider nog onvoldoende beheerst moet worden aangegeven waaruit datblijkt. Op die manier wordt een beoordeling optimaal bespreekbaar met de andere betrokkenen.

– De lijst is geen beoordelingslijst maar een meetlijst: de praktijkbegeleider geeft aan welke taken deleerling wel beheerst in vergelijking met een beginnend beroepsbeoefenaar en welke niet; depraktijkdocent beslist welke waarde er wordt toegekend aan het eventuele verschil.

– Opzettelijk is geen norm aangegeven wat voldoende of onvoldoende is. De praktijkbegeleider is zelfdeskundig op het vakgebied waarop hij de leerling beoordeelt. Hij gebruikt zijn eigen taakopvattingen de normen van het bedrijf als maatstaf voor het beoordelen.

Dezelfde observatielijst kan ook door de leerling zelf worden ingevuld, waardoor hij zichzelf in feitebeoordeelt. Het invullen van de observatielijst gebeurt bij voorkeur minimaal eenmaal tussentijds eneenmaal aan het eind van de praktijkperiode. De ingevulde lijst van de praktijkbegeleider en die van deleerling worden tijdens de verschillende gesprekken met elkaar vergeleken en besproken. Dit komt nietalleen het leerproces ten goede omdat de leerling beter zicht krijgt op eigen sterke en zwakke punten,maar biedt tevens de mogelijkheid de vooruitgang van de leerling gedurende de praktijkperiode tebepalen.

In sommige opleidingen gebruikt men een lijst die qua opzet vergelijkbaar is, maar waarin allepraktijkperiodes gedurende de opleiding aangegeven staan. Men heeft daardoor een overzicht van degeoefende verpleegkundige vaardigheden per praktijkplaats. Reeds geoefende vaardigheden behoevenwellicht weinig of geen begeleiding meer in de volgende praktijkperiode. Voor de vaardigheden die nogniet tijdens de praktijkperiodes geoefend zijn, maakt men dan vaak gebruik van een meer gedetailleerdeobservatielijst waarin per handeling de diverse beoordelingsaspecten voor, tijdens en aan het eind vande handeling gespecificeerd zijn (vergelijkbaar met het beoordelingsinstrument praktijktoetsing, zoalsbeschreven in paragraaf 7.9 van dit handboek).

148

Page 153: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

tabel 47 - Observatielijst praktisch handelen

Observatielijst Praktisch Handelen

Stagebieder: _______________ Adres: ______________Stagedocent: _______________Stagiair: _______________

Datum: ___ - ___ - ___

Betekenis van de scores/beheersing van dit onderdeel:1 onvoldoende2 voldoende3 ruim voldoende4 goed

Hoofdtaak 1:ondersteuning bij lichamelijke verzorging

Deeltaken:1: aan- en uitkleden van een patiënt met bewegingsbeperking . . . . .2: aan- en uitkleden van een platliggende patiënt . . . . . . . . . . . . . . .3: wassen van een patiënt op bed . . . . . . . . . . . . . . . . . . . . . . . . . . .4: hulp bij douchen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5: mond- en gebitsverzorging, gebitsprothese . . . . . . . . . . . . . . . . .6: haren wassen bij een bedlegerige patiënt . . . . . . . . . . . . . . . . . . .7: baard scheren met scheermes . . . . . . . . . . . . . . . . . . . . . . . . . . . .8: baard scheren met elektrisch apparaat . . . . . . . . . . . . . . . . . . . . .9: verzorging van nagels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

etc.

111111111

222222222

333333333

444444444

nvtnvtnvtnvtnvtnvtnvtnvtnvt

Motivatie/opmerkingen:

Hoofdtaak 2:lichaamshouding

Deeltaken:1: bed afhalen/opmaken zonder patiënt . . . . . . . . . . . . . . . . . . . . . . .2: bed afhalen/opmaken met patiënt, die mag draaien . . . . . . . . . . .3: gebruikmaken van hulpmiddelen in bed (dekenboog, antidecubi-

tusmatras etc.) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4: plaatsen van de patiënt in voorgeschreven posities (rugligging,

zijligging, Trendelenburg etc.) . . . . . . . . . . . . . . . . . . . . . . . . . . . .5: decubitusmaatregelen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

etc.

11

1

11

22

2

22

33

3

33

44

4

44

nvtnvt

nvt

nvtnvt

Motivatie/opmerkingen:

149

Page 154: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

7.10.6 De functie-eisenlijst beroepsgeschiktheid

Een heel andere invalshoek voor het beoordelen van een leerling in de praktijk vormen de functie-eisen,die – uitgaande van de classificatie van het Directoraat Generaal voor de Arbeidsvoorziening –gespecificeerd zijn voor een bepaald beroep.Deze functie-eisenlijst geeft een overzicht van eigenschappen die iemand moet hebben om het beroepgoed te kunnen uitoefenen. Deze eigenschappen, die erg abstract zijn, worden aan de hand van enkelegedragsvoorbeelden toegelicht om de eigenschappen te concretiseren.Voorbeelden van functie-eisen zijn: organisatievermogen, vermogen tot samenwerking, zorgvuldigheid,contactuele eigenschappen en dergelijke.In de observatielijst praktisch handelen ging het om concrete taken en vaardigheden; in de functie-eisenlijst gaat het om eigenschappen.Ook deze lijst kan zowel tussentijds als aan het eind van de praktijkperiode zinvol gebruikt worden doorzowel praktijkbegeleider als leerling. Het invullen van deze lijsten is voor de leerling een belangrijkinstrument in de zelfevaluatie en het bespreken van de ingevulde lijsten levert zinvolle informatie opvoor bijsturen van het leerproces.Een voorbeeld van een deel van zo’n functie-eisenlijst is opgenomen in tabel 48.

7.10.7 Het tussentijdse gesprek, het afsluitende gesprek en de eindbeoordeling

Uit het voorafgaande blijkt dat het maken van een tussentijdse beoordeling een nuttige bijdrage kanleveren aan het verloop van de praktijkperiode: de verzamelde informatie wordt daarbij aangewend voorbegeleiding van de leerling. Aan het einde van de praktijkperiode dient de informatie vooral voor hetop een verantwoorde wijze kunnen beslissen of de resultaten van de leerling voldoende zijn of niet.Het gesprek dat er tussentijds met de leerling gevoerd wordt verschilt qua opzet en procedure niet ofnauwelijks van het afsluitende gesprek. Het doel van het gesprek en de consequenties voor de leerlingzijn uiteraard wel verschillend.

De gesprekken (tussentijds- en afsluitend)Bij het gesprek zijn de drie betrokkenen (leerling, praktijkbegeleider en praktijkdocent) aanwezig: iederlicht zo nodig de verstrekte informatie toe en geeft antwoord op vragen van de andere aanwezigen.Het gesprek heeft nadrukkelijk niet de vorm van een eenrichtingsverkeer, waarin de praktijkdocent zijnoordeel uitspreekt en de leerling luistert: de leerling heeft de mogelijkheid zijn eigen standpunt toe telichten en zijn visie te geven op het oordeel van de gesprekspartners.Naast het aspect van feedback en beoordeling biedt het gesprek ook de mogelijkheid tot advisering enmotivering naar de leerling: de gesprekspartners spreken zich gemotiveerd uit over wat volgens henbelangrijke punten zijn om in de komende periode aan te werken. Dit geldt zowel voor het tussentijdseals voor het afsluitende gesprek. Het afsluitende gesprek kan bovendien nog een functie hebben bij hetevalueren van de kwaliteit van de praktijkperiode en de rol van de betrokkenen daarin. De praktijkbege-leider kan bijvoorbeeld zinvolle kritiek uiten op het functioneren van de school of de praktijkdocent; depraktijkdocent op de faciliteiten van de arbeidsorganisatie en dergelijke.

In het algemeen geldt dat het voor een goed verloop van het gesprek van belang is dat de betrokkenenhet gesprek kunnen voeren in een rustige ruimte en niet gehinderd worden door tijdsdruk. Ook moetenbetrokkenen vooraf op de hoogte zijn van doel en inhoud van het gesprek alsmede van de wijze waarophet gesprek gevoerd wordt. Om dit te realiseren is het wenselijk dat de praktijkdocent vooraf eengespreksagenda opstelt met gespreksonderwerpen die voor de beoordeelde en de beoordelaars herkenbaarzijn. Ook onderwerpen die een van de betrokkenen graag tijdens dit gesprek besproken wil zien, kunnenop deze agenda opgenomen worden.Gespreksonderwerpen, ontleend aan de ingevulde observatielijsten, kunnen zijn:

150

Page 155: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

– de leerling functioneert op bepaalde onderdelen niet goed;

tabel 48 - Functie-eisenlijst beroepsgeschiktheid

Functie-eisenlijst Beroepsgeschiktheid

Stagebieder: _______________ Adres: ______________Stagedocent: _______________Stagiair: _______________

Datum: ___ - ___ - ___

Betekenis van de scores/beheersing van dit onderdeel:1 onvoldoende2 voldoende3 ruim voldoende4 goed

1 Organisatievermogen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Voorbeeldgedrag:- de leerling kan oplossingen aandragen voor knelpunten in

werksituaties- de leerling stelt in omgang met patiënten/collega’s eigen

grenzen en die van de instelling opdat de planning goed be-waakt wordt

- etc.

1 2 3 4 nvt

Motivatie/opmerkingen:

2 Contactuele eigenschappen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Voorbeeldgedrag:- de leerling kan in het professionele contact op de juiste

manier luisteren- de leerling kan eigen bedoelingen en handelwijze naar

patiënten/collega’s motiveren- etc.

1 2 3 4 nvt

Motivatie/opmerkingen:

– het beeld dat de praktijkbegeleider van de leerling geeft, verschilt van wat de leerling over zichzelfzegt of van de indruk die de docent van de leerling heeft;

– de ingevulde observatielijst van de tussentijdse beoordeling van de praktijkbegeleider verschilt vandie van de eindbeoordeling.

Tijdens het gesprek treedt de praktijkdocent als gespreksleider op en zorgt daarbij dat er ruimte is voorieders inbreng. Het is aan te bevelen tijdens dit gesprek een aantal aandachtspunten als leidraad tenemen, zoals:– geef opbouwende kritiek;– bied ruimte aan de leerling om zijn zegje te doen;– luister goed naar elkaar;

151

Page 156: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

– maak heldere, specifieke en concrete opmerkingen;– besef dat slechte resultaten van de stagiair te maken kunnen hebben met uw eigen tekortkomingen

als beoordelaar.

De eindbeoordelingNa afloop van het gesprek zet de praktijkdocent een aantal conclusies en aanbevelingen op papier. Deconclusies zijn inhoudelijke uitspraken over het functioneren van de leerling; de adviezen zijn voorzichtiggeformuleerde visies op de verdere arbeids- en onderwijsloopbaan van de leerling. Daarbij kunnenverschillende aspecten onderscheiden worden: het resultaat van het werk van de leerling, de manierwaarop deze zijn werk doet, de groei die hij tijdens de praktijk heeft doorgemaakt, de werkomgevingwaarin de leerling wel of niet goed tot zijn recht komt etcetera.Deze conclusies en aanbevelingen zijn niet alleen gebaseerd op de resultaten van de eerder genoemdebeoordelingsinstrumenten (praktijkverslag, observatielijst praktisch handelen en functie-eisenlijstberoepsgeschiktheid), maar ook op pragmatische zaken als: heeft de leerling steeds zijn opdrachten optijd ingeleverd, heeft de leerling alle praktijkopdrachten uitgevoerd.De praktijkdocent zet de conclusies en aanbevelingen om in een eindbeoordeling.Om te komen tot een eindbeoordeling zijn verschillende procedures en beslisregels in omloop. In depraktijk blijkt het echter moeilijk om hiervoor één algemene regel te geven.Richtlijnen voor deze eindbeoordeling kunnen zijn:– de praktijkbegeleider beoordeelt de leerling op diens functioneren in de praktijk. De stem van de

praktijkbegeleider is in dit geval doorslaggevend;– De praktijkdocent beoordeelt de integratie van de theorie en de praktijk en bepaalt of de leerling

voldaan heeft aan de formeel gestelde eisen (zoals op tijd inleveren van materialen)– Ingeval van een onvoldoende eindbeoordeling van de leerling heeft de praktijkdocent de

eindverantwoordelijkheid en bepaalt of de onvoldoende terecht of onterecht isHieraan kunnen andere beslisregels die de school vooraf daartoe opgesteld heeft, toegevoegd worden.

152

Page 157: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

7.11 Scriptie

7.11.1 Inleiding

Ook in het beroepsonderwijs wordt schriftelijke uitdrukkingsvaardigheid belangrijk gevonden. In hetgezondheidszorgonderwijs wordt deze vaardigheid getoetst aan de hand van een door de leerling teschrijven scriptie.Een scriptie is een over het algemeen getypt werkstuk van 30 tot 40 bladzijden, waarin verslag wordtgedaan van een onderzoek of een literatuurstudie naar een onderwerp dat relevant is voor onderwijs ofberoep. Eventuele bijlagen worden bij de hiervoor genoemde omvang niet meegerekend.Het schrijven van een scriptie is een omvangrijke opdracht. Leerlingen moeten daarin begeleid wordenen van de nodige aanwijzingen worden voorzien. Er bestaan handleidingen voor het schrijven van eenscriptie, waarin stap voor stap wordt beschreven hoe je van een globaal idee tot een concreet werkstukkunt komen. Tevens staan daarin vaak summier enkele criteria waaraan het product moet voldoen. Datgeeft de leerling houvast bij het schrijven. Voor het beoordelen van een scriptie is het echternoodzakelijk dat alle relevante criteria expliciet gemaakt worden.

7.11.2 Globale en analytische beoordelingen

Al eerder zijn de voors en tegens van een gedetailleerder beoordeling aangeduid (zie blz. 81). Ook hiermoet een afweging gemaakt worden. Wanneer een beoordelaar tot zijn beoordeling komt zonder daarbijexpliciete criteria te hanteren (globale beoordeling) bestaat uiteraard het gevaar dat deze indruk tot standkomt door bepaalde opvallende kenmerken: de inhoud van een nette scriptie wordt relatief positievergewaardeerd dan een vergelijkbare inhoud van een slordig werkstuk (halo-effect). Bovendien is het bijdeze aanpak moeilijk aan de leerling uit te leggen wat er goed of slecht was.Tegenover de globale methode staat de analytische aanpak. Hierbij wordt gebruikgemaakt van eenbeoordelingsschema of een lijst met aandachtspunten. Zo mogelijk worden deze punten voorzien vancriteria. Het grote voordeel is dat de beoordelaar elke scriptie op dezelfde punten moet beoordelen, geenpunten kan vergeten en zijn oordeel niet te veel laat beïnvloeden door een bepaald positief of negatiefpunt. Hiermee wordt zowel de betrouwbaarheid als de validiteit verbeterd. Ook de leerlingen, die inzagein de lijst moeten hebben, weten vooraf en achteraf beter waar ze aan toe zijn.De beoordelingslijst moet uiteraard niet te lang en te gedetailleerd worden. Zo’n lijst wordt al snelonhanteerbaar en de stap van suboordelen naar een eindoordeel wordt ondoorzichtig. Het optimalecompromis is een analytische lijst die in feite de globale beoordeling structureert zonder het zicht op hettotale product te belemmeren.In tabel 49 wordt een dergelijke beoordelingslijst voorgesteld. Hieronder wordt nader ingegaan op deopbouw van deze lijst en wijze waarop deze gehanteerd moet worden.

7.11.3 De scriptie-beoordelingslijst

Een scriptie kan op verschillende niveaus bekeken worden. Deze niveaus zijn in de ontwikkeldebeoordelingslijst terug te vinden. De volgende drie niveaus worden onderscheiden:1 structuur en vormgeving;2 leesbaarheid en informatieoverdracht;3 logica en relevantie;Uit de lijst wordt duidelijk waaraan bij elk niveau gedacht moet worden. Er wordt op elk niveau opandere zaken gelet. Op het eerste niveau spelen vooral de vormgeving en de uiterlijke structuur van descriptie een rol. Op het tweede niveau gaat het meer om de wijze waarop de informatie via degehanteerde taal en tabellen wordt overgebracht. Het derde niveau is geheel gericht op de inhoud vande scriptie.

153

Page 158: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 7

De drie beoordelingsniveaus zouden schijnbaar eenvoudig geplaatst kunnen worden op een continuümdat loopt van vorm naar inhoud. Het blijkt echter dat de aspecten die binnen de niveaus onderscheidenkunnen worden, breder beoordeeld moeten worden dan alleen op vorm of alleen op inhoud. Dit is in delijst opgelost door de hokjes waarin de beoordelingen geplaatst moeten worden, in twee kolommen teverdelen. Hiermee wordt duidelijk dat aan structuur ook een inhoudsdimensie kan worden onderscheiden.

Productbeoordeling tegenover procesbeoordelingTot dusverre wijken de aanbevelingen voor het beoordelen van scripties weinig af van de aanbevelingenvoor andere complexe beoordelingen, zoals die in de overige paragrafen van dit hoofdstuk wordengegeven. De uiteindelijke beoordelingslijst is gebaseerd op de dezelfde principes.Er is echter één groot verschil: hetgeen beoordeeld moet worden, is geen proces (zoals het voeren vaneen opnamegesprek) maar een product! Dit biedt de mogelijkheid om op een eenvoudige manier debetrouwbaarheid van de beoordeling te verhogen, namelijk door het inschakelen van een tweedebeoordelaar. Onderzoek wijst uit dat dit een aanzienlijke verbetering van de betrouwbaarheid geeft.Beoordelaarseffecten worden op die manier immers uitgemiddeld. Helaas blijkt een dubbele beoordelingin veel van de eerder beschreven beoordelingssituaties om praktische of ethische redenen niet mogelijk:een tweede beoordelaar is zelden beschikbaar; video-opnamen zijn niet eenvoudig te maken of om redenvan privacy ongewenst.Dan moet gekozen worden voor de op een na beste oplossing, het herhaald beoordelen door dezelfdeof een andere beoordelaar. Geen twee situaties zijn echter vergelijkbaar en dus blijft de rol van toevalligeeffecten groot.Een scriptie verandert na afronding echter niet meer en kan dus op elk moment aan een collega wordenvoorgelegd. Het verdient aanbeveling om van deze mogelijkheid gebruik te maken.Wanneer de beoordelingen van een tweetal beoordelaars om niet nader te bepalen redenen sterk vanelkaar verschillen, moet niet zonder meer gemiddeld worden: er zou wel eens een typische voor- ofafkeur van een van beide docenten in het spel kunnen zijn. Het is in dat geval beter om een derdebeoordelaar in te schakelen. De twee meest overeenstemmende oordelen kunnen vervolgens gemiddeldworden.

De omvang van de scriptieVaak wordt aan de leerlingen alleen meegedeeld dat hun scriptie een bepaalde minimale omvang moethebben. De reden hiervoor ligt voor de hand: het voorkomt dat leerlingen zich er gemakkelijk vanafmaken. Het verdient echter ook aanbeveling om aan de omvang van de scriptie ook een bovengrenste stellen. Het maakt de ingeleverde producten onderling beter vergelijkbaar en het dwingt de leerlingenom zaken kort en bondig te formuleren, zich vooral op hoofdzaken te richten en informatie te filteren.

Hanteren van de beoordelingslijstVoor elke scriptie moet de volledige lijst worden ingevuld, zo mogelijk door twee onafhankelijkebeoordelaars. Bij elke aspect wordt door middel van een plus, een min of een plu-minus aangegeven ofaan het desbetreffende aspect is voldaan. Vervolgens kan per niveau (’structuur en vormgeving’,’leesbaarheid en informatieoverdracht’ en tenslotte ’logica en relevantie’) een samenvattend oordeelworden gegeven. Ditzelfde kan gedaan worden voor de kolommen ’vorm’ en ’inhoud’. Vervolgens moeteen eindoordeel worden geformuleerd .Het betrekken van het oordeel van een eventuele tweede of derde beoordelaar kan in principe tijdens elkvan deze stappen plaatsvinden. De meest efficiënte strategie hierbij is om eerst de eindoordelen naastelkaar te leggen. Wanneer deze van elkaar afwijken, kan teruggegaan worden naar de beide lijsten omte zien op welk van de drie niveaus de grootste onenigheid bestaat. Daarover kunnen vervolgens demeningen uitgewisseld worden om zo tot een afgewogen oordeel te komen. Wanneer de stemmen staken,kan, zoals hierboven al werd aanbevolen, een derde beoordelaar worden ingeschakeld.

154

Page 159: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: specifieke richtlijnen per toetsvorm

tabel 49 - Scriptie-beoordelingslijst

vorm inhoud

STRUCTUUR EN VORMGEVING

De omslag is netjes vormgegeven

De titelpagina vermeldt titel, auteur en datum

De titel slaat op de inhoud

Er is een inhoudsopgave; deze is duidelijk gecodeerd

Er is een woord vooraf; hierin wordt de doelgroep genoemd

De hoofdstukken en paragrafen zijn evenwichtig van lengte

De indeling in hoofdstukken en paragrafen past bij het betoog

De titels van de hoofdstukken en paragrafen dekken de inhoud

De paragrafen zijn ingedeeld in alinea’s

Er is een samenvatting; deze geeft een overzicht van de grote lijn

Er is een literatuurlijst

De literatuurlijst is correct vormgegeven

De gebruikte literatuur is relevant, verantwoord en actueel

De eventuele bijlagen zijn duidelijke genummerd

De bijlagen verschaffen aanvullende informatie

De omvang van de scriptie ligt binnen de vooraf bepaalde grenzen

LEESBAARHEID EN INFORMATIE-OVERDRACHT

Het taalgebruik is afwisselend, bondig en correct

Het taalgebruik is afgestemd op de doelgroep en bevat alleen functionele vaktaal

Er is door verwijzingen samenhang tussen de verschillende passages

Er worden concretiseringen gegeven in de vorm van voorbeelden, schema’s e.d.

Er is gebruikgemaakt van figuren, tabellen e.d. en deze zijn genummerd

De titels bij de figuren en de tabellen zijn passend

In de tekst zijn ordeningen aangebracht (zoals ten eerste, ten tweede e.d.)

De bladspiegel is prettig; er zijn accentueringen (streepjes, cursivering e.d.)

De accentueringen zijn gericht op de hoofdzaken

Er is een begrippenlijst

Begrippen worden eenduidig gehanteerd

LOGICA EN RELEVANTIE

Er is een heldere en actuele probleemstelling (aanleiding, doelstelling e.d.)

Er is een heldere probleemanalyse (uitgangspunten, hypothesen, methode)

Het betoog is ingepast in een bestaande theorie

Het betoog is coherent (vrij van gedachtesprongen)

Het betoog is consistent (vrij van tegenstrijdigheden)

De argumenten zijn steekhoudend en verantwoord

Er wordt onderscheid gemaakt tussen (experimentele) feiten en meningen

De conclusies sluiten aan bij de probleemstelling en vloeien voort uit het betoog

De gepresenteerde informatie is juist, relevant en correct geïnterpreteerd

De gebruikte bronnen zijn representatief en actueel

155

Page 160: Verantwoord Meten In Het Gezondheidszorgonderwijs

8 Uitvoeringsniveau: afname, correctie, resultaatbeoordeling

Wanneer een toets volgens de aanwijzingen in de voorafgaande paragrafen geconstrueerd is, kan defeitelijke meting plaatsvinden: leerlingen moeten onder zoveel mogelijk gestandaardiseerde afnamecondi-ties een prestatie leveren en daaraan wordt vervolgens een score toegekend.

8.1 Richtlijnen voor de afname(condities)

Tijdens de afname van een toets kunnen de omstandigheden onbedoelde invloed uitoefenen op deprestatie van de leerlingen (zie par. 3.2.2). Voor de afname van toetsen moeten daarom richtlijnenopgesteld worden, die de invloed van dergelijke effecten minimaliseren. Deze richtlijnen voorstandaardisatie van de afname kunnen betrekking hebben op:– de lokale omstandigheden, waaronder leerlingen de toets moeten maken. Dergelijke omstandigheden

moeten voor alle leerlingen zoveel mogelijk dezelfde zijn. Vooral bij praktische toetsen, waarbijleerlingen niet allemaal tegelijk getoetst worden, is het noodzakelijk de omstandigheden tebeschrijven;

– het gebruik van hulpmiddelen. Hierbij moet gedacht worden aan zaken als een rekenmachine, eenrepertorium, een standaardverpleegplan etc. Leerlingen moeten hiervan tijdig op de hoogte wordengesteld, zodat ze daarmee bij het leren rekening kunnen houden;

– het vragen van hulp. Er moet duidelijk beschreven zijn op welke vragen van de leerlingen tijdensde toetsafname wél en op welke vragen geen antwoord wordt gegeven door de docent. Bij eengroepsgewijze toetsafname profiteert in principe elke leerling evenveel van een hardop gestelde vraagen het daarop gegeven antwoord, maar bij individuele afname moet elke beoordelaar terug kunnenvallen op vaste richtlijnen;

– de tijd die leerlingen krijgen om de toets te maken. Bij de meeste toetsen moet ruim tijd wordengegeven. Te weinig tijd is van invloed op de prestatie. Ook de betrouwbaarheid van de toets kaneronder lijden, wanneer leerlingen niet alle opdrachten kunnen maken: je hebt dan immers mindermeetgegevens. Bij sommige praktische toetsen speelt snelheid wel een rol. In dat geval moet vooriedereen duidelijk zijn hoeveel tijd een leerling krijgt om de opdracht uit te voeren.

8.2 Richtlijnen voor de gegevensverwerking en correctie

Het nakijken van de gemaakte toets en de scoring daarvan levert bij gesloten vragen meestal geenproblemen op. Als de omcirkelde lettercode van het gekozen antwoordalternatief overeenkomt met desleutel, kan één scorepunt worden toegekend. In alle andere gevallen (althans als het systeem vangedwongen raden gebruikt wordt – zie par. 7.1.5) wordt score 0 toegekend.Bij open vragen moet door het treffen van speciale maatregelen voorkomen worden dat de objectiviteitwordt aangetast als gevolg van zogeheten ’beoordelaarseffecten’. Deze term verwijst naar een aantal aande beoordelaar verbonden bronnen van ’bias’ (systematische afwijking):– Het halo-effectkan optreden als gevolg van de kennis die de beoordelaar heeft van een bepaalde,

belangrijk geachte eigenschap van de beoordeelde. Zo kan de hoge intelligentie van de beoordeelde

156

Page 161: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: afname, correctie, resultaatbeoordeling

een gunstige uitwerking op zijn beoordeling hebben als de beoordelaar van mening is dat intelligentieeen voorwaarde is voor het goed kunnen maken van de vraag of de complete toets.

– Er is sprake van eensequentie-effectals de beoordeling van een leerling wordt beïnvloed door debeoordelingen van andere leerlingen. Na een aantal als slecht beoordeelde toetsen is men snellergeneigd om een iets beter gemaakte toets extra positief te beoordelen en omgekeerd.

– Met beoordelingstendentieswordt gedoeld op de persoonlijke neigingen van beoordelaars totspecifieke beoordelingsverdelingen. Sommige beoordelaars mijden extreme beoordelingen (neigingtot het gemiddelde). Anderen beoordelen consequent te gunstig of te ongunstig.

Voor de genoemde effecten zijn in de loop der jaren diverse remedies bedacht en beproefd. Wanneerer sprake is van een schriftelijke toets, zijn de volgende suggesties bruikbaar:– Het halo-effectkan vermeden worden door beoordelaars in te schakelen die onbekend zijn met de

leerlingen of door, indien mogelijk, anonieme beoordeling van de toetsprestaties. Dat laatste kanalleen als er sprake is van tastbare producten of op een of andere manier vastgelegde procesregistra-ties (videotape, audiotape, logfiles).

– Het sequentie-effectkan onder controle gehouden worden door, als ten minste met tweeonafhankelijke beoordelaars gewerkt wordt, processen of producten niet in dezelfde volgorde te latenbeoordelen door de beoordelaars. Wanneer schriftelijke toetsen door één beoordelaar wordengecorrigeerd, verdient het aanbeveling het werk niet per leerling maar per vraag te beoordelen endaarbij de volgorde steeds te veranderen.

– Beoordelingstendentieskunnen aangepakt worden door beoordelaars te confronteren met hunspecifieke beoordelingsbias. Dit vereist natuurlijk wel dat men een keer de betrokken beoordelaarsallemaal dezelfde toets laat beoordelen. Op grond van de uitkomsten van zo’n onderzoek kunnenspecifieke aanwijzingen gegeven worden waarmee de individuele beoordelaars geholpen worden ommeer in overeenstemming met alle andere beoordelaars te beoordelen.

Bij het beoordelen van praktische vaardigheden zal men bij voorkeur gebruikmaken van meerderebeoordelaars die onafhankelijk van elkaar de leerlingen beoordelen en vervolgens in gezamenlijk overlegtot een beoordelingsuitspraak komen (inhoudelijke methode).Ook bij schriftelijke toetsen kan het nuttig zijn een correctieprocedure te hanteren waarbij het tebeoordelen toetsmateriaal van de leerlingen verdeeld wordt over meerdere beoordelaars: de enebeoordelaar beoordeelt bijvoorbeeld vraag 1 en 3 van alle leerlingen; de tweede beoordelaar beoordeeltvraag 2 en 4 etcetera. Dit laatste is een tamelijk technische manier om het stempel dat een bepaaldebeoordelaar drukt op de beoordeling te verminderen.Het inschakelen van meerdere beoordelaars is een arbeidsintensieve en daardoor kostbare zaak. Toch zalmen – om aan de kwaliteitseis objectiviteit te voldoen – in ieder geval bij het toetsen van praktischevaardigheden en bij het beoordelen van schriftelijke open vragen minimaal twee beoordelaars moeteninzetten.

8.3 De beoordeling van toetsresultaten

Na de afname en correctie van de toets moet de docent allereerst nagaan wat de kwaliteit (betrouwbaar-heid, validiteit) van zijn toets was. Pas als die vraag bevredigend beantwoord kan worden, beschikt hijover informatie over zijn leerlingen (en indirect ook over zichzelf). Na verloop van tijd leveren de aldusverzamelde gegevens informatie op over het curriculum.

157

Page 162: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 8

8.3.1 Richtlijnen voor de beoordeling van de kwaliteit van toetsen

Toetsen die geconstrueerd worden volgens een systematische procedure zullen over het algemeen vangoede kwaliteit zijn. Maar er kan geen sprake zijn van gegarandeerde kwaliteit. Daarom is hetnoodzakelijk na afloop de kwaliteit te controleren. Dat kan globaal op twee manieren :– aan de hand van commentaar van de leerlingen (incidenteel of systematisch via een ingevuld

evaluatieformulier);– aan de hand van een toets- en itemanalyse.

Commentaar van leerlingenHet verdient aanbeveling om na elke toets door middel van een (standaard) evaluatieformulier de meningvan de leerlingen te inventariseren over de kwaliteit van de toets. Aspecten die aan de orde kunnenkomen, zijn onder andere:– de mate waarin de toets een afspiegeling was van de leerstof;– de moeilijkheid van de vragen in de toets;– de omvang van de toets;– de duidelijkheid van de vragen;– de eenduidigheid van het juiste antwoord (bij gesloten vragen);– de toegemeten tijd;– de leesbaarheid van het drukwerk.Natuurlijk zijn terloopse opmerkingen van leerlingen ook de moeite van het onthouden waard. Als veelleerlingen in de koffiepauze klagen over bijvoorbeeld de onduidelijkheid van een bepaalde vraag, is eralle aanleiding een nader onderzoek hiernaar in te stellen.

Toets- en itemanalyseAlhoewel de laatste jaren de computer in snel tempo een normaal verschijnsel is geworden in hetonderwijs, zullen niet alle docenten staan te trappelen om er gebruik van te maken ten behoeve van hunonderwijs- of evaluatie-activiteiten. Daarom wordt hieronder vooral aandacht besteed aan een toets- enitemanalyse die ’met de hand’ uitvoerbaar is.De belangrijkste vragen waarop een toets- en itemanalyse antwoord moet geven zijn:– Waren de vragen van het juiste niveau?– Konden de vragen onderscheid maken tussen leerlingen die de stof beheersen en leerlingen die de

stof niet beheersen?– Hoe betrouwbaar was de toets?In tabel 50 wordt aan de hand van fictieve data een toets- en itemanalyse uitgevoerd voor een toetsbestaande uit open vragen. Uit deze tabel valt op te maken dat de vier vragen waaruit deze toets bestondniet al te moeilijk waren. Ongeveer 70% van de maximumscore wordt steeds behaald. Of dit acceptabeleuitkomsten zijn, hangt natuurlijk vooral af van de specifieke gebruikssituatie. Over het algemeen moetende vragen wat gemakkelijker zijn als het de bedoeling is vast te stellen of de leerlingen een zekerminimaal beheersingsniveau hebben. Is het daarentegen de bedoeling goed onderscheid te kunnen makenin de beheersingsniveaus van de leerlingen, dan moeten de vragen wat moeilijker zijn.Verder kan uit de tabel worden geconcludeerd dat vraag 1 het beste onderscheid maakt tussen leerlingendie de stof wel en niet beheersen (hoe hoger de variantie des te beter is het discriminerend vermogenvan een vraag).Ten slotte kan met de gegevens uit de tabel een schatting gemaakt worden van de betrouwbaarheid (inde zin van interne consistentie; zie par. 3.2) van deze toets. Coëfficiënt alpha is in dit geval 0.86 hetgeenin de literatuur als ’vrij hoog’ bestempeld wordt, zeker wanneer gelet wordt op de beperkte omvang vande toets.De volgende tabel (tabel 51) laat zien op welke wijze een toets- en itemanalyse met de hand uitgevoerdkan worden als er sprake is van gesloten vragen. Hierin kan afgelezen worden wat de moeilijkheidsgra-

158

Page 163: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: afname, correctie, resultaatbeoordeling

den van de vier in de toets opgenomen vragen waren. Of dit acceptabele waarden zijn, kan zonder nadere

tabel 50 - Handmatige toets- en itemanalyse voor open vragen

leerling vraag 1 vraag 2 vraag 3 vraag 4 score max score % max score

1 6 5 5 7 23 40 57.5

2 10 8 9 10 37 40 92.5

3 7 6 5 5 23 40 57.5

4 10 7 7 8 32 40 80

5 10 8 8 7 33 40 82.5

6 4 3 6 5 18 40 45

7 8 9 6 8 31 40 77.5

8 7 6 8 6 27 40 67.5

9 7 10 9 7 33 40 82.5

10 5 6 6 4 21 40 52.5

totaal 74 68 69 67 278 400 695

max.score 100 100 100 100 400 1000

p-waarde 0.74 0.68 0.69 0.67 0.69 0.69

variantie 4.04 3.76 2.09 2.81 35.56

uit: Dousma en Horsten (1980)

informatie over het aantal alternatieven (de ideale p-waarde voor een ja-/nee-vraag is 0.75, voor eendriekeuzevraag 0.67 en voor een vierkeuzevraag 0.63) en over het doel van de toets (vaststellen van eenminimaal beheersingsniveau of onderscheid maken tussen de leerlingen) hier niet vastgesteld worden.

tabel 51 - Handmatige toets- en itemanalyse voor gesloten vragen

leerling vraag 1 vraag 2 vraag 3 vraag 4 toetsscore

1 1 0 1 0 2

2 0 1 1 0 2

3 1 0 1 1 3

4 1 1 1 1 4

5 0 0 0 0 0

6 0 0 1 1 2

7 1 0 1 0 2

8 0 1 0 0 1

9 0 0 0 1 1

10 1 1 1 1 4

p-waarde 0.50 0.40 0.70 0.50

variantie 0.25 0.24 0.21 0.25

In hoeverre de vragen onderscheid kunnen maken tussen leerlingen die de stof beheersen en leerlingendie de stof niet beheersen, kan op snelle wijze worden onderzocht door het berekenen van discriminatie-index D. Dat gaat als volgt (Dousma & Horsten, 1980):

159

Page 164: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 8

1 Vorm twee groepen leerlingen van ongeveer gelijke grootte, zodanig dat in de ene groep de hoogstetoetsscores voorkomen en in de andere de laagste. De handigste manier om dit te doen is door vande totale groep het hoogste kwart en het laagste kwart af te splitsen.

2 Bepaal van beide groepen het aantal leerlingen dat het betreffende item juist heeft beantwoord.3 Deel deze aantallen door de grootte van de subgroep om er proporties van te maken.4 Bepaal de D-index door de proportie goede antwoorden bij de hoogste groep te verminderen met de

proportie goede antwoorden bij de laagste groep.

In tabel 52 wordt de uitvoering van deze procedure op de gegevens uit tabel 51 schematischweergegeven.

tabel 52 - Berekening van D-indices

vragen vragen

leerling 1 2 3 4 leerling 1 2 3 4

4 1 1 1 1 8 0 1 0 0

10 1 1 1 1 9 0 0 0 1

3 1 0 1 1 5 0 0 0 0

som 3 2 3 3 som 0 1 0 1

proportie 1.0 0.67 1.0 1.0 proportie 0.0 0.33 0.0 0.33

D-index 1.0 0.34 1.0 0.67

Een D-index kan variëren van −1 tot +1. Een D van -1 betekent dat de vraag een volstrekt verkeerdonderscheid maakt tussen goede en zwakke leerlingen (alle goede leerlingen maken de vraag fout en allezwakke leerlingen maken de vraag goed). Een D-index van +1 geeft aan dat de vraag een perfectonderscheid kan maken tussen goede en zwakke leerlingen. Een D-index van 0 betekent dat de vraaggeen onderscheid maakt tussen goede en zwakke leerlingen.

De betrouwbaarheid van de toets kan worden geschat met behulp van de formule die bekendstaat alsKR-21 (zie par. 3.2.1). De variantie van de toetsscores (var) bedraagt 1.66. De gemiddelde toetsscore(gem) bedraagt 2.1. Het aantal vragen is 4 (k). Ingevuld in de formule voor KR-21 levert dit eenbetrouwbaarheidsschatting op van 0.53.

8.3.2 Richtlijnen voor de beoordeling van toetsresultaten

Meten is weten, zo wordt wel gezegd. Dit is maar tot op zekere hoogte waar: zoals dit handboek laatzien, levert meten gegevens op die nog bewerkt moeten worden tot informatie. De meet-gegevens moetengewaardeerd worden, voordat er beslissingen op gebaseerd kunnen worden.Alle betrokkenen bij het onderwijs zullen zo hun eigen informatie genereren. In de volgende paragrafenwordt besproken welke rol deze informatie speelt voor leerlingen, docenten en management.

8.3.3 Normeren

Zoals in paragraaf 2.1 is beschreven, moet aan het resultaat van een meting eerst een waardering wordengegeven, voordat er een beslissing kan worden genomen. Het toekennen van een waardeoordeel, veelalin de vorm van een cijfer, aan een meetresultaat noemt men normeren. Een belangrijk onderdeel van de

160

Page 165: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: afname, correctie, resultaatbeoordeling

normering is het vaststellen van de cesuur: de grens tussen de twee scores waaraan resp. het cijfer 5,5(voldoende) en het cijfer 5,4 (onvoldoende) wordt gegeven.Er kunnen twee manieren worden onderscheiden om te normeren, de relatieve methode en de absolutemethode. Dit is afhankelijk van hetgeen als criterium wordt genomen:1 Wanneer de prestaties van de andere leerlingen als uitgangspunt worden genomen is er sprake van

een relatieve norm. Wanneer een dergelijk criterium gehanteerd wordt spreekt men ook wel van’achteraf’ of ’relatief’ normeren (omdat resultaten pas na toetsing beschikbaar zijn).Dit criterium wordt gewoonlijk gehanteerd als het erom gaat de beste leerlingen te selecteren enspeelt bijvoorbeeld als er minder plaatsen dan gegadigden zijn voor bijvoorbeeld een vervolgcursus.

2 Wanneer daarentegen een van tevoren vastgelegde prestatiestandaard (en dus een cesuur) hetuitgangspunt is voor de waardering, spreekt men van ’vooraf’ of ’absoluut’ normeren.Dit criterium wordt meestal gehanteerd als het erom gaat zekerheid te hebben dat een leerlingvoldoende is toegerust voor een bepaalde vervolgsituatie (beroep of opleiding).

Vaak wordt ook een compromismethode gehanteerd. Omdat van tevoren vaak moeilijk is in te schattenhoe moeilijk een bepaalde toets is, bepaalt men een onder- en een bovengrens waartussen de uiteindelijkecesuur moet komen te liggen. Wanneer de toets moeilijk uitvalt, verschuift men de cesuur naar deondergrens. Omgekeerd trekt men de norm op, wanneer dat op grond van de goede prestaties van deleerlingen mogelijk is.

Wanneer jaarlijks een nieuwe toets wordt ontwikkeld voor dezelfde leerstof, is het de bedoeling dat deeisen die aan de leerlingen worden gesteld door de jaren heen gelijk zijn. De methode van normerenwordt echter beïnvloed door het percentage onvoldoendes. Dit is in principe problematisch. Wanneer hetniveau van de leerlingen van jaar tot jaar zou dalen, zou de norm mee zakken. Er wordt dus wel elk jaargenormeerd, maar er is geen zekerheid dat de norm gehandhaafd blijft.Dit probleem kan opgelost worden door in elke nieuwe toets voor een vast deel oude vragen op tenemen. Op die manier is een schatting te maken van het verschil in moeilijkheidsgraad van het oude enhet nieuwe deel. Dit kan dan als gegeven worden gebruikt bij het bepalen van de cesuur. Deze oudevragen worden wel ankeritems genoemd: ze bieden houvast bij denormhandhaving.Deze methode heeft een nadeel: het niveauverschil tussen de oude en de nieuwe vragen kan wordenbepaald door het feit dat de vragen zelf verschillend van niveau zijn, maar het kan ook liggen aan hetfeit dat met de oude vragen is geoefend. Dit nadeel weegt minder zwaar wanneer men de beschikkingheeft over een opgavenbank, waarin zoveel opgaven zitten dat de complete leerstof gedekt is.Geoefendheid met alle vragen betekent dan automatisch beheersing van alle leerdoelen. Het heleprobleem van normhandhaving is zelfs helemaal opgelost wanneer nieuwe toetsen in hun geheel uit deopgavenbank kunnen worden samengesteld, waarbij op grond van de verzamelde gebruiksgegevens eentoets met een bepaalde gemiddelde moeilijkheidsgraad kan worden samengesteld. Meer informatie overopgavenbanken is te vinden in paragraaf 6.2.

8.3.4 Toetsresultaten en de feedbackfunctie voor de leerling

In paragraaf 5.1.2 werd al gesteld dat er van toetsing een sterke sturing uitgaat naar leerlingen: viatoetsing krijgen zij informatie over de effectiviteit van hun studie-inspanningen en efficiëntie van hunstudiestrategie. Uit onderzoek blijkt dat door de toetsmomenten, de toetsvormen en de moeilijkheidsgraadvan de toetsen op de juiste manier te kiezen, de prestatie van de leerlingen in positief zin beïnvloedkunnen worden:– door de leerstof op te delen in kleine eenheden (modulen) die met een toets worden afgesloten,

worden leerlingen gedwongen om inspanningen gelijkelijk over het studiejaar te spreiden;– door in de onderwijs- en examenregeling op te nemen dat leerlingen pas met de volgende module

mogen beginnen wanneer de daaraan voorafgaande module met succes is afgerond, is men er zekervan dat de basis voor het begrijpen van de nieuwe leerstof aanwezig is;

161

Page 166: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 8

– zekerheid over voldoende beheersing van de leerstof bestaat alleen in voldoende mate door permodule een hoge cesuur (minstens 80%) aan te leggen.

Dit klinkt allemaal erg streng, maar leerlingen blijken deze duidelijkheid toch op prijs te stellen enpassen hun strategie hierop aan. Het slaagpercentage blijkt uiteindelijk aanzienlijk hoger te zijn. In depraktijk levert een dergelijke aanpak echter vaak te veel praktische en organisatorische problemen op,omdat het nog niet mogelijk is modulen op elk willekeurig moment te geven of te volgen. Wanneerleerlingen in de toekomst meer zelfverantwoordelijk worden voor hun leerproces, heeft een dergelijksysteem van mastery learning meer kans van slagen.

Optimale feedback krijgt een leerling overigens pas wanneer een toets een echt diagnostische functievervuld (par. 2.3.4) en ook aan de daarvoor gestelde kwaliteitseisen voldoet (par. 5.1.2). De toets dektdan de volledige leerstof en de toetsresultaten leveren aanwijzingen op voor remediëring. Dat betekentdat er niet alleen een globaal eindoordeel aan de leerling wordt gegeven, maar dat de leerling ook inzichtkan krijgen in de fouten die hij heeft gemaakt. Bij een toets met meerkeuzevragen kan dat wanneer dealternatieven bepaalde veelgemaakte fouten representeren, bij open vragen zal de docent bereid moetenzijn om schriftelijk of mondeling aan te geven waarom bepaalde antwoorden onjuist zijn en eenobservatielijst moet zo gedetailleerd zijn, dat het voor de leerling helder is welke aspecten van zijnhandelen nog verbetering vragen.

8.3.5 Toetsresultaten en de feedbackfunctie voor de onderwijsleersituatie (opleider)

In het begin van het handboek werden vanuit de positie van de docent de volgende vragen geformuleerd,die via verantwoord meten beantwoord zouden kunnen worden:– Hebben de leerlingen de gestelde leerdoelen bereikt?– Zijn er bepaalde leerlingen die remediërend onderwijs nodig hebben?– Voldoen de leerlingen aan de minimumeisen om aan een bepaalde cursus of module deel te nemen?Algemener gesteld: uit de toetsresultaten wordt duidelijk of de onderwijsleersituatie geschikt was voorde leerlingpopulatie. Het komt voor dat de moeilijkheidsgraad van de module verkeerd wordt ingeschaten daardoor slecht aansluit bij het niveau van de leerlingen. Dit kan twee kanten opwerken, die beidefunest zijn voor de motivatie en prestatie van de leerlingen:– als het niveau te hoog is, zullen de leerlingen afhaken en zich niet meer inspannen van de toets;– als het niveau te laag is, zullen de leerlingen zich niet uitgedaagd voelen en ook daardoor onder de

maat presteren (al zullen de toetsresultaten dat niet direct laten zien)Beide situaties zijn onwenselijk en daarom is het zaak om niet alleen naar de toetsresultaten te kijken,maar ook de leerlingen te vragen naar de studeerbaarheid van de module. Op die manier kunnen modulenzowel qua inhoud als qua moeilijkheidsgraad beter op elkaar aansluiten.

8.3.6 Toetsresultaten ten behoeve van selectiedoeleinden

Zuiver diagnostische toetsen komen in het onderwijs nauwelijks voor; de meeste beoordelingen wordenvertaald in een cijfer of een verbale waardering, waaraan consequenties voor de leerling zijn verbonden.Sommige beoordelingen tellen minder zwaar dan andere en die beoordelingen hebben dan wellicht vooraleen terugkoppelingsfunctie naar leerling en docent, maar er vindt een vermenging van toetsfunctiesplaats: mede op basis van diagnostische toetsen worden selectiebeslissingen genomen.Dit is wel verklaarbaar, omdat de calculerende leerling zich alleen inspant voor een toets wanneerdaaraan voor hem consequenties vastzitten. De keerzijde is echter dat de dubbelrol, die de docent uithoofde van zijn functie per definitie vervult, namelijk die van enerzijds begeleider en anderzijdsbeoordelaar, daardoor wel extra ondoorzichtig wordt. De uiterste consequentie hiervan is, dat leerlingenook tijdens de instructie geen vragen durven stellen, uit angst dat ze een domme indruk maken.

162

Page 167: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: afname, correctie, resultaatbeoordeling

Tussentijdse beoordelingen, die (al dan niet terecht) meetellen voor een eindoordeel, kunnen daarin opverschillende manieren betrokken worden, namelijk via de disjunctieve methode of via de conjunctievemethode (vergelijk ook de cesuurbepaling bij de constructie van een vaardigheidstoets, blz. 84):– Bij de disjunctieve methodemoeten alle cijfers voldoende zijn om voor een voldoende eindbeoorde-

ling in aanmerking te komen. Dit betekent dat er een goed systeem van herkansingen moet bestaanom alle leerlingen de gelegenheid te geven om voor alle onderdelen een voldoende te behalen.

– Bij de conjunctieve methodewordt het eindcijfer bepaald door het gemiddelde van alle cijfers tenemen. Hierbij is dus compensatie mogelijk. In veel gevallen zal er bovendien een wegingplaatsvinden van de cijfers voor de tussentijdse beoordelingen, om daarmee recht te doen aan destudielast. Dit kan eventueel de vorm aannemen van een systeem van studiepunten.

8.3.7 Toetsresultaten als bijdrage aan de curriculumevaluatie

Wat voor de onderwijsleersituatie in het klein geldt, geldt in het groot ook voor het curriculum. Vragendie dan beantwoord moeten worden, betreffen in eerste instantie hetinterne rendement:– Hoe effectief is het gegeven onderwijs (onderwijsmethode, hulpmiddelen etc.)?– Sluit het onderwijs voldoende aan bij de leerdoelen en bij de beginsituatie van de leerlingen?– Met welke gegevens kan de kwaliteit van het gegeven onderwijs aangetoond worden aan

bijvoorbeeld directie en bestuur?Daarnaast is er de vraag naar hetexterne rendement:– Voldoet het binnenschools leren aan de eisen van de zorginstellingen?De laatste vraag zou, in schakeltrajecten, ook vertaald kunnen worden in de vraag naar het succes vanleerlingen in vervolgopleidingen.Om de vragen naar het interne rendement te beantwoorden, moeten de diverse toetsresultaten en debeslissingen die daarop gebaseerd zijn, worden samengenomen. Als indicator voor een evaluatie van hetcurriculum kan dan gelden de schoolloopbaan van een cohort leerlingen. Hiermee wordt bedoeld hetslagen voor overgangs- en eindexamens, het voortijdig schoolverlaten en de tijd die leerlingen nodighebben gehad om een diploma te halen. Over het algemeen zal het hier dus toetsen betreffen die voorselectieve doeleinden zijn afgenomen. Een overzicht van de schoolloopbaan, ziet er dan bijvoorbeeld zouit (vsv1 betekent voortijdig schoolverlaten tijdens het eerste leerjaar):

tabel 53 - Schoolloopbaan (fictief)

vsv1 vsv2 vsv3 vertraagd onvertraagd N

groep 1 23% 12% 5% 23% 38% 93

groep 2 24% 12% 13% 18% 33% 437

groep 3 23% 9% 8% 6% 55% 70

totaal 24% 12% 11% 17% 37% 600

Wanneer het leerstof-jaarklassensysteem vervangen is door volledige modulering, kunnen uiteraardmodulegegevens gehanteerd worden. Afhankelijk van de gewenste informatie kunnen gegevens vanverschillende groepen bij elkaar gebracht worden: gegevens over de afgelopen jaren, gegevens uitverschillende sectoren of vergelijking met landelijke cijfers.Het management zal met deze gegevens in de hand antwoord zoeken op de volgende vragen:– Wegen de investeringen (van geld en menskracht) op tegen de opbrengsten (kosten–batenanalyse)?– Hoe is de kwaliteit van onze instelling in vergelijking met andere opleidingen?– Met welke gegevens kan ons beleid naar buiten toe (bijvoorbeeld ministerie) verantwoord

onderbouwd worden?

163

Page 168: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 8

– Komt het rendement van het binnenschools leren overeen met de afspraken die met de zorginstellin-gen daarover gemaakt zijn? Hoe is de inzetbaarheid van de leerlingen in de zorginstellingen?

Hierbij moet allereerst de vraag gesteld worden in hoeverre toetsresultaten gehanteerd als parameter voorde kwaliteit van het onderwijs c.q. van de onderwijsorganisatie.

8.3.8 Toetsresultaten als kwaliteitsindicatie voor het onderwijs en de onderwijsorganisatie

Toetsresultaten worden grofweg door drie belangrijke variabelen bepaald: de kwaliteit van de leerlingen,de kwaliteit van het onderwijs en de kwaliteit van de meting. In het model van de didactische analysezijn deze elementen te herkennen als respectievelijk de beginsituatie, de onderwijsleersituatie en hetmeten en beoordelen. Er wordt vanuit de beginsituatie toegewerkt naar de leerdoelen. Wanneer naverloop van tijd geconstateerd wordt dat de leerdoelen niet bereikt zijn, zijn er drie conclusies mogelijk:1 de afstand tussen de beginsituatie en de leerdoelen was te groot (de kwaliteit van de leerlingen was

te laag voor de beoogde doelen);2 de onderwijsleersituatie heeft onvoldoende invloed kunnen uitoefenen op het bereiken van de

beoogde leerdoelen (de kwaliteit van het onderwijs was te laag);3 de beoordeling van de mate waarin de leerdoelen bereikt zijn, deugde niet: leerlingen zijn ten

onrechte afgewezen (de kwaliteit van de meting was te laag).Uiteraard kunnen soortgelijke conclusies ook getrokken worden wanneer de leerdoelen wél bereikt zijn:1 de afstand tussen de beginsituatie en de leerdoelen was te klein of precies goed (de kwaliteit van de

leerlingen was te hoog of voldoende voor de beoogde doelen);2 de onderwijsleersituatie heeft voldoende invloed kunnen uitoefenen op het bereiken van de beoogde

leerdoelen (de kwaliteit van het onderwijs was goed);3 de beoordeling van de mate waarin de leerdoelen bereikt zijn, deugde niet: leerlingen zijn ten

onrechte geslaagd (de kwaliteit van de meting was te laag).

Dit handboek heeft als belangrijkste doelstelling om conclusies van de derde soort uit te kunnen sluiten.Hoe beter de kwaliteit van de meting is, hoe kleiner de invloed van die variabele wordt en hoe groterde relatieve inbreng van de twee andere variabelen wordt.

Een onderwijsorganisatie zal echter ook invloed van de leerlingen en die van het onderwijs uit elkaarwillen trekken, om zo te achterhalen wat haar toegevoegde waarde is. Wanneer de leerlinginstroom vanhoge kwaliteit is, zal het geen probleem zijn om de einddoelen te halen. Als opleidingsinstituut kun jedan adverteren met het behaalde hoge rendement. Het spreekt echter voor zich dat men daarmee geengenoegen mag nemen. De bedoelde groep leerlingen zou in dezelfde tijd meer kunnen bereiken ofhetzelfde in een kortere tijd.Er zijn verschillende mogelijkheden om daar zicht op te krijgen, zoals het gebruik van leerlingvolgsyste-men en het gebruik van geschaalde itembanken.

LeerlingvolgsysteemIn een leerlingvolgsysteem worden de vorderingen van de leerlingen zodanig geregistreerd en zichtbaargemaakt, dat de ontwikkeling goed te volgen is. Er worden aan het begin en in het verloop van hetonderwijs proces regelmatig peilingen gedaan, waarbij gebruik wordt gemaakt van ofwel een absolutenormering (is het doel bereikt?) of een landelijke normering (hoe verhoudt deze groep leerlingen zichtot alle andere leerlingen?). Door zulke referentiepunten te hanteren, kan zicht worden verkregen op dekwaliteit van de leerlingen op verschillende momenten in het onderwijsleerproces.Door nu die metingen in de tijd onderling te vergelijken, wordt duidelijk of de vorderingen van deleerlingen naar verwachting zijn.

Gecalibreerde itembanken

164

Page 169: Verantwoord Meten In Het Gezondheidszorgonderwijs

Uitvoeringsniveau: afname, correctie, resultaatbeoordeling

Bij een toetsenbank/itembank kan men gebruikmaken van gecalibreerde itembanken. Deze ondersteunende flexibilisering van de toetsing en afsluiting. Een gecalibreerde (of ’geschaalde’) itembank biedtnamelijk de mogelijkheid de eigenschappen van leerlingen vergelijkbaar te meten onafhankelijk van detoets die zij hebben gedaan. Dat geeft dus een houvast bij het beoordelen van het niveau van deleerlingen over de jaren heen.Overigens is een goed leerlingvolgsysteem juist om die reden gestoeld op gecalibreerde itembanken.

Toegevoegde waardeHierbij dient men zich te realiseren dat uit onderzoek is gebleken dat leerresultaten voor verreweg hetgrootste deel bepaald worden door leerlingkenmerken en dat slechts 5 à 10% door schoolse variabelenwordt beïnvloed. Selectie bij de poort (zie par. 2.3.1) lijkt daarom het aangewezen middel om dekwaliteit (lees: effectiviteit) van de school te verhogen. Uiteraard is een zorgvuldige plaatsing vanleerlingen voor zowel de opleiding als de leerlingen zeer gewenst, maar waar het hier om gaat, is detoegevoegde waarde: scholen voegen waarde toe aan wat leerlingen presteren gegeven hun geschiktheids-en omgevingsfactoren. Alleen op haar toegevoegde waarde kan een school worden aangesproken. En hetblijkt dan dat er toch duidelijke kwaliteitsverschillen tussen opleidingen bestaan, die consistent zijn opde diverse kwaliteitsindicatoren: hoge slaagpercentages gaan samen met minder doublures.Ondanks de smalle marges is het dus toch belangrijk dat scholen aan hun kwaliteit blijven werken.

165

Page 170: Verantwoord Meten In Het Gezondheidszorgonderwijs

9 Beslissingen en voorzieningen op managementniveau

Het management binnen een instelling kijkt op een andere wijze naar ’toetsing’ dan de onderwijskundigeen ondersteunende medewerkers. Het management zorgt voor het uitzetten van beleidslijnen binnen deinstelling en houdt daarbij rekening met veranderende externe omstandigheden.In dit hoofdstuk wordt aangegeven hoe deze veranderingen doorwerken in de toetsing en wordensuggesties gedaan vanuit het streven naar ’verantwoord meten’ om het toetsingsproces in te richten.Er zijn twee belangrijke invalshoeken ten aanzien van het onderwijs in de instelling en dus ook tenaanzien van de toetsing:– de verantwoording van de toetsing extern: naar de overheid, naar de leerlingen en naar het

beroepenveld;– het organiseren van het toetsingsproces intern.De specifieke verantwoordelijkheid van management ligt bij het in evenwicht brengen van deze tweeinvalshoeken. Omstandigheden van buiten mogen niet leiden tot het onbeheersbaar worden van interneprocessen. Een voorbeeld hiervan is:Er wordt een grotere individuele keuze geboden aan leerlingen (maatschappelijke vraag) in een situatievan schaalvergroting (door overheid gestimuleerd). De onderwijsinstelling kan in een dergelijke situatiehet overzicht snel kwijtraken en de ’normale’ oplossingen en wijzen van organiseren (lesroosters) kunnenproblemen opleveren.

De interne organisatie van de toetsing hoort ondersteunend te zijn voor het beleid dat het managementheeft gekozen; dat betekent dat het management zorg draagt voor het vertalen van beleid in aansturingvan de organisatie en voor daarmee consistente procedures op uitvoeringsniveau.In dit hoofdstuk worden ten aanzien van de toetsing handreikingen gegeven voor het vormgeven van ditproces.

9.1 Onderwijsinstelling en omgeving: een analyse

De scholen voor beroepsonderwijs bevinden zich in een krachtenveld, waarin een aantal belangrijkeinvloeden onderscheiden worden: de overheid, beroepenveld, de maatschappij en de technologie. Dezebeïnvloeden het onderwijs met wensen en/of bieden mogelijkheden om het onderwijs anders in te richten.De overheid wordt hier apart genoemd, omdat zij de kaders stelt voor het onderwijs. Vanuit demaatschappij ontstaat ook de vraag naar onderwijs.Voor het management zijn betreffende overheidsbeleid de volgende aspecten belangrijk:– wettelijke voorschriften;– ontwikkeling van een (gezamenlijke) kwalificatiestructuur;– schaalvergroting/vorming vanROC’s (regionale opleidingencentra);– controle op afstand/deregulering/lump sum/rendementbekostiging;– kwaliteitszorg.

166

Page 171: Verantwoord Meten In Het Gezondheidszorgonderwijs

Beslissingen en voorzieningen op managementniveau

Invloeden vanuit de maatschappij worden voor de instelling belangrijk, waar zij de behoeften van hetberoepenveld en de vraag naar onderwijs vanuit de leerling betreffen. De volgende ontwikkelingen enkenmerken van ontwikkelingen zijn voor het beroepsonderwijs interessant:– er bestaan hoge verwachtingen van onderwijs (kennisintensieve samenleving);– er zijn meer keuzemogelijkheden voor individuen (flexibiliteit, individualisering);– er is sprake van integratie van automatisering in verschillende beroepenvelden, hierdoor:

. meer behoefte aan blijvende vaardigheden dan aan parate kennis

. meer behoefte aan direct bruikbare vaardigheden (beroep) dan aan theoretische kennis;– er worden meer eisen gesteld aan de presentatie van informatie;– er worden meer eisen gesteld aan het toepassen van technologie;– de vraag naar controle/garanties neemt toe;– er sprake van meer kostenbewustzijn.

De techniek aan de andere kant biedt mogelijkheden om deels aan de eisen vanuit de samenlevingtegemoet te komen. Dit gaat gepaard met een soms al te nadrukkelijk presenteren van nieuwemogelijkheden van techniek: ’technology push’. Welke mogelijkheden kan de techniek bieden aan hetonderwijs?Techniek biedt hulpmiddelen voor:– de leerling om de doelstellingen van het onderwijs te bereiken;– de onderwijsgevende als ondersteuning van het onderwijsleerproces;– de presentatie van onderwijsmateriaal;– het automatiseren van de activiteiten van de organisatie zelf (administratie, roostering).Als men onderwijs beschouwt als dienstverlening, gebaseerd op kennis, kan men spreken van’automatisering van de kennisintensieve dienstverlening’.

In dit handboek wordt ervan uit gegaan dat onderwijs aansluit bij ontwikkelingen in de beroepspraktijken in de samenleving met gebruikmaking van technische hulpmiddelen.

9.2 Een vertaling van deze invloeden naar ’toetsing’

Wanneer de invloeden van buitenaf worden vertaald naar gevolgen voor de toetsing, kunnen drieaandachtsgebieden worden onderscheiden:1 inhoud van de toetsing2 organisatie van de toetsing3 hulpmiddelen bij de toetsing.

9.2.1 Inhoud van de toetsing

Met inhoud van de toetsing wordt hier bedoeld: de inhouden van het onderwijs en de doelstellingen vanhet onderwijs. Men toetst de kennis en vaardigheden, die in de eindtermen zijn besloten.De inhoud van de toetsing verandert doordat de eisen die de samenleving en de overheid stellen,veranderen. In het handboek is al aangegeven dat er een sterkere nadruk komt te liggen op vaardigheden(zie ook par. 1.1.2).

De toetsing van kennis en vaardigheden vindt niet meer plaats in het kader van één opleiding of beroep,maar in het kader van het gehele beroepsonderwijs.

167

Page 172: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 9

De opleidingseisen worden bekeken in het kader van een kwalificatiestructuur voor het geheleberoepsonderwijs. Dat kan betekenen dat steeds meer relaties tussen gelijksoortige opleidingen gelegdworden en ook relaties betreffende de toetsing van een opleiding.

Vanuit de gedachte van flexibilisering en het aanbieden van meer toetsmomenten aan kandidaten, wordtverwacht dat de organisatie aangepast zal moeten worden. Flexibilisering heeft echter ook gevolgen voorde inhouden van de toets.Wanneer de leerlingen per cohort allen hetzelfde centrale examen maken, kan men stellen dat zij percohort op dezelfde inhouden en op hetzelfde niveau getoetst zijn.Dit gaat veranderen als de leerlingen van een cohort verschillende toetsen voorgelegd krijgen. Deverschillen, die er mogelijk tussen toetsen van verschillend cohort bestaan, kunnen nu ook ontstaantussen leerlingen uit eenzelfde cohort. Het werken aan gelijkwaardige toetsen qua inhoud en niveauwordt normhandhaving genoemd (zie par. 8.3.3)

9.2.2 Organisatie van de toetsing

De organisatie verandert onder invloed van de vraag naar meer geïndividualiseerde leerwegen. Zowelvanuit de overheid als vanuit de school wordt ingezien dat het rendement van de opleiding vergroot kanworden door leerlingen een opleiding te bieden, die meer is afgestemd op hun beginsituatie en op hunmogelijkheden. Dit betekent flexibilisering van het onderwijs en in het verlengde daarvan flexibiliseringvan de toetsing.Men vraagt toetsen die aansluiten bij het onderwijs op maat, op meer momenten in het opleidingstraject.

De organisatie van de toetsing binnen de school verandert omdat er veel meer garanties gevraagd wordenten aanzien van het product (de toets) en het proces (de toetsconstructie). Dit leidt tot meer aandachtvoor de kwaliteit van toets en toetsconstructieproces.

De eisen die aan de toetsing zelf gesteld kunnen worden, zijn uitgebreid beschreven in hoofdstuk 3.Ook aan het toetsconstructieproces kunnen eisen gesteld worden, om de kwaliteit ervan te verbeteren.Denk hierbij aan: consistentie, doorzichtige regels en feedback op alle niveaus.

9.2.3 Hulpmiddelen bij de toetsing

De toenemende beschikbaarheid van informatie- en communicatietechnologie biedt allerlei mogelijkhedenom de constructie en afname van toetsen flexibeler en efficiënter aan te pakken.De eisen vanuit de samenleving met betrekking tot presentatie van het lesmateriaal en het toetsmateriaalworden hoger. Men raakt gewend aan de mogelijkheden die techniek biedt in relatie tot vormgeving. Datbetekent ook voor een instelling dat les- en toetsmateriaal professioneler worden vormgegeven.Hiervoor kan de school gebruikmaken van geautomatiseerde hulpmiddelen zoals toetsen/itembanken enhulpmiddelen voor toetsing achter het beeldscherm.De school zal deze deskundigheid veelal elders moeten inhuren. Verder kan men in het kader van hetgebruik van toetsen/itembanken denken aan een externe samenwerking van bepaalde opleidingen metsoortgelijke opleidingen inROC’s.Om flexibilisering naar plaats mogelijk te maken kan men een toetslokaal inrichten, waar leerlingen opmeer momenten in een jaar in kleine groepen onder toezicht een toets kunnen maken.

In de paragrafen 9.4, 9.5 en 9.6 zal vanuit de verschillende invalshoeken nader op deze hulpmiddelenen hun implicaties voor de totale organisatie worden ingegaan. In paragraaf 9.3 wordt eerst ingegaan optwee overkoepelende begrippen: kwaliteitszorg en procesbeheersing.

168

Page 173: Verantwoord Meten In Het Gezondheidszorgonderwijs

Beslissingen en voorzieningen op managementniveau

9.3 Werkwijze en kwaliteitszorg

Toetsing is enerzijds een middel om de kwaliteit van de opleiding te bewaken en te verbeteren, maaranderzijds moet toetsing zelf ook object van kwaliteitszorg zijn. In dit handboek worden beide kantenuitvoerig belicht. In deze paragraaf wordt vanuit de kwaliteitszorg nogmaals naar toetsing gekeken.’Verantwoord meten’ vanuit managementniveau houdt in dat het meten van leerresultaten verantwoordgeschiedt op een effectieve wijze met minimale kosten.Het management stelt in overleg met de onderwijskundige medewerkers een bepaalde te bereiken’kwaliteit’ in het toetsproces als doel. Op basis van deze te bereiken doelen/standaarden wordt deorganisatie voor de toetsing uitgewerkt.Deels worden deze doelen vastgesteld door de overheid, en spreekt men van eisen aan examinering,waaraan elke instelling moet voldoen, deels worden deze doelen bepaald naar aanleiding van vragen uithet beroepenveld en wensen en behoeften van leerlingen. Om te kunnen beoordelen of doelen bereiktworden, wordt aangeraden om het proces te organiseren op basis van principes uit de ’kwaliteitszorg’.In de volgende alinea wordt het begrip ’kwaliteitszorg’ toegelicht.

afb. 24 - Integrale kwaliteitszorg (NEN-ISO 9000)

Volgens deNEN-ISO-9000-systematiek zijn aan integrale kwaliteitszorg vijf elementen te onderscheiden.De elementen zijn onlosmakelijk met elkaar verbonden, komen uit elkaar voort en hebben een cyclischkarakter. In afbeelding 24 is deze samenhang tussen de verschillende elementen weergegeven als eencirkel.

Binnen een onderwijsorganisatie zijn de verschillende niveaus verantwoordelijk voor verschillendeaspecten van kwaliteitszorg. Deze hiërarchische betrokkenheid is te zien in afbeelding 25.De kwaliteitscirkel start met kwaliteitsbeleid. Dit is de doelstelling van een organisatie ten aanzien vankwaliteit, alsmede de wegen en middelen die leiden tot verwezenlijking van deze doelstellingen.Het is de taak van het management om deze doelstelling, dit kwaliteitsbeleid te formuleren en vooriedereen in de organisatie kenbaar te maken (zie par. 9.4).Dat brengt ons op de volgende stap, de kwaliteitszorg. Dit is het aspect van de totale managementfunctiedat bepalend is voor het vaststellen en ten uitvoer brengen van het kwaliteitsbeleid.De kwaliteitszorg moet systematisch aangepakt worden, aangezien het anders door niemand als zijnverantwoordelijkheid wordt gezien. Daarom is de volgende stap die van het kwaliteitssysteem. Dit kanworden omschreven als ’de organisatorische structuur, verantwoordelijkheden, procedures, processen envoorzieningen voor het ten uitvoer brengen van kwaliteitszorg’. Hierbij kan gedacht worden aan deonderwijs- en examenregeling die op curriculumniveau ontwikkeld wordt.Bij kwaliteitsbeheersing moet gedacht worden aan alle operationele technieken en activiteiten die wordentoegepast om te bewerkstelligen dat aan de kwaliteitseisen wordt voldaan. De zorgvuldige constructievan meetinstrumenten is daarvan een voorbeeld.

169

Page 174: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 9

afb. 25 - De 3 niveaus in de kwaliteitscirkel

De cirkel wordt gesloten door de kwaliteitsborging, het geheel van alle geplande en systematische actiesdie nodig zijn om in voldoende mate het vertrouwen te geven dat aan de gestelde kwaliteitseisen wordtvoldaan. Zo is bijvoorbeeld sprake van kwaliteitsborging ten aanzien van het onderwijs, wanneer ergetoetst wordt en van kwaliteitsborging ten aanzien van de toetsing, wanneer de betrouwbaarheid vaneen toets berekend wordt.In de kwaliteitszorg speelt het begrip procesbeheersing een belangrijke rol. In de volgende paragraafwordt dit begrip daarom nader onder de loep genomen.

9.3.1 Procesbeheersing

Wat onder procesbeheersing op opleidingsniveau moet worden verstaan, wordt toegelicht aan de handvan het schema in afbeelding 26.

afb. 26 - Procesbeheersing

Eerst zijn er standaarden. Deze bepalen– wat we moeten nastreven;– waarop we moeten letten.

In deze paragraaf worden als voorbeeld de standaarden uitgewerkt, die bestaan als doelen van hetonderwijs in een instelling. Men kan ook standaarden stellen voor de toets zelf, voor de organisatie vande toetsing en standaarden voor het gebruik van hulpmiddelen bij de toetsing.Standaarden zijn zaken die we ons als norm stellen. Dit kunnen maatschappelijke verwachtingen zijn(bijv.: wat de afnemers van het onderwijs, de werkgevers, van het onderwijs verwachten, watafgestudeerden volgens hen moeten kennen en kunnen). Standaarden kunnen ook onderwijskundigedoelen zijn (wat docenten aan een opleiding menen te moeten nastreven) of gangbare studieresultaten

170

Page 175: Verantwoord Meten In Het Gezondheidszorgonderwijs

Beslissingen en voorzieningen op managementniveau

(wat geslaagden van een opleiding doorgaans weten, wat ze in de praktijk kunnen toepassen). Als mengangbare studieresultaten tot norm verheft, kan wel worden gesproken van normhandhaving.Het is duidelijk dat in het ideale geval de drie opvattingen van standaarden samenvallen: wat demaatschappij wil, streeft het onderwijs na en dit geldt tevens als norm voor afstuderen. Met een termuit de Duitse planeconomie kan men de toestand of situatie die bereikt moet worden ’Soll’, ’Wat moet’genoemd worden.

Voor procesbeheersing moeten eerst instrumenten, middelen en methoden gezocht worden om de huidigestand van zaken, de ’Ist’-situatie (’Wat is’), te bepalen. Als het gaat om studieresultaten, moet men voorgegevens zorgen die een beeld geven van wat er op dit moment bereikt wordt: wat leren de leerlingenmomenteel?

De volgende stap is een vergelijking van de huidige resultaten met de gewenste resultaten. Ook hierkomen de standaarden in beeld: zij geven immers aan welk niveau we moeten bereiken. Als werkgeversvinden dat opgeleiden bepaalde handelingen correct moeten kunnen uitvoeren en de onderwijsinstelling1 vindt dat ze gelijk hebben (het behoort tot de opleiding) en 2 constateert dat dit in veel gevallen nietzo is, dan is sprake van een discrepantie tussen de ’Ist’-situatie en wat wenselijk is, de ’Soll’-situatie.

Er zullen maatregelen moeten worden getroffen om de discrepantie weg te werken, bijvoorbeeld hetuitvaardigen van een richtlijn voor docenten om meer aandacht te besteden aan bepaalde vaardigheden.Ook hier spelen de standaarden weer een rol: deze schrijven immers de vaardigheden voor die deleerlingen moeten beheersen. Deze en andere maatregelen zullen effect hebben op de toekomstige ’Ist’-situatie: meer leerlingen zullen leren om de bedoelde handelingen correct uit te voeren. Om na te gaanof dat werkelijk zo is en in welke mate de maatregelen succesvol zijn geweest, is na verloop van tijdeen nieuwe waarneming of meting noodzakelijk, waarna het proces zich herhaalt.Procesbeheersing op onderwijsinhoudelijk niveau houdt dus in: een stelselmatige waarneming en metingvan lopende studieresultaten en een vergelijking daarvan met gewenste resultaten, met het oogmerk omdoor gerichte maatregelen de gewenste studieopbrengst te realiseren.

In volgende paragrafen zal nader worden ingaan op procesbeheersing voor het bewaken van deonderwijsinhoudelijke doelstellingen/standaarden en de standaarden voor andere aspecten. In dezeparagrafen wordt betoogd, dat men voor de procesbeheersing gebruik kan maken van documenten,waarin de standaarden geformuleerd zijn en waarmee men procedures kan opzetten voor het bewakenvan deze standaarden.

9.3.2 Werken met ’documenten’

Procesbeheersing kan men op verschillende plaatsen in de onderwijsinstelling terugvinden: allereerst isdaar het niveau van het bereiken van onderwijsdoelen. Men heeft als doel de leerlingen zo goed mogelijkvoor te bereiden op een beroepspraktijk.Wanneer men de doelen ’kwantificeert’, kan men op een vrij eenvoudige wijze nagaan of de doelen zijnbereikt. Eén manier van het kwantificeren van de onderwijsdoelen is het aangeven van het percentagevan leerlingen die de opleiding per jaar met goed gevolg zullen afsluiten. Een andere manier is hetaangeven van het geaccepteerde maximumpercentage uitval.

De streefdoelen en de wijze waarop de doelen worden gerealiseerd, worden vastgelegd in ’documenten’.Deze documenten zijn vaak het resultaat van de discussie en het overleg binnen een instelling over dedoelen en fungeren dan als richtlijn voor management en overige betrokkenen.De documenten kunnen ook procedures en organisatie beschrijven en fungeren dan als een soort’afspraken’ voor alle betrokkenen. Deze doelen en afspraken vormen de standaarden voor procesbeheer-

171

Page 176: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 9

sing. In de verschillende documenten wordt voor de onderscheiden niveaus op een geëigende wijzeaandacht besteed aan dezelfde aspecten van toetsing.

9.4 Document 1: Beleid en streefdoelen voor de toetsing

Het document waarin men de doelen formuleert, kan dienen als basis voor kwaliteitszorg. Men kan aande hand van dit document controleren of de doelen al dan niet zijn bereikt.

9.4.1 Aanwijzingen voor invulling

In paragraaf 9.2 is beargumenteerd dat de toetsing verandert door invloeden van buitenaf.Daarbij spreekt vanzelf dat het toetsproces zelf van goede kwaliteit moet zijn, dat betekent dat vanuittoetstechnische invalshoek eisen aan toetsen en aan de constructie worden gesteld.Het grootste deel van dit handboek behandelt de eisen die vanuit de toetstechnisch oogpunt belangrijkzijn voor een ’verantwoorde meting’.

Verantwoord metenHet eerste doel voor de toetsing spreekt dan ook voor zich. Men kan ernaar streven om voor hetbeoordelen van leerlingen instrumenten te gebruiken, die een zo verantwoord mogelijke meting mogelijkmaken. Het management van een instelling kan er ook naar streven om omstandigheden te scheppen,waarin de kennis en vaardigheden van leerlingen optimaal kunnen worden getoond en waar leerlingen’fair’ worden getoetst.Met dat laatste wordt bedoeld dat omstandigheden gecontroleerd moeten worden, zodat alle leerlingendezelfde kansen hebben op een goed resultaat.

Toetsen van vaardighedenDe vraag vanuit de maatschappij om vaardigheden een sterkere nadruk te geven in de toetsing, kanvanuit de instelling beantwoord worden met het stellen van onderwijsdoelstellingen betreffendevaardigheden.Voor het toetsen van deze vaardigheden is het belangrijk dat de vaardigheden goed geformuleerd zijn.Dat betekent dat men de onderwijsdoelstellingen zo formuleert, dat verschillende personen er hetzelfdeonder verstaan en dat zij zo omschreven worden, dat zij in een ’gestandaardiseerde setting’ kunnenworden getoetst.Met dit laatste wordt bedoeld dat men de omstandigheden zodanig controleert, dat de leerlingengeconfronteerd worden met gelijksoortige opdrachten van ’gelijkwaardige moeilijkheid’. Deomstandigheden die bij het toetsen van vaardigheden vaak een grote rol spelen, mogen de kansen vanleerlingen niet onbedoeld vergroten of verkleinen.

FlexibiliseringBinnenkort vervallen de centrale examens en wordt het mogelijk om de toetsing en afsluiting meer teflexibiliseren: de opleiding is voor examinering en diplomering niet meer gebonden aan een paar vastemomenten in het jaar. Een itembank kan deze flexibilisering bevorderen en niet alleen de efficiëntie,maar ook de kwaliteit van de toetsing aanmerkelijk verhogen.Bij het afnemen van tentamens en examens is de traditionele werkwijze dat een persoon of commissieeen rooster opstelt. Docenten die verantwoordelijk zijn voor de opleiding zorgen voor opgaven, voerende examinering uit en verzorgen de correctie en cijfergeving.Flexibilisering betekent dat groepen leerlingen zich niet meer op enkele vaste data aan tentamens hoevente onderwerpen, maar kunnen worden getoetst wanneer zij zelf of de docent vinden dat zij aan eententamen toe zijn. Er komen meer toetsmomenten, afgestemd op verschillende leertrajecten in veelal

172

Page 177: Verantwoord Meten In Het Gezondheidszorgonderwijs

Beslissingen en voorzieningen op managementniveau

modulair ingerichte onderwijssettings. Voor de docent-examinatoren betekent dit dat zij over groteaantallen gelijkwaardige toetsen moeten kunnen beschikken.Veel wordt verwacht van het hergebruik van opdrachten en vragen, die hun geschiktheid in de loop vande tijd hebben bewezen.Hergebruik van een beperkt aantal opgaven heeft na verloop van tijd tot gevolg dat de exameninhouduitlekt. De leerlingen bereiden zich niet meer op de examenstof voor, maar op de concrete examenin-houd, of erger nog: alléén op de goede antwoorden. Daarom is het nodig om over verzamelingen vanvragen te beschikken, die van voldoende omvang zijn of die regelmatig worden geactualiseerd. Hettoepassen van toetsenbanken/itembanken bij de examinering kan ervoor zorgen dat de verzamelingenvragen niet onbeheersbaar worden.

Het aantal toetsdata kan men geleidelijk uitbreiden, bijvoorbeeld van één tentamen met één herkansingper trimester via enkele vaste tentamendata naar een groot aantal gespreide keuzedagen.Bij het creëren van meer afnamemomenten moet niet alleen rekening worden gehouden met de capaciteitvan de opgavenbank, maar ook met de organisatorische spankracht van de school.

Toetsenbanken/itembankenHet grote voordeel van een professioneel itembanksysteem is dat het proces van toetsproductie isgeautomatiseerd: bij een voldoende aantal opgaven kan het systeem inhoudelijk gelijkwaardige toetsen’genereren’. Dit betekent een zeer grote flexibiliteit bij het toetsen en examineren: de opgavenbank zorgtvoor een voldoende aantal verschillende en toch inhoudelijk gelijkwaardige opgaven, zodat geenproblemen rond geheimhouding ontstaan. De ene leerling kan de andere geen goede antwoorden meerdoorspelen, omdat de reeks opgaven per toetsdatum verschilt.Wanneer gebruik wordt gemaakt van een itembank kan men dus uit een voorraad geordende opgavenmet behulp van toetsmatrijzen toetsen maken die op diverse data kunnen worden afgenomen.Indien men de vragen nader onderzoekt op basis van psychometrische analyses, kan men zelfs toetsengenereren, die dezelfde graad van moeilijkheid hebben.Men kan toetsenbanken en itembanken gebruiken bij normhandhaving, indien de vragen psychometrischgetest en geanalyseerd zijn.

Computer Based TestingMet de term Computer Based Testing (CBT) wordt bedoeld dat de leerling een toets kan doen met behulpvan de computer. De leerling ziet de vragen op het scherm en hij krijgt de kans de antwoorden in tetypen of aan te klikken. Indien het gesloten vragen zijn, kan de computer de score automatischberekenen. Bij open vragen is het nodig dat de docent de antwoorden (die opgeslagen zijn) beoordeelt,net als bij een schriftelijke toets.Het voordeel vanCBT kan zijn dat men een programma inbouwt waarmee de moeilijkheid van de vragenwordt aangepast aan het niveau van de leerling. Men spreekt dan van adaptieve toetsing. De leerlingbehoeft veel minder vragen te beantwoorden voor een betrouwbare meting van de kennis envaardigheden. Ook hier spelen psychometrische gegevens een grote rol. Alleen met behulp van eenpsychometrische analyse is op dit moment de moeilijkheid van een vraag verantwoord in te schatten.

ToetslokaalEen toetslokaal is een voorziening die voor flexibele toetsing van grote waarde kan zijn. Men heeft eenruimte nodig waarin kleine groepen kandidaten de toetsen kunnen doen onder gecontroleerde, optimaleomstandigheden.Een goed beheer van een toetslokaal kan ervoor zorgen dat de schoolorganisatie niet hoeft te lijden ondereen veelheid van toetsmomenten. In ieder geval behoort tot een goed beheer dat er toezicht is in hettoetslokaal.

173

Page 178: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 9

Er zijn goede roosters beschikbaar, waardoor het toetslokaal regelmatig gebruikt wordt en waarbij deleerlingen gespreid over het jaar de examens kunnen doen.Ten slotte is het van belang dat leerlingen zich kunnen legitimeren.

9.4.2 Kwaliteitszorg

Uiteraard is ook het toetsbeleid onderwerp van kwaliteitszorg. Naast de interne kwaliteitszorg krijgt deonderwijsinstelling ook te maken met externe controle.– Interne kwaliteitszorg.

Hierbij wordt vanuit de organisatie zelf bewaakt of de te bereiken doelen ook werkelijk gehaald zijnen of het proces waarlangs men de doelen denkt te bereiken ook werkelijk verloopt volgens deafspraken. Bij ’interne’ kwaliteitszorg wordt procesbeheersing binnen de instelling uitgeoefend.

– Externe kwaliteitszorg.Hieronder worden alle evaluatie-activiteiten verstaan die niet door, op initiatief van of onderauspiciën van individuele instellingen worden ondernomen. Het ’extern’ zijn hangt in dat geval afvan de initiatiefnemer.Een andere interpretatie is dat commissies van externe deskundigen worden ingeschakeld. Het’extern’ zijn wordt dus niet bepaald door de initiatiefnemer, maar door het feit dat deskundigen vanbuiten de instelling betrokken worden bij kwaliteitszorg. De externe kwaliteitszorg is dan geencontrole van buitenaf, maar ligt in het verlengde van de interne kwaliteitszorg. Instellingenverzamelen gegevens die van belang zijn voor het beoordelen van de kwaliteit van het verzorgdeonderwijs en maken deze toegankelijk voor externe deskundigen.

9.5 Document 2: Onderwijs- en examenregeling

Zoals de naam al aangeeft, heeft een deel van de eisen die in een onderwijs- en examenregelinggeformuleerd worden betrekking op de wijze waarop het onderwijs is ingericht en een ander deelbetrekking op de toetsing en examinering.Hier wordt aangeraden om een indeling te maken in twee gedeelten. In het eerste deel vindt men een’overzicht van de inhouden’, die geëxamineerd worden en de procedures voor examinering. In het tweededeel wordt de organisatie van de toetsing beschreven.Het eerste deel van de onderwijs- en examenregeling wordt in de volgende paragraaf aangegeven.Aanwijzingen voor het tweede deel vindt u in paragraaf 9.6, waar de ’organisatie van de toetsing’ wordtbesproken. Beide delen zullen direct afgeleid worden van de streefdoelen, die in het beleidsdocumentzijn geformuleerd.In het inhoudelijke deel van de onderwijs- en examenregeling zijn alle eindtermen voor de opleiding tevinden met een uitwerking daarvan in te toetsen doelstellingen. Tevens staat daarin vermeld welketoetsen de leerlingen moeten doen tijdens of aan het einde van de opleiding en welke prestaties perdeelkwalificatie leiden tot een certificaat.Het behalen van alle certificaten van een opleiding geeft recht op het diploma van de opleiding.In de volgende paragraaf wordt puntsgewijs beschreven welke uitspraken er in het inhoudelijke deelbehoren te staan.

9.5.1 Aanwijzingen voor invulling

Een onderwijs- en examenregeling omvat ten minste de volgende zaken:– de onderwijs- en vormingsdoelen, incl. de eindtermen;– de onderwijseenheden die deel uitmaken van de opleiding;– de inhoud en inrichting van de opleiding (de leerwegen) en van de beroepspraktijkvorming;

174

Page 179: Verantwoord Meten In Het Gezondheidszorgonderwijs

Beslissingen en voorzieningen op managementniveau

– de inhoud en indeling van het examen;– de studieduur van de hele opleiding, van de onderwijseenheden en van de deelkwalificaties;– de toetsmomenten per studiejaar;– per toetsmoment een keuze voor een bepaalde toetsvorm;– een beschrijving van de wijze waarop de toetsen worden afgenomen;– de deelkwalificaties die extern gelegitimeerd worden;– mogelijke vrijstellingen;– per toets eventuele vereiste certificaten;– de wijze waarop en de termijn waarbinnen informatie beschikbaar is over opgaven, gemaakte toetsen

en behaalde cijfers.

In tabel 56 wordt een voorbeeld van onderwijs- en examenregeling gepresenteerd, waarbij wordtuitgegaan van certificaateenheden. Men kan een schema opstellen, waarin in één oogopslag duidelijkwordt op welke wijze certificaateenheden worden getoetst.

tabel 54 - Mogelijke opzet van een onderwijs- en examenregeling

Naam CEBijdragendemodulen

Externe legitimeringof schoollegitimering

Aantaltoetsenper modu-le

Toetsvorm(schriftelijkof praktisch)

Beoordelingsterm(waardering, cijfer)

9.5.2 Kwaliteit van de onderwijs- en examenregeling

Het bewaken van de inhoudelijke kwaliteit van de examinering kan plaatsvinden door een beoordelingvan de meetinstrumenten, waarmee getoetst wordt. Deze beoordeling kan intern of extern geschieden,of zowel intern als extern uitgevoerd worden.

Kwaliteitszorg betreffende het meetinstrument: de toetsOok het systeem van toetsing en examinering leent zich voor evaluatie. Daarbij kan het gaan om toetsenen examens als product. Relevante evaluatievragen luiden dan:– Zijn de doelstellingen eenduidig?– Is de instructie voor de kandidaat volledig en helder?– Is de beoordelaarsinstructie duidelijk?– Is de lay-out van de opgaven overzichtelijk?– Is de vraagstelling eenduidig?– Zijn de gekozen toetsvormen geschikt voor het gestelde doel?Zulke vragen zullen in de regel gesteld zijn in het kader van zelfevaluatie en eventueel geleid moetenhebben tot verbeteringen, alvorens men zich onderwerpt aan een extern oordeel.

Kwaliteitszorg door middel van externe legitimeringVolgens deWEB stelt het bevoegd gezag voor elke opleiding een onderwijs- en examenregeling vast. Indeze regeling staan de deelkwalificaties waarvoor externe legitimering moet plaatsvinden, deexameninstelling die de externe legitimering verzorgt en de wijze waarop dit gebeurt. De externe

175

Page 180: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 9

legitimering omvat de kleinst mogelijke meerderheid van het totale aantal verplichte deelkwalificatiesvan een opleiding. Deze geschiedt door of vanwege exameninstellingen en houdt voorzieningen in diewaarborgen dat de inhoud en het niveau van de examens ten minste zijn afgestemd op de eindtermen.Extern houdt in: niet alleen onder verantwoordelijkheid van het bevoegd gezag van een enkele instelling.Externe legitimering zou een instelling kunnen bereiken door de examencommissie op eenROC-overstijgende manier samen te stellen en niet alleen uit het eigen onderwijzend personeel te laten bestaan.De WEB opent de mogelijkheid dat elkeROC in samenwerking met een of meer bevoegde gezagsorganenvan andere instellingen een examencommissie aanwijst. Door het benoemen van leden van buiten hetonderwijs, bijvoorbeeld uit beroepsleven of wetenschap, zou de commissie legitimeringsstatus kunnenverwerven.De taken van zo’n examencommissie kunnen bestaan uit het goedkeuren van opgaven en opstellen vantoetsmatrijzen. Men heeft de inhoud van de examinering gelegitimeerd door te putten uit opgaven die– ROC-overstijgend zijn goedgekeurd;– gebaseerd zijn op onderwerpen die de leerstof voor deelkwalificaties en eindtermen definiëren;– op een evenwichtige manier worden geselecteerd door middel van een toetsmatrijs;

9.6 Document 3: Organisatie van de toetsing

De documenten waarin men de consequenties van de doelen naar de organisatie uitwerkt, kunnen dienenals uitgangspunt voor procesbeheersing, waarmee men nagaat of de werkwijze wel wordt gevolgd, zoalsmen dit wenst.

9.6.1 Aanwijzingen voor invulling

Voor de organisatie van de toetsing is het gewenst een examencommissie in te stellen, die de organisatieen afname van de examens verzorgt. Voor het gehele proces van toetsing is echter meer nodig dan eencommissie voor organisatie van de examens zoals voorheen. Het gehele proces van toetsconstructie zalgereglementeerd en bewaakt moeten worden, wil er sprake zijn van kwalitatief goede examens. Hieronderwordt eerst de algemene lijn van toetsconstructie en afname aangegeven, daarna worden voorbeeldengegeven van toepassing van de al eerder genoemde ’beleidsdoelen’ in de organisatie.

De grote lijn in de toetsorganisatie bestaat uit de volgende onderdelen:– itemconstructie/vraagconstructie of casusconstructie;– het opstellen van toetsspecificaties, zoals gebruik van een toetsmatrijs, normering, e.d.;– toetsconstructie, dat wil zeggen samenstellen van de toetsen;– het opstellen van afnamecondities per toets;– het vaststellen van afnamemomenten;– plannen van toetslocaties;– planning van afnamemomenten voor leerlingen (roosters);– verwerken van antwoorden/correctie;– scoring;– analyse van leerlingresultaten;– eventueel bijstellen normering;– cijferbepaling;– bekendmaking cijfers;– administratie van leerlingresultaten (leerlingvolgsysteem).Wanneer deze algemene lijn wordt toegepast op de in paragraaf 9.4 beschreven doelen, levert dat devolgende aanwijzingen op.

176

Page 181: Verantwoord Meten In Het Gezondheidszorgonderwijs

Beslissingen en voorzieningen op managementniveau

Verantwoord metenVerantwoord meten van leerresultaten speelt in het gehele proces van toetsing. Het is de basis voor detoetsing. Bij elk onderdeel kan worden bekeken in hoeverre er sprak is van een valide toetsing, eenbetrouwbare toetsing en een toetsing, die eerlijk is voor alle leerlingen.

FlexibiliseringFlexibilisering heeft belangrijke gevolgen voor de toetsing. Er ontstaat een behoefte aan veelgelijkwaardige toetsen, die bij kleine groepen leerlingen worden afgenomen. Hierdoor neemt de druk vande itemconstructie/toetsconstructieactiviteiten bij de docenten toe. Itemconstructie/toetsconstructie kanwellicht efficiënter geschieden via samenwerking tussen opleidingen binnen en buiten de instelling.Door toename van het aantal toetsmomenten worden er eisen aan de instelling gesteld wat betreft deorganisatie van alle toetsmomenten. Toetsing kan niet meer als ’bijzondere activiteit’ gepland worden,waarvoor alle andere onderwijsactiviteiten moeten wijken. De toetsing zal veel meer een deel wordenvan het onderwijsleerproces, tenminste wat betreft de organisatie.Inhoudelijk zal de toetsing toch een aparte status behouden, juist om de garanties te kunnen geven aanalle leerlingen, dat zij onder gelijkwaardige omstandigheden getoetst worden.

Toetsenbanken/itembankenToetsenbanken en itembanken kan men in de instelling gebruiken om toetsen samen te stellen uitelementen zoals: items, open vragen, praktijkopdrachten en casusbeschrijvingen.Als men niet de beschikking heeft over een toetsenbank, die gereed en bruikbaar is, ontstaat er echtereen geheel nieuw constructieproces binnen de school: de constructie van een toetsenbank of itembank.

De fasen in deze constructie zijn:– het maken van halffabrikaten (items, vragen);– het beoordelen en aanpassen van deze concept-items;– eventueel pre-testen;– constructie van een classificatiestructuur in de itembank/toetsenbank;– invoeren van items in de classificatiestructuur;– het invoeren van toetsspecificaties (zoals toetsmatrijzen);– het beheer van de itembank;– toetsconstructie met behulp van de itembank:

. gelijkwaardige inhouden;

. gelijkwaardige moeilijkheid.De toetsen worden waarschijnlijk onder dezelfde omstandigheden afgenomen als toetsen, die niet metde toetsenbank/itembank zijn geconstrueerd.

Computer Based TestingHet inschakelen van de computer voorCBT verandert juist iets aan de afnamesituatie. De leerling kanzelfstandig op elk gewenst moment de toets maken. Er is eigenlijk alleen behoefte aan een geschikteruimte, toezicht en een rooster. Er is nog niet veel ervaring opgedaan met deze vorm van toetsing. Menkan echter beargumenteren dat zij de organisatorische integratie van onderwijs en toetsing versterkt.

ToetslokaalVoor het kiezen van een geschikte ruimte en het beheer van een toetslokaal zal een oplossing moetenworden gevonden. Belangrijk is hierbij dat er geen misverstanden zijn over: welke toetsen in eentoetslokaal kunnen worden gedaan, op welke tijdstippen, en welke groepen daarvoor in aanmerkingkomen. Men kan zich voorstellen, dat in eerste instantie alleen herkansingen voor het toetslokaal inaanmerking komen.

177

Page 182: Verantwoord Meten In Het Gezondheidszorgonderwijs

Hoofdstuk 9

9.6.2 Kwaliteit van de organisatie van de toetsing

Het complete examen- en tentamenstelsel kan een object van evaluatie zijn (procesevaluatie). Er wordtkritisch gelet op de wijze waarop informatie over studieresultaten wordt verzameld, hoe deze wordtgeïnterpreteerd en de manier waarop beslissingen over leerlingen worden genomen.– Zijn de randvoorwaarden en reglementaire aangelegenheden expliciet en volledig? (te denken valt

aan constructie- en vaststellingsprocedures voor de toetsen, een beschrijving van de toegestanehulpmiddelen, afnamecondities, toezicht, maatregelen bij onregelmatigheden, beroepsprocedures,presentie- en herkansingsregels)

– Is wijze waarop de normering van de toetsen tot stand komt (d.w.z. de manier waarop prestatiesworden gewaardeerd en cijfers worden toegekend) adequaat geregeld?

– Zijn de regels met betrekking tot de correctie duidelijk en volledig?– Wordt er door in- en externe rapportage verantwoording over de toetsen afgelegd?– Zijn de procedures voor het nemen van belangrijke beslissingen voorafgaand, tijdens en na de

examinering vastgelegd?– Is er een commissie van beroep voor de examens ingesteld?

9.7 Financiële beslissingen

Wat betreft de financiële beslissingen voor de toetsing staat het management voor de volgendebeoordelingen:– Zal men de activiteiten met betrekking tot de toetsing zelf uitvoeren, of zal men ze uitbesteden?– Zal men de activiteiten met betrekking tot de toetsing per opleiding regelen of voor de gehele

onderwijsinstelling?– Zal men de activiteiten voor toetsing per instelling uitvoeren of met andere instellingen?– Welke hulpmiddelen worden bij de toetsing gebruikt?– Bij gebruik van een toetsenbank/itembank denkt men dan aan centraal of decentraal gebruik?– Is het toepassen van een toetsenbank/itembank gewenst, of denkt men eerder aan het ontvangen van

diensten van een extern toetsservicesysteem?De beslissing over deze aandachtspunten zal voor een groot deel afhangen van keuzen met betrekkingtot gewenste kwaliteit en de prijs, die daarvoor intern of extern betaald moet worden.De activiteiten kunnen worden ingedeeld in de volgende vier categorieën:– constructieactiviteiten– afname-activiteiten– analyse van afnamegegevens– het beheer van itembanksystemen.

9.7.1 Constructieactiviteiten

Wat betreft de constructieactiviteiten kan men stellen, dat een vraag snel geschreven is, maar datonderschat wordt hoeveel tijd en zorg een goede beoordeling en test van een vraag kost. Zodra meermensen in commissies (intern of extern) de vragen gaan beoordelen en op basis daarvan vragen moetenworden aangepast of geschrapt, nemen de kosten met sprongen toe.Eén vraag, die in 5 minuten wordt bedacht en in 5 minuten wordt opgeschreven, kost voor constructieslechts 1/6 van het uurloon van de constructeur.Een voorbeeld van kwaliteitsverhoging van de vraag bestaat als 3 mensen de vraag 5 minuten beoordelenen de vraag gezamenlijk 5 minuten bespreken, waarna één van de constructeurs de vraag aanpast in 5minuten. De constructie van de vraag komt nu op 3/4 van het uurloon van een constructeur. Dit is eenvoorbeeld van constructie van een zeer eenvoudige vraag, die nog niet eens is uitgetest. Als er wordt

178

Page 183: Verantwoord Meten In Het Gezondheidszorgonderwijs

Beslissingen en voorzieningen op managementniveau

verwacht dat de toetsconstructeurs uitgangsmateriaal zoeken en bespreken en dat de vragen die bij dituitgangsmateriaal behoren getest worden, dan kan men begrijpen dat constructie van toetsmateriaal eenkostbare zaak wordt. Bij het streven naar een verantwoorde meting wordt de toets zeer kritisch bekekenin relatie tot de te toetsen doelen. In de loop van de tijd worden daarbij afnamegegevens geanalyseerdom de statistische kwaliteiten van het meetinstrument te onderzoeken.Het management van een instelling zal onder invloed van de vraag uit de samenleving en de eisen vanuitde overheid een beslissing moeten nemen over de mate waarin aan kwaliteitseisen bij de toetsing voldaangaat worden.

9.7.2 Afname

De onderwijsinstelling kan de gehele afname uitbesteden. Een andere mogelijkheid is een gezamenlijkeregeling voor de afname met andere afdelingen binnen de onderwijsinstelling. Er kan een zelfstandigetoetslocatie opgezet worden in een van de verschillende locaties. Indien de afstanden voor kandidatenoverkomelijk zijn kan dit kosten besparen.Zoals al eerder gesteld, wordt de toetsing meer als onderdeel van het onderwijsleerproces ervaren,wanneer er meer toetsmomenten zijn, verspreid over de opleiding en de kandidaten meer keuze hebbenin het bepalen van de tijdstippen van toetsing.Het bepalen van een plaats voor de toetslocatie kan met deze verandering van de relatie toetsing/onder-wijs rekening houden, door de toetsing niet al te zeer afgescheiden van het onderwijs plaats te latenvinden.

9.7.3 Analyse van afnamegegevens

De waarde van statistische analyses neemt toe wanneer de analyse gebaseerd is op grote aantallengegevens. Daarom kan men stellen dat het verzamelen van gegevens over meer instellingen, het liefstlandelijk, de voorkeur geniet. Zeker waar kleine groepen leerlingen de toetsen maken, kunnenverzamelingen van gegevens van kleine groepen redelijke aantallen opleveren.Indien de keuze wordt gemaakt om afnamegegevens te bewaren en items ook statistisch te analyserenwordt aanbevolen om de organisatie daarvan op grote schaal aan te pakken. Daarbij kan men zowel deopzet van het onderzoek als het onderzoek zelf het beste uitbesteden aan deskundigen.

9.7.4 Beheer van een toetsenbank/itembank

Men kan op elke instelling een toetsenbank neerzetten voor de toetsing van niet extern gelegitimeerdecertificaateenheden. Voor de extern gelegitimeerde certificaateenheden is nog onduidelijk hoe de toetsenworden geconstrueerd en aangeleverd.Men kan ook de itembanken ergens centraal opslaan en beheren, met eventueel een netwerkverbindingtussen de verschillende afdelingen/instellingen. Hiermee wordt een meer of minder centraal systeembewerkstelligd.Centrale systemen kunnen rendement opleveren, doordat een groot deel van beheer- en opslagkostenkunnen worden gedeeld. De eerste ervaringen van de landelijke organen lijken erop te wijzen dat hetgebruik van een centraal gesitueerde itembank voordelen oplevert voor de betrokkenen.Daarnaast zijn er ook tekenen uit de praktijk, die erop wijzen dat gedistribueerde systemen uiteindelijkgoedkoper zijn, omdat men met minder ’schijven’ en beslislagen te maken heeft. Dit betreft materiaaldat vaak aangepast wordt, en dat beperkt gebruikt wordt.Omdat er nog weinig ervaring is opgedaan met het toepassen van grote systemen zal de praktijk moetenuitwijzen welke werkwijze het meest kostenbewust is.Het zou kunnen zijn dat afhankelijk van de soort toetsen en het aantal instellingen dat van dezelfdetoetsenbank/itembank gebruikmaakt, centrale of decentrale systemen de voorkeur genieten.

179

Page 184: Verantwoord Meten In Het Gezondheidszorgonderwijs

Geraadpleegde literatuur

Barrows, H. S. (1987).Simulated (standardized) patients and other human simulations: Acomprehensive guide to their training and use in teaching and evaluation. Chapel Hill, NC:Health Sciences Consortium.

Bartholomeus, P., & Graat, J. (1994).De rol van de simulatiepatient in het medisch onderwijs inMaastricht herzien: Hoe echter hoe beter(Doc: B4.FIN). Maastricht: Skillslab, RijksuniversiteitLimburg.

Bergen, J.B.A.M. van & Voeten, M.J.M. (1973)Onderwijsevaluatie met behulp van studietoetsen.Tilburg: Zwijsen, (Onderwijskundige brochurereeks 240).

Berkel, H.J.M. van & Bax, A.E. (red), (1993).Beoordelen in het onderwijs: een handleiding voor hetconstrueren van toetsen en het evalueren van leerdoelen en onderwijsvormen. Houten: BohnStafleu Van Loghum.

Bruyne, H.C.D. de (1983).Evalueren in de klas. Amsterdam: Van Goor.Carlisle, K.E. (1986).Analyzing jobs and tasks. Series: Techniques in training and performance

development. Englewood Cliffs (NJ): Educational Technology Publications.Creemers, B.P.M. & Hoeben, W.T.J.G. (red.) (1992).Indicatoren van onderwijseffectiviteit.

Groningen: ICO.Dochy, F.J. & Luyk, S.J. van (1987)Handboek vaardigheidsonderwijs. Lisse: Swets & Zeitlinger bv.Dochy, F.J. (1995). Toetsen doen een beroep op een mix van componenten.Tijdschrift voor

Onderwijs en Opvoeding, 54(3), 28-30.Dousma, T. & Horsten, A. (1980)Tentamineren. Groningen: Wolters-NoordhoffDrenth, P.J.D. & Sijtsma, K. (1990)Testtheorie: inleiding in de theorie van de psychologische test en

zijn toepassingen.Houten: Bohn Stafleu Van Loghum.Eggen, T.J.H.M. & Sanders P.F. (red) (1993).Psychometrie in de praktijk.Arnhem: Cito Instituut

voor Toetsontwikkeling.Geerligs, T. (1991). Scriptiebeoordeling.Onderzoek van onderwijs, 20(3), 35-38.Geerligs, T. (1991). Maatregelen ter verhoging van de betrouwbaarheid van scriptiebeoordelingen.

Onderzoek van onderwijs, 20(4), 51-53.Gelder, L. van, Peters, J.J., Oudkerk Pool, Th. & Sixma, J. (1971).Didactische Analyse. Groningen:

Wolters Noordhoff.Gramsbergen, Y. & Van der Molen, H.T. (1992).Gesprekken in organisaties.Groningen: Wolters

Noordhof.Gronlund, N.E. and Linn, R.L. (1990).Measurement and evaluation in teaching. New York:

Macmillan.Groot, A.D. (1975).Methodologie. ’s–Gravenhage: Mouton.Groot, A.D. de & Naerssen, R.F. van (1977).Studietoetsen: construeren, afnemen, analyseren.

’s–Gravenhage: Mouton.Gulmans, J. (1994).Leren diagnosticeren: Begripsvorming en probleemoplossen in (para-)medische

opleidingen. Amsterdam: Thesis.Hollands, L. (1993). Beoordelen van stages. In: H.J.M. van Berkel & A.E. Bax (red.),Beoordelen in

het onderwijs(69-75). Houten: Bohn Stafleu Van Loghum.Hoogenboom, J. & Ribot, C. (1993).Praktijk toetsen: constructie en beoordeling van praktische

opdrachten. Arnhem: Cito Instituut voor Toetsontwikkeling.Houtman, I.L.D. & Schinkelshoek, D. (1988).Toetsen van praktische vaardigheden: handleiding

voor docenten die opleiden voor medische en paramedische beroepen. Almere: Versluijs.Inklaar, Y. & Visser, E. (red.) (1995).Werken aan verbetering: kwaliteitsbewaking van het

onderwijsproces. Amsterdam: Hogeschool Amsterdam.Kessels, J.W.M. & C.A. Smit (red) (1984-1989).Handboek opleiders in organisaties.Deventer:

Kluwer.

180

Page 185: Verantwoord Meten In Het Gezondheidszorgonderwijs

Geraadpleegde literatuur

Kok, J., Krieken & R. van en Luijten, A.J.M. (1986).Het construeren van open vragen. AlgemenePublicatie Nr. 45, Arnhem: Cito Instituut voor Toetsontwikkeling.

Kraan, H.F. & Crijnen, A.A.M. (1987).The Maastricht History-taking and Advice Checklist.Amsterdam: Velder van den Hezelaar.

Luijk, S.J. van, Vleuten, C.P.M. van der & Schelven, R.M. van (1989). Observatietoetsen praktischgetoetst.Tijdschrift voor hoger onderwijs, 7(3), 101-109.

Luijk, S.J. van (1994).Al doende leert men: enkele studies naar aspecten van betrouwbaarheid envaliditeit over de toetsing van vaardigheden. Maastricht: Universitaire Pers Maastricht,Proefschrift Rijksuniversiteit Limburg.

Meer, K. van & Robroek, W. (red) (1987).Onderwijs in verpleegkundige vaardigheden – aspectenvan het vaardigheidsonderwijs in de verpleegkundige beroepsopleidingen. Lochem-Gent:De Tijdstroom.

Messick, S. (1995). Standards of validity and the validity of standards in performance assessment.Educational Measurement: Issues and Practice,(4), 5-8.

Nijeboer, J.J.B. en A.M.J.L. Feryn (1990). Differentiatie in aanpak van sectorale kwaliteitszorg. In:G.W.H. Heijnen e.a. (red.)Kwaliteitszorg – waarborg voor kwaliteit in het hoger onderwijs.Groningen: COWOG, 263-72.

Priestley, M. (1982)Performance assessment in education and training : alternative techniques.Englewood Cliffs: Educational Technology.

Prins, H.J. (1990).Aanwijzingen voor stagebeoordeling. Arnhem: Cito Instituut voorToetsontwikkeling.

Prins, R. & Schayck, C. van (1988).Instrumenten voor stagebeoordeling: tussentijds verslag van hetCitoproject Stagebeoordeling. (Interne documentatie 294). Arnhem: Cito Instituut voorToetsontwikkeling.

Reigeluth, C. M., & Schwartz, E. (1989). An instructional theory for the design of computer-basedsimulations.Journal of computer-based instruction, 16(1), 1-10.

Robroek, W.C.L. (1993).Vademecum voor integrale kwaliteitszorg in opleidingsinstituten voorinservice onderwijs. Utrecht: VOVB

Robroek, W.C.L. en Liebrand, C.G.M. (1994). Verantwoord meten van leerresultaten.Onderwijs enGezondheidszorg, 18(9), 167-170.

Romiszowski, A. J. (1981).Designining instructional systems. London: Kogan Page.Scheerens, J. (red) (1989).Evaluatie: over de kwaliteit van het onderwijs. Amsterdam: Swets &

Zeitlinger.Schotten, J.G.M. & Dekker, J. (1989).Toetsing van praktische verpleegkundige vaardigheden.

Interne documentatie 328.Arnhem: Cito Instituut voor Toetsontwikkeling.Schotten, J.G.M., Stolk, A.M.A., Ouborg, M. en Vermeulen, W. (1995).Praktijktoetsing op de

werkplek – Een onderzoek naar de mogelijkheid van het beoordelen van praktijkvaardigheden opde werkplek: de constructie van een beoordelingsinstrument.Arnhem: Cito Instituut voorToetsontwikkeling.

Schotten, J.G.M. (1992). Casusconstructie: getoetst aan de praktijk.Onderwijs & gezondheidszorg,16(9) p. 169-173.

Schotten, J.G.M. & Stolk, A.M.A. (1995). Praktijktoetsing op de werkplek.Onderwijs enGezondheidszorg, 19(4), 74-78.

Schotten, J.G.M. (1995). Opgavenbanken gezondheidszorgonderwijs.Onderwijs en Gezondheidszorg,19(9), 188-191.

Schotten, J.G.M., Janssen. M.C. & Joore, J. (1996). De toets – de praktijk...Onderwijs enGezondheidszorg, 20(4), 70-74.

Stolk, A. en Dekker J. (1986). Het gebruik van een casus bij schriftelijke toetsing.Onderwijs enGezondheidszorg, 10, 202-209.

181

Page 186: Verantwoord Meten In Het Gezondheidszorgonderwijs

Geraadpleegde literatuur

Straetmans, G.J.J.M. (1991). Prestatiebeoordeling door middel van work sample tests.Opleiding &Ontwikkeling, 4(5), 47-55.

Straetmans, G.J.J.M. (1993). Het vaststellen van competentie met vaardigheidstoetsen.Tijdschriftvoor Hoger Onderwijs, 11(3), 188-204.

Straetmans, G.J.J.M. (1994). Verantwoord meten van competentie in het gezondheidszorgonderwijs.Onderwijs en Gezondheidszorg, 18(9), 171-179.

Swanson, D.B. and Norcini, J.J. (1989). Factors influencing reproducibility of tests usingstandardized patients,Teaching and learning in medicine, Vol. 1 nr. 3, 158-166.

Tarenskeen, D. (1996).Classificeren van vragen, aanwijzingen voor het ontwerpen van eenclassificatiestructuur voor itembanken. Arnhem: Cito Instituut voor Toetsontwikkeling.

Theunissen, M.A.M en Pluimakers, M.J.H. (1989). De casustoets: een bijzonder toetsvorm,Onderwijs en Gezondheidszorg, 13(9), 267-271.

Timmermans, W.G. en Van Veldhoven, G.M. (red) (1990).De kwaliteit van het inservice-onderwijs.Lochem: De Tijdstroom.

Tomic, W. & Span, P. (1993).Onderwijspsychologie: beïnvloeding, verloop en resultaten vanleerprocessen.Utrecht: Lemma.

Verhoeven, N.G. & Beuk, C.H. (1983).Het construeren van meerkeuzevragen. Algemene PublicatieNr. 29. Arnhem: Cito Instituut voor Toetsontwikkeling.

Vermeulen, W. (1993).Toetsing van communicatieve vaardigheden.Proefschrift. Arnhem: CitoInstituut voor Toetsontwikkeling.

Werkgroep Docenten Onderwijszaken DOZ (1991).Toetsen en beoordelen. Culemborg: Phaedon.Wigdor, A.K. and Green, B.F. (1991).Performance assessment for the workplace. Washington, D.C.:

National Academy Press.Wijgh, I. (1990).Over en sluiten ... : de afsluiting van de basisvorming. Arnhem: Cito Instituut voor

Toetsontwikkeling.Wopereis, I.G.J.H. (1996).De ontwikkeling van een (live) patiëntsimulatie ten behoeve van toetsing

en instructie in het gezondheidszorgonderwijs.Doctoraalverslag. Universiteit Twente.Wopereis, I.G.J.H. & Schotten, J.G.M. (1996). Instructie en toetsing in de gesimuleerde

beroepspraktijk: de (live) patiëntsimulatie.Onderwijs & gezondheidszorg 20(10), p. 197-201.Zemke, R., & Kramlinger, T. (1982).Figuring things out. A trainer’s guide to needs and task

analysis.Reading (Ma): Addison-Wesley Publishing Company.

182

Page 187: Verantwoord Meten In Het Gezondheidszorgonderwijs

Index

Aaanvaardbaarheid 39, 41absolute norm 66, 160adaptief, adaptieve toetsing 172afleider 47, 86-93afname 26-30, 30, 155, 178afsluiting 14alpha 28, 157alternatieven 47, 86-93ankeritems 160ankers 83antwoordmodel 94-103arbeidsovereenkomst 143

Bbeeldplaat 23, 52, 110 e.v.begripsvaliditeit 35, 60beoordelaarsinstructie 92, 100beoordelaarsovereenstemming,zie inter-

beoordelaarsbetrouwbaarheidbeoordelingsaspecten 78-81, 127-139beoordelingscriteria 78, 124beroepsbegeleidend 143beroepshouding 16, 141, 143, 146beroepsopleidend 143beroepspraktijkvorming 143-151beroepsprofiel 15besliskunde 34betrouwbaarheid 26betrouwbaarheid van toetsvormen 44-58betrouwbaarheidscoëfficiënt 26bias 155

Ccalibratie 69, 163case, casuïstiek 56casustoetsen 23, 49, 104certificaateenheden 4, 174, 178certificaten 4, 14, 173certificeren 14cesuur 35, 65, 66, 67, 84, 160, 161checklist 82, 122cijfer 6, 32, 73, 159, 162, 174civiel effect 3classificatie, interne differentiatie 12classificatie, itembankstructuur 68, 69, 176cognitie, cognitieve vaardigheden

16, 19, 38, 51, 63, 79commissie van beroep 177communicatieve vaardigheden,zie interactieve

vaardigheden

compensatie 59, 84, 162computer based testing 172computersimulatie 23, 52, 110-115conjunctief 59, 84, 162correctie 72, 101, 155correctie voor raden 67correctievoorschrift 92, 100correlatie, correlatiecoëfficiënt 26, 39criteriumvaliditeit 38, 60critical incident 77curriculum 5, 162curriculumevaluatie 162curriculumniveau 5, 59

DDelphi 77diagnostisch 13, 60, 161dichotoom 28, 137didactisch proces 8-10didactische analyse 2, 9, 163discriminatie(-index), discrimineren

30, 43, 65, 157disjunctief 59, 84, 162documentstudie 77doelstellingen, zie leerdoelendoorstroming 14doorstroomkwalificatie 15driekeuzevragen 48, 158dubbele ontkenning 91, 92, 93, 102

Eeffectiviteitsscore 113efficiëntie 39, 41, 49, 65, 90efficiëntiescore 113eindtermen 15essayvragen (zie ook opstelvragen) 49evaluatie, curriculum- 162evaluatie, proces- 74, 80, 120, 135, 153evaluatie, product-

74, 79, 80, 83, 120, 135, 153evaluatie, zelf- 146, 149, 174examenprogramma 3examenvrees 31examinator 72externe kwaliteitszorg 173externe legitimering 3, 59, 73, 145, 174

Ffalse negative 34false positive 34fantoomkop (zie ook simulator) 54, 116, 124

183

Page 188: Verantwoord Meten In Het Gezondheidszorgonderwijs

Index

feedback 13, 14, 160, 161financiële consequenties 45, 177fit 20flexibel, flexibilisering 67, 164, 167, 171, 176focusgroep 77formatief, formatieve 13, 65functie van toetsen 10-14functie van toetsen en kwaliteitseisen 60functie-eisen 144, 149

Ggedwongen raden 67, 92, 155geheimhouding 69, 172gegevensverwerking 155generaliseerbaarheid 120gesloten vragen (zie ook meerkeuzevragen)

23, 47, 67, 86-93, 155-159gokken, gokkans 48, 66, 92

Hhalo-effect 155herkansing 14, 59herordeningsvraag 89houding(beroeps-) 16, 141, 143, 146

Iidentificatievragen 96inhoudsvaliditeit 36, 42, 47, 60, 93, 102instroom 15, 163integratie van onderwijs en toetsing 176integratie van vaardigheden 23, 50interactieve toetsing 53interactieve vaardigheden 16, 19, 38, 140interbeoordelaarsbetrouwbaarheid 25, 84, 134interne consistentie 26, 28, 157interne kwaliteitszorg 173intersubjectiviteit 24interview 77invulvraag 88inzicht (kennis/toepassing/-) 37, 106itemanalyse (toets- en -) 157itembank, itembanksysteem 68-73,

163, 172, 176, 178

Jja/nee-vraag 48, 88jaarklassensysteem 6, 162

Kkennis (-/toepassing/inzicht) 37, 106kort-antwoord-vraag 94, 95, 100KR-20 28, 29

KR-21 29, 159kwalificatie, kwalificatiestructuur 4, 15kwaliteit van toetsing 157kwaliteit van onderwijs 163kwaliteitseisen t.a.v. metingen 24, 39kwaliteitseisen m.b.t. toetsfuncties 60kwaliteitszorg 168-177

Llang-antwoord-vraag 95lay-out 40, 86, 93, 103leerdoelen 9, 17, 20, 15-23, 35-38leerlingvolgsysteem 163logistiek 45

Mmanagementniveau 5, 165mastery learning 13, 161meerkeuzevragen,zie gesloten vragenmeetfout 30-35module, moduleren 4, 60, 160, 162moeilijkheid, moeilijkheidsgraad

28, 65, 73, 90, 158, 172

Nnatuurgetrouwheid 21, 23, 61normeren 72, 159normhandhaving 160, 167, 172

Oobjectiviteit 24, 25, 90, 155observatie 56, 77, 139omvattendheid 21, 61onderwijs- en examenregeling 6, 59, 173onderwijsleerproces 14onderwijsleersituatie 9, 161onderwijsovereenkomst 143open vragen 23, 48, 49, 94-103, 155-157opgavenbank, zie itembankopstelvragen (zie ook essayvragen) 95

Pp-waarde (zie ook moeilijkheidsgraad)

28, 65, 158paper & pencil,zie potlood-en-papierparalleltoets 26, 27, 73parallelvorm-methode 27patiëntsimulatie 23, 55, 125-134plaatsing, plaatsingstoetsen 11potlood-en-papier 23, 50, 108-109praktijkbegeleider 144 e.v.praktijkdocent 144 e.v.

184

Page 189: Verantwoord Meten In Het Gezondheidszorgonderwijs

Index

praktijkovereenkomst 143praktijktoetsing op de werkplek 23, 56, 135-142praktijkverslag 144, 146predictieve validiteit 35, 38procesbeheersing 169-171procesevaluatie 74, 80, 120, 135, 153processtation 121productscale 83productanalyse 78productevaluatie 74, 79, 80, 83, 120, 135, 153productie (vs. reproductie) 16, 37productiekosten 45productievragen 97productstation 122psychomotorische vaardigheden 16, 38

Rraden 48, 66, 92raden, gedwongen - 67, 92, 155ratingscale 82, 83reactieve vaardigheden 16, 19, 38relatieve norm 66, 160remediëren 13, 161rendement 14, 162representativiteit 21, 36, 38, 44, 79reproductie 16, 37reproductievragen 96ROC 165Romiszowski 15 e.v.

Sschalen, schaalvormen 77, 82 e.v.scoringsvoorschrift 84, 101, 102scriptie 146, 152-154selectie 11-14, 161sequentie-effect 25, 156serievraag 96simulatie,zie patiëntsimulatie en

computersimulatiesimulator 23, 54, 116-119skill sample 23, 55, 120-124skillslab,zie stationsmodelslaagpercentage 161, 164slagen 14, 29specificiteit 39, 90splitsingsmethode 27stage,zie beroepspraktijkvormingstandaarddeviatie 29, 32standaardisatie 25, 41, 125, 155standaardmeetfout 30-35stationsmodel 56, 120-124, 127stellingvraag 88

studielast 162studiepunten 162subjectiviteit 24, 84summatief 14

Ttaakanalyse 76, 126taakspecificiteit 120taxonomie 15, 19test-hertest-methode 27toepassing (kennis/-/inzicht) 37, 106toets- en itemanalyse 157toetsafname 30, 43, 155toetsconstructie 42, 167, 175toetsenbank 67, 68, 164, 172, 176, 178toetsinhouden 59, 60toetsmatrijs 63, 68, 72toetsresultaten 156-164toetsservicesysteem 68, 69toetsvormen 20-23, 44-58, 61transparantie 39tweekeuzevraag 48, 88, 92tweestellingenvraag 88

Uuitstroom 3uitvoeringsniveau 6, 63, 86, 155

Vvaardigheidstoetsen 74validiteit 35-39, 41-42variantie 28, 157vierkeuzevraag 48, 86, 91, 92, 158visitaties 3volgorde-effect 25volgorde van alternatieven 91volgorde van vragen in een toets 106vrije verwerkingsvraag 98

Wwaar/onwaar 88ware score 30-34WEB 3, 59, 69, 72, 143, 174weging 66, 84, 162work sample 23, 56, 57, 135-142

Zzakken 14, 29, 60, 65zelfevaluatie 146, 149, 174

185

Page 190: Verantwoord Meten In Het Gezondheidszorgonderwijs

Index

186

Page 191: Verantwoord Meten In Het Gezondheidszorgonderwijs

Voorwoord

Meten vervult binnen het onderwijs een belangrijke functie. Het belang van die plaats wordt vooralsnogin sterke mate bepaald door de beslissingen die op ’meten’ worden gebaseerd. De mogelijkheden vanmeten reiken echter verder en het is uitermate zinvol om aan die ruimere mogelijkheden aandacht tebesteden.Ook met betrekking tot het stimuleren van leerprocessen, op het gebied van hulp bieden bijstudieproblemen, ten aanzien van informatie ten behoeve van het verbeteren van programma’s kunnenmetingen een bijzonder nuttige functie vervullen en alleen al op die grond is een handboek zoals hiergepresenteerd van veel belang.Hierboven werd onderscheid gemaakt tussen meten zonder en ’meten’ met aanhalingstekens. Daarmeewerd verwezen naar het onderscheid tussen verantwoord meten zoals dat in dit boek wordt bedoeld en’meten’ zoals dat binnen het onderwijs nog wel eens plaatsvindt. Er is een duidelijke spanning tussentoetsen die voldoen aan de eisen die daaraan in alle redelijkheid gesteld kunnen worden en toetsen diebinnen het onderwijs een plaats hebben gekregen. Men krijgt wel eens de indruk dat het maken vantoetsen schromelijk wordt onderschat. Het aantal ’fouten’ dat men kan maken, is aanmerkelijk groter danmeestal wordt gedacht. Daar staat echter tegenover dat er inmiddels vele mogelijkheden beschikbaar zijnom toetsen binnen het onderwijs een gezonde basis te geven.’Verantwoord meten in het gezondheidszorgonderwijs’ bevat een groot aantal suggesties omverbeteringen aan te brengen bij ’toetsen in het kader van het onderwijs’.Het belang van toetsen voor de toekomst van de studerenden maakt het noodzakelijk dat aan de kwaliteitde uitgangspunten van ’verantwoord meten’ ten grondslag worden gelegd.Dit handboek voor de beoordeling van leerresultaten biedt vele handreikingen.

W.H.F.W. Wijnen

v

Page 192: Verantwoord Meten In Het Gezondheidszorgonderwijs

vi

Page 193: Verantwoord Meten In Het Gezondheidszorgonderwijs

Inhoudsopgave

1 Uitgangspunten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.1 Aansluiting bij de praktijk. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.1.1 Het model ’didactische analyse’: geen gesloten model. . . . . . . . . . . . . . . . . . 21.1.2 De input vanuit de beroepspraktijk in het model. . . . . . . . . . . . . . . . . . . . . . 21.1.3 De input vanuit de maatschappij in het model. . . . . . . . . . . . . . . . . . . . . . . . 31.1.4 Aansluiting van de kwalitatieve en kwantitatieve uitstroom bij de behoefte van

het werkveld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41.1.5 Aansluiting van verschillende opleidingen op elkaar: modulen en

certificaateenheden. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41.2 Een gezamenlijke verantwoordelijkheid. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.2.1 Managementniveau: facilitering (procesbeheersing/procesinrichting). . . . . . . . . 51.2.2 Curriculumniveau: aansturing. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.2.3 Uitvoeringsniveau: constructie/aanschaf, afname/verwerking, beoordeling. . . . . 6

1.3 Leeswijzer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2 De plaats van meten en beoordelen in het didactisch proces. . . . . . . . . . . . . . . . . . . . . . . 82.1 Meten en beoordelen: een begripsbepaling. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82.2 Het didactisch proces: de relatie tussen leerdoelen, beginsituatie, onderwijsleersituatie en

toetsing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92.3 De functie van toetsen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.3.1 Selectiemiddel voor plaatsing. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112.3.2 Classificatie of externe differentiatie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122.3.3 Interne differentiatie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122.3.4 Feedbackfunctie voor de individuele leerling: diagnostisch. . . . . . . . . . . . . . . 132.3.5 Feedbackfunctie voor het onderwijsleerproces (opleider): evaluerend. . . . . . . . 142.3.6 Selectiemiddel voor afsluiting: certificerend. . . . . . . . . . . . . . . . . . . . . . . . . 14

2.4 Eisen voor de formulering c.q. de concretisering van eindtermen/leerdoelen alsvoorwaarde voor een verantwoorde toetsing en beoordeling. . . . . . . . . . . . . . . . . . . . 152.4.1 Het ontwikkelen van eindtermen vanuit de kwalificatiestructuur. . . . . . . . . . . 152.4.2 Taxonomie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152.4.3 Leerdoelen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172.4.4 Het toetsen van kennis en vaardigheden. . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.5 Ordeningsmogelijkheden voor toetsvormen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202.5.1 Aansluiting bij de leerdoelen: de ’fit’. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202.5.2 Aansluiting bij de beroepspraktijk: de representativiteit. . . . . . . . . . . . . . . . . 21

3 Kwaliteitseisen voor de toets als meetinstrument. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243.1 Objectiviteit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243.2 Betrouwbaarheid. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

3.2.1 Schatting van de betrouwbaarheidscoëfficiënt. . . . . . . . . . . . . . . . . . . . . . . . 263.2.2 Meetfouten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303.2.3 De standaardmeetfout. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3.3 Validiteit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353.3.1 Validiteitsaspecten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 363.3.2 Relatie validiteit en betrouwbaarheid. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

3.4 Overige kwaliteitseisen: efficiëntie, transparantie, aanvaardbaarheid en specificiteit . . . 393.5 Het spanningsveld tussen betrouwbaarheid, validiteit en efficiëntie. . . . . . . . . . . . . . . 413.6 Aandachtspunten ter verhoging van de kwaliteit van een meetinstrument. . . . . . . . . . . 42

vii

Page 194: Verantwoord Meten In Het Gezondheidszorgonderwijs

Inhoudsopgave

4 Indeling en beschrijving van kenmerken van toetsvormen. . . . . . . . . . . . . . . . . . . . . . . . . 444.1 Eigenschappen van toetsvormen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

4.1.1 Representativiteit. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 444.1.2 Betrouwbaarheid. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 444.1.3 Organisatie/logistiek. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 454.1.4 Financiële consequenties. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 454.1.5 Een schematische weergave. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

4.2 De kenmerken van de verschillende toetsvormen. . . . . . . . . . . . . . . . . . . . . . . . . . . 464.2.1 Toetsen met gesloten vragen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 474.2.2 Toetsen met open vragen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 484.2.3 Casustoetsen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 494.2.4 Potlood-en-papier-toetsen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 504.2.5 Computersimulatie, beeldplaat. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 524.2.6 Simulator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 544.2.7 Skill sample test. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 554.2.8 Patiëntsimulatie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 554.2.9 Work sample test / praktijktoetsing op de werkplek. . . . . . . . . . . . . . . . . . . . 56

5 Beslissingen en activiteiten op curriculumniveau. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 595.1 Onderwijs- en examenregeling. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

5.1.1 Toetsinhouden. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 605.1.2 Toetsmomenten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 605.1.3 Toetsvormen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

6 Uitvoeringsniveau: algemene richtlijnen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 636.1 Stappenplan voor de constructie van kennistoetsen. . . . . . . . . . . . . . . . . . . . . . . . . . 636.2 De constructie van kennistoetsen met behulp van een toetsenbank. . . . . . . . . . . . . . . 676.3 Stappenplan voor de constructie van vaardigheidstoetsen. . . . . . . . . . . . . . . . . . . . . . 74

7 Uitvoeringsniveau: specifieke richtlijnen per toetsvorm. . . . . . . . . . . . . . . . . . . . . . . . . . . 867.1 Gesloten vragen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

7.1.1 Vraagformulering. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 867.1.2 Vraagtypen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 877.1.3 Algemene eisen aan gesloten vragen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 907.1.4 Relevante aspecten om aandacht aan te besteden bij standaard–meerkeuzevragen 907.1.5 Correctievoorschrift. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 927.1.6 Screening. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

7.2 Open vragen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 947.2.1 Vraagvormen naar lengte van het antwoord. . . . . . . . . . . . . . . . . . . . . . . . . 947.2.2 Indeling naar complexiteit van het antwoord. . . . . . . . . . . . . . . . . . . . . . . . . 967.2.3 Indeling open vragen naar gedragscategorie. . . . . . . . . . . . . . . . . . . . . . . . . 967.2.4 Eisen voor de formulering. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 987.2.5 Correctievoorschrift. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1007.2.6 Screening. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

7.3 Casustoets. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1047.3.1 Randvoorwaarden. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1047.3.2 De drie pijlers van een casus. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1047.3.3 De doelstellingen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1047.3.4 Van doelstellingen naar beschrijving. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1047.3.5 De opbouw van een beschrijving. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

viii

Page 195: Verantwoord Meten In Het Gezondheidszorgonderwijs

Inhoudsopgave

7.3.6 Van doelstellingen naar vragen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1057.3.7 De relatie tussen de beschrijving en de vragen. . . . . . . . . . . . . . . . . . . . . . . 1067.3.8 De vragen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

7.4 Potlood-en-papier-toets. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1087.4.1 Ontwerpvaardigheden. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1087.4.2 Afleesvaardigheden. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1087.4.3 Combinatie van vaardigheden. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

7.5 Computersimulatie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1107.5.1 Doelgroep en toetsdoel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1107.5.2 Toetsbeschrijving. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1107.5.3 Beschrijving van het scoringssysteem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1137.5.4 Bruikbaarheid. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1137.5.5 Kwaliteitsbeschrijving . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1147.5.6 Toepassingen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

7.6 De simulator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1167.6.1 Doelgroep en toetsdoel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1167.6.2 Toetsbeschrijving. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1167.6.3 Beschrijving van het scoringssysteem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1177.6.4 Bruikbaarheid. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1187.6.5 Kwaliteitsbeschrijving . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1187.6.6 Toepassingen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

7.7 Skill sample test. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1207.7.1 Inleiding: stationsmodel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1207.7.2 Toetsbeschrijving. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1207.7.3 Beschrijving van het scoringssysteem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1227.7.4 Bruikbaarheid. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1237.7.5 Kwaliteitsbeschrijving . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

7.8 Patiëntsimulatie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1257.8.1 Geschiktheid. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1257.8.2 De simulatiepatiënt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1267.8.3 Voorbeeld. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1267.8.4 Kwaliteitsbeschrijving . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

7.9 Work sample test. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1357.9.1 De analyse van de vaardigheid in aspecten en eventuele criteria. . . . . . . . . . . 1357.9.2 De beoordelaars. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1367.9.3 Onderzoek. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136

7.10 Beroepspraktijkvorming en de beoordeling daarvan. . . . . . . . . . . . . . . . . . . . . . . . . 1437.10.1 Beoordeling van praktijkplaatsen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1437.10.2 Praktijkvormingsdoelen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1447.10.3 Een verantwoorde praktijkbeoordeling. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1457.10.4 Het praktijkverslag. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1467.10.5 De observatielijst praktisch handelen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1477.10.6 De functie-eisenlijst beroepsgeschiktheid. . . . . . . . . . . . . . . . . . . . . . . . . . . 1497.10.7 Het tussentijdse gesprek, het afsluitende gesprek en de eindbeoordeling. . . . . . 149

7.11 Scriptie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1527.11.1 Inleiding. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1527.11.2 Globale en analytische beoordelingen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1527.11.3 De scriptie-beoordelingslijst. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152

ix

Page 196: Verantwoord Meten In Het Gezondheidszorgonderwijs

Inhoudsopgave

8 Uitvoeringsniveau: afname, correctie, resultaatbeoordeling. . . . . . . . . . . . . . . . . . . . . . . . 1558.1 Richtlijnen voor de afname(condities). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1558.2 Richtlijnen voor de gegevensverwerking en correctie. . . . . . . . . . . . . . . . . . . . . . . . 1558.3 De beoordeling van toetsresultaten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156

8.3.1 Richtlijnen voor de beoordeling van de kwaliteit van toetsen. . . . . . . . . . . . . 1578.3.2 Richtlijnen voor de beoordeling van toetsresultaten. . . . . . . . . . . . . . . . . . . . 1598.3.3 Normeren. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1598.3.4 Toetsresultaten en de feedbackfunctie voor de leerling. . . . . . . . . . . . . . . . . . 1608.3.5 Toetsresultaten en de feedbackfunctie voor de onderwijsleersituatie (opleider) . 1618.3.6 Toetsresultaten ten behoeve van selectiedoeleinden. . . . . . . . . . . . . . . . . . . . 1618.3.7 Toetsresultaten als bijdrage aan de curriculumevaluatie. . . . . . . . . . . . . . . . . 1628.3.8 Toetsresultaten als kwaliteitsindicatie voor het onderwijs en de

onderwijsorganisatie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163

9 Beslissingen en voorzieningen op managementniveau. . . . . . . . . . . . . . . . . . . . . . . . . . . . 1659.1 Onderwijsinstelling en omgeving: een analyse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1659.2 Een vertaling van deze invloeden naar ’toetsing’. . . . . . . . . . . . . . . . . . . . . . . . . . . 166

9.2.1 Inhoud van de toetsing. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1669.2.2 Organisatie van de toetsing. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1679.2.3 Hulpmiddelen bij de toetsing. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167

9.3 Werkwijze en kwaliteitszorg. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1689.3.1 Procesbeheersing. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1699.3.2 Werken met ’documenten’. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170

9.4 Document 1: Beleid en streefdoelen voor de toetsing. . . . . . . . . . . . . . . . . . . . . . . . 1719.4.1 Aanwijzingen voor invulling. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1719.4.2 Kwaliteitszorg. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173

9.5 Document 2: Onderwijs- en examenregeling. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1739.5.1 Aanwijzingen voor invulling. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1739.5.2 Kwaliteit van de onderwijs- en examenregeling. . . . . . . . . . . . . . . . . . . . . . . 174

9.6 Document 3: Organisatie van de toetsing. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1759.6.1 Aanwijzingen voor invulling. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1759.6.2 Kwaliteit van de organisatie van de toetsing. . . . . . . . . . . . . . . . . . . . . . . . . 177

9.7 Financiële beslissingen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1779.7.1 Constructieactiviteiten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1779.7.2 Afname . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1789.7.3 Analyse van afnamegegevens. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1789.7.4 Beheer van een toetsenbank/itembank. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178

Geraadpleegde literatuur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179

Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182

x