pedagogischekringleuven.files.wordpress.com€¦ · Web view2020. 9. 24. · Sigmund Freud...
Transcript of pedagogischekringleuven.files.wordpress.com€¦ · Web view2020. 9. 24. · Sigmund Freud...
Definitie, classificaties en toepassingen van de testhandboek pp. 38-41, 61-72, 76-96, 106-113
definitie test:
een test is een systematisch classificatie of meetprocedure waarbij het mogelijk is uitspraken te
doen over een of meerdere empirisch-theoretisch gefundeerde eigenschappen van de
onderzochte of over specifiek niet-testgedrag, dor uit te gaan van een objectieve verwerking van
reactie van hem, in vergelijking tot anderen, op een aantal gestandaardiseerde zorgvuldig
gekozen stimuli
Psychologisch metenpsychodiagnostiek is een vorm van meten
- assumptie: psychologische constructen bestaan en kunnen gemeten worden
- wetenschap van psychologisch meten = psychometrie
- diverse types meetinstrumenten beschikbaar (o.m. observatie, interview, taak): tests als
meetlatten voor psychologische eigenschappen
psychologische eigenschappen worden ondersteund door theorieën
- de test die men ontwerpt om een eigenschap te meten valt niet samen met de eigenschap
we proberen zo hier zo dicht mogelijk bij te komen, om een valide test te ontwikkelen
- de test is een in mindere of meerdere mate geslaagde poging om een goede schatting van de
eigenschap te maken
om psychologische eigenschappen te meten, moeten verschillende stappen doorlopen worden:
- identificatie van de te meten eigenschap
- operationalisering van de te meten eigenschap
- onderzoek en kwantificering van reacties
- terugkoppeling naar de theorie
stap 1: identificatie van de te meten eigenschap- de theorie(ën) met betrekking tot de eigenschap in kaart brengen bijv. theorieen/definities
rekenvaardigheid
- kiezen welke theorie het uitgangspunt van de test zal worden
- probleem: voor sommige eigenschappen is theorievorming beperkt of onduidelijk
Stap 2: operationalisering van de te meten eigenschapWe gaan opzoek naar een reeks van gedragingen waaruit de eigenschap blijkt voor te komen
- = specificatie van de operaties die nodig zijn om de eigenschap te meten
- definitie van een domein van gedragingen die typisch zijn voor de bedoelde eigenschap (bv.
rekenvaardigheid: optellen, aftrekken, vermenigvuldigen, delen)
- keuze van stimuli die aan de proefpersoon kunnen worden voorgelegd om reacties uit te
lokken die een indicatie geven van de te meten eigenschap (= items)
• uitspraken over het eigen gedrag in relatie tot de eigen persoonlijkheid
(persoonlijkheidsvragenlijsten)
• taken (intelligentietests) opdracht voor elke soort bewerking
• vragen (vaardigheidstests)
stap 3: onderzoek en kwantificering van reacties- reacties van de persoon op de items geven informatie over de te meten eigenschap
antwoorden (bijv 1+1=2)
- reacties zijn in eerste instantie kwalitatief (woorden, gedragingen) en moeten
gekwantificeerd worden
• uitgangspunt: bij items is het zo dat antwoorden van elkaar verschillen in het
niveau van de achterliggende eigenschap dat ze aangeven
• kwantificering bestaat erin dat men aan reacties van een hoger niveau een
hogere numerieke waarde toekent 1 = juist, 0 = fout
• de veronderstelling dat een hogere score overeenstemt met een hoger niveau
van de eigenschap kan getoetst worden aan de hand van statistische
testmodellen
- in de constructiefase van een test wordt een proefversie voorgelegd aan een steekproef van
proefpersonen
- daarna worden itemscores geanalyseerd met behulp van een of meerdere testmodellen, die
specificeren aan welke eisen de gegevens dienen te voldoen
(bijv. als we ervan uitgaan dat items naar dezelfde eigenschap peilen, verwachten we
positieve correlaties van ongeveer dezelfde grootte ertussen)
stap 4: terugkoppeling naar de theorie- als uit de statistische analyses blijkt dat de test aan de technische vereisten voor een
geslaagde meting voldoet en de bedoelde eigenschap meet, biedt dit eveneens
ondersteuning voor de theorie
- ook niet-succesvolle testconstructie kan bijdragen tot theorie-ontwikkeling (herziening of
keuze voor rivaliserende theorie)
kwaliteit van test: test die meet wat hij beoogt te meten
Psychologische test: definitie en onderdelenTest= wetenschappelijk onderzoek
Een psychologische test is “een systematisch onderzoek van gedrag met behulp van speciaal
geselecteerde vragen of opgaven, met de bedoeling inzicht te krijgen in een psychologisch
kenmerk van de betrokkene in vergelijking met anderen” (Drenth & Sijtsma, 2006, p. 40)
- systematische werkwijze
- steekproef van gedragingen (omdat je nooit alle gedragingen kan testen)
- doel = uitspraak over individu
(voorspelling bv. het effect van therapie,
Classificatie diagnose toewijzen,
beschrijving)
- vergelijking met grote representatieve groep (eigen score in tabel situeren)
“A psychological test is the measurement of a sample of behavior obtained under standardized
conditions and that has established rules for scoring or interpreting this sample” (Anastasi, 1988)
- steekproef van gedragingen
- gestandaardiseerde condities (= systematisch, altijd hetzelfde)
- uitgewerkte regels voor scoring en interpretatie
Een verantwoorde en gepubliceerde test heeft doorgaans volgende onderdelen:
- testmateriaal
- testformulieren
- testhandleiding
testmateriaal
- kan erg divers zijn
- soms geen tastbaar materiaal
(testmateriaal WPPSI III) (wereldtest)
(tekentest) (inktvlekkentest)
testformulieren
- voor het verzamelen van materiaal (antwoorden, reacties, gedragsgegevens) waarop de
interpretaties en conclusies gebaseerd zullen worden
- in te vullen door respondent (de geteste persoon) of proefleider
testhandleiding
- grote variatie in uitvoerigheid
- vier basisingrediënten
• testinstructie (concrete gang van zaken tijdens het testonderzoek)
• verwerkingsprocedure (toekenning numerieke scores aan antwoorden en
reacties op de opgaven)
• normtabellen (scores van representatieve normgroep waarmee scores van de
geteste persoon vergeleken kunnen worden)
• informatie over wetenschappelijke kwaliteit van de test (betrouwbaarheid,
validiteit)
- voor scoring wordt soms gebruik gemaakt van een plastic sleutel
Plastieksleutel
- minder gebruikt
- elektronische verwerking/ afnamen
- antwoorden vergelijken met gewenste antwoorden
- punten toekenning
Classificatie van psychologische testsTests kunnen op verschillende manieren ingedeeld worden:
- volgens instructie en afneming
- volgens de aard van de testvragen
- volgens testgedrag
classificatie volgens instructie en afnemingindividuele tests versus groepstestsindividuele test: testleider formuleert vragen/opdrachten en registreert reacties/prestaties van
de onderzochte tijdens een individueel contact
populair in Europa
voordelen:
onderzochte kan gestimuleerd worden indien nodig
testleider kan nagaan of onderzochte instructies begrepen heeft
mogelijkheid tot observatie en verzamelen kwalitatieve gegevens
groepstest: testleider geeft collectieve instructie voor hele groep tegelijk, surveilleert, geeft
aanwijzingen tijdens afname en zamelt de voltooide opgaven in
moeilijker bij jonge kinderen en bij patiënten
optimale groepsgrootte hangt af van aard test, doel onderzoek en leeftijd
onderzochte groep
geen 1:1 interactie
proces/ redenering proefpersoon worden niet gevolgd door testleider
voordelen:
efficiënt, besparing van tijd en geld
snelheidstests versus niveautests snelheidstest: peilt naar snelheid waarmee de onderzochte kan werken
- maat = aantal opgaven dat onderzochte kan voltooien binnen bepaalde tijd
- aantal opgaven is groter dan wat de meeste mensen binnen de voorziene tijd kunnen
voltooien
- opgaven hebben vaak ongeveer zelfde moeilijkheidsgraad
- opgaven zijn makkelijk zodat er nauwelijks fouten gemaakt worden
niveautest: peilt naar het prestatieniveau dat de onderzochte behaalt
- maat = aantal correct opgeloste opgaven
- opgaven variëren in moeilijkheidsgraad
- opgaven worden meestal in volgorde van oplopende moeilijkheidsgraad voorgelegd
- er wordt geen tijdsdruk opgelegd
classificatie volgens aard van de vragencultuurvrije versus niet-cultuurvrije tests
cultuurvrije test: test die (vrijwel) geen appèl doet op vaardigheden/eigenschappen
die door cultuur en onderwijs worden beïnvloed
vaak nonverbaal, omdat taal bij uitstek cultuurbepaald is
bij uitstek geschikt voor onderzoek naar verschillen tussen volkeren en
culturen in psychologische eigenschappen
gradueel begrip: volledig cultuurvrije tests bestaan niet
voorbeeld: Raven Progressive Matrices
niet-cultuurvrije test: test die een appèl doet op condities die door cultuur en
onderwijs worden beïnvloed
verbale tests zijn bijna vanzelfsprekend niet-cultuurvrij
ook veel niet-verbale tests zijn cultuurbepaald (bijv. verwijzing naar westerse
schoolcontext)
directe versus indirecte tests directe test: test waarbij het voor de onderzochte duidelijk is wat men wil meten of
voorspellen
proef persoon weet wat er getest wordt en dat hij getest wordt
prestatieniveautests
vorderingentests
biografische informatievragenlijsten
opinievragenlijsten
attitudetests, ...
indirecte test: test waarbij het voor de onderzochte niet duidelijk is wat men wil
meten of voorspellen
proef persoon weet niet dat hij getest wordt of wat er getest wordt
test wordt geïnterpreteerd
projectieve methoden
Rorschach voorgesteld als ‘fantasietest’ (creativiteit en onderbewust zijn
Boomtest voorgesteld als ‘tekentest’
vragenlijsten met indirecte vragen
tests met vrije antwoorden versus keuzeantwoorden test met vrije antwoorden: test waarbij de onderzochte zelf het antwoord moet
bedenken en formuleren
= open vragen
= ongecodeerde vragen
test met keuze-antwoorden: test waarbij de onderzochte verzocht wordt een keuze
te maken uit vooraf door de testconstructeur geformuleerde
antwoordmogelijkheden
= gesloten vragen
= geprecodeerde vragen
Classificatie volgens testgedragtests voor prestatieniveau versus tests voor gedragswijze
tests voor prestatieniveau van de onderzochte persoon wordt een maximale prestatie gevraagd
duidelijke norm voor wat ‘goed’ is en wat ‘fout’
meting van intelligentie, cognitieve capaciteiten, kennis, inzicht,…
categorie 1: enkelvoudige algemene niveautests
meten ‘general ability’ (algemene bekwaamheid) en leiden tot één indicatie
van intelligentie
doel = algemene niveaubepaling, niet differentiatie in deelaspecten
drie soorten
ontwikkelingstests en individuele intelligentietests voor kinderen
bijv. Wechsler Intelligence Scale for Children (WISC-III)
o zeer jonge kinderen
o ontwikkelingsniveau meten
individuele intelligentietests voor volwassenen
bijv. Kaufmann Adolescent and Adult Intelligence Test (KAIT)
algemene collectieve intelligentietests
bijv. Nederlandse DifferentiatieTestserie (NDT)
o test in groep afgenomen
o algemeen niveau bepalen
illustratie: Nederlandse Differentiatie Testserie
doelgroep: leerlingen van 11 tot 15 jaar die in aanmerking komen voor plaatsing binnen het
voorbereidend middelbaar beroepsonderwijs (vmbo)
bestaat uit 9 subtests, peilend naar:
Redeneervermogen (bijv. Reeksen)
Verbaal vermogen (bijv. Overeenkomsten)
Ruimtelijk inzicht (bijv. Draaien)
→ IQ-score
Visueel werkgeheugen (bijv. Plaatjes Onthouden)
Semantisch werkgeheugen (bijv. Woordparen)
→ Werkgeheugen
+ Indices voor Nauwkeurigheid en Werktempo (Coderen)
categorie 2: veelvoudige algemene niveautests
doel = differentiatie in deelaspecten
voorwaarde: deeltests moeten afzonderlijk voldoende betrouwbaar zijn en
onderling voldoende onafhankelijk
men spreekt over testbatterijen
twee soorten
testbatterijen voor intelligentiefactoren
bijv. Drenth testserie voor het hoger niveau (NAT, VAT, TNVA)
testbatterijen voor geschiktheden
bijv. General Aptitude Testbattery (GATB)
illustratie: Drenth Testserie Hoger Niveau (DTHN)
doelgroep: volwassenen binnen de hogere intelligentieniveaus
bestaat uit drie onderdelen, die afzonderlijk of samen afgenomen kunnen worden:
Test voor Niet-Verbale Abstractie (TNVA)
Verbale AanlegTest (VAT)
Functies van Woorden
Verbale Analogieën
Woordenschat
Numerieke AanlegTest (NAT)
Rekenvaardigheid
Cijferreeksen
illustratie: General Aptitude Test Battery (GATB)
meet cognitieve vaardigheden relevant om een veelheid aan functies met succes te
vervullen
8 schriftelijke subtests, peilend naar:
4. Verbaal vermogen (Woordenschat)
5. Numeriek vermogen (Elementair Cijferwerk)
6. Ruimtelijk inzicht (Driedimensionale Ruimte)
7. Vormwaarneming (Gereedschap Vergelijken)
8. Waarneming van administratief materiaal (Namen Vergelijken)
9. Motorische coördinatie (Strepen Zetten)
10. Algemeen Leervermogen/Intelligentie (diverse)
4 apparatentests, peilend naar
11. Handvaardigheid (Plaatsen)
12. Vingervaardigheid (Monteren)
categorie 3: speciale niveautests
toegespitst op een speciaal segment van begaafdheid
drie soorten
tests voor speciale intelligentiefactoren
bijv. Raven Progressive Matrices (PM; redeneervaardigheid)
tests voor speciale geschiktheden
bijv. d2 (aandacht en concentratie)
tests voor speciale niet-intelligentiefactoren
bijv. tests voor kleurenblindheid, handvaardigheid,...
categorie 4: vorderingentests
doel = meten in hoeverre de onderzochte het doel van een opleiding bereikt
heeft, hoe gevorderd men is in wat beoogd wordt
verder onderscheid mogelijk tussen
schoolvorderingentest (‘achievement test’): specifiek gericht op
schoolse kennis
bijv. CITO-toetsen
vaardigheidstest (‘proficiency test’): gericht op vaardigheden buiten de
directe cognitieve sfeer en kennis
tests voor gedragswijze focus op hoe iemand iets doet of op welke manier zijn prestatie of reactie plaatsvindt
geen vooraf gekende ‘goed/fout’-sleutel
meting van persoonlijkheidstrekken, voorkeuren, houdingen,…
categorie 1: observatietests
beoordelaar (de psychodiagnosticus) observeert de cliënt
aanvangsgegevens zijn al het resultaat van een informatieverwerkingsproces
eerste informatie zijn de notities van de observator
observator verwerkt info voor hij ze opschrijft (interpretatie)
info is afhankelijk van observator
twee soorten
individuele observatietests
bijv. individuele opdrachten binnen assessment center
groepsobservatietests
bijv. groepsopdrachten binnen assessment center
Assessment center: individuele opdrachten
Stel bijvoorbeeld dat je een verkoopsleider zoekt. Dan kunnen individuele opdrachten er zo uitzien:
De kandidaat moet een presentatie verzorgen voor de directie over de aankoop van een softwaresysteem.
Hij moet kiezen tussen drie softwaresystemen en vervolgens zijn keuze funderen. (presentatie)
De kandidaat moet een functioneringsgesprek voeren met een jonge verkoper, waarover de klanten de
laatste tijd klachten hebben. Hij moet peilen naar de oorzaken van het minder presteren en samen met
hem een oplossing vinden. (gesprekssimulatie)
De kandidaat moet een bakje met post (klachtbrieven, uitnodigingen,…) ordenen en de juiste prioriteiten
stellen. Hij merkt bijvoorbeeld dat de eigenaar van het postbakje drie afspraken tegelijk heeft: met de juf
van zijn dochtertje, met zijn collega, met een potentiële grote klant. Aan hem om te beslissen welke
afspraak voorrang heeft. (postbakoefening)
Assessment center: groepsopdrachten opdrachten
Stel bijvoorbeeld dat je een verkoopsleider zoekt. Dan kan een groepsopdracht er zo uitzien: De kandidaat
moet met de andere sollicitanten een vergadering voeren over de verdeling van een extra budget. Het is
de bedoeling dat hij zoveel mogelijk geld binnenrijft. (groepsdiscussie)
categorie 2: somatofysiologische methoden
psychologische kenmerken wordt afgeleid uit meting van lichamelijke
kenmerken of processen
twee soorten
morfologische methoden (vooral historisch belang)
karakter eigenschappen afleiden vanuit lichamelijke kenmerken
bijv. fysiognomiek karaktertrekken afleiden uit gezichtstrekken,
zoölogische methode kenmerken afleiden uit dier waar we op lijken,
frenologie kenmerken afleiden uit bulten op hoofd,...
fysiologische methoden
aan de hand van bulten op de schedel kenmerken afleiden
bijv. EEG, hersenscans, huidgeleiding,...
we zien enkel nog maar afwijkingen als groep
categorie 3: zelfbeoordelingen
meestal in de vorm van vragenlijsten
vier soorten
interessetests
waarde- en attitudetests
biografische vragenlijsten
persoonlijkheidsvragenlijsten
andere methoden:
Osgood schalen / semantische differentiaal
o Werken met twee tegenpolen en tussen maten
o Altijd, soms, nooit
Q-technique / Q-sort
o Op voorhand het aantal antwoorden per categorie vaststellen
o Er is een normaal verdeling in de antwoorden: meer neutrale
en minder extreme antwoorden
o Score afhankelijk van plaats antwoord
categorie 4: kwalitatieve prestatietests
cliënt krijgt opdracht; niet goed of fout uitvoeren is van belang, wel wijze
waarop
twee soorten
niveautests voor gedragswijze
bijv. tests voor perceptuele stijl (bijv. Embedded Figures Test)
projectieve technieken
» perceptietests (bijv. Rorschach)
» interpretatietests (bijv. Thematic Apperception Test verhaal
vertellen over tekening)
» expressietests (bijv. Boomtest)
» constructietests (bijv. Wereldspel)
» associatietests (bijv. Zinaanvultest)
bijv. “ik raak soms in de problemen door...”
» keuzetests (bijv. Szondi foto test, voorkeur/afkeur)
Toepassingenbeoordeling van individuen
- met grote nauwkeurigheid een uitspraak doen over het gedrag van de onderzoekt
- voorspelling over een in de toekomst gelegen criterium aan de eisen waarvan men al of
niet kan voldoen
- advies in de keuze tussen minstens twee opties, die kwalitatief of kwantitatief van
elkaar verschillen
- vergelijking tussen verschillende vaardigheden of interesses van een zelfde persoon
- vergelijking tussen de scores van een zelfde persoon op verschillende momenten
- beschrijving van een persoon
- een niet directieve vorm van therapie: het samen met de cliënt analyseren, bewust
maken en herformuleren van het probleem waarmee de cliënt geconfronteerd wordt
beoordeling van groepen- onderzoek naar verschillen tussen groepen
- dit soort onderzoek heeft belang voor de keuze van een goede vergelijkingsgroep in
individuele diagnostiek
- verschil tussen bevolkingsgroepen, leeftijdsgroepen en leerlingen
- cross-culturele psychologie
beoordeling van invloed van situaties of methoden- onderzoek naar verschillen groepen die van elkaar verschillen in experimentele
condities
- beoordeling van methoden en situatie
- procedures vergelijken
bv. schoolvorderingstoets (bestudering van resultaten van een klas in vergelijking met andere
klassen
voorbeeldvraag
Welk woord ontbreekt in onderstaande definitie?
“Een psychologische test is een ................. onderzoek met behulp van speciaal geselecteerde
vragen of opgaven, met de bedoeling inzicht te krijgen in een psychologisch kenmerk van de
betrokkene.”
vergelijkend
gevalideerd
systematisch
objectief
Historische ontwikkeling van het testenhandboek pp. 15-35
Oorsprong van de term ‘psychodiagnostiek’Etymologie
• stamt uit het Grieks:
– ψυχή (“psychè”): 'ziel'
– διά (“dia”): 'uiteen'
– γνώσis (“gnosis”): 'kennis'
• letterlijk: het onderscheidend vaststellen van psychische eigenschappen
vroeger "psychotechniek“
diagnostiek via ‘machines’
diagnostiek via testen
nu is een test maar een fase van de cyclus
intussen is nadruk op technische aspecten sterk afgenomen en is term 'psychotechniek' in
onbruik geraakt
definities:
"het onderscheiden van personen naar hun individuele psychische kenmerken, zoals die
zich manifesteren in hun typische gedrags- en uitingsvormen, en wel met het behulp
van tests" (De Zeeuw, 1983, p. 3)
"het onderscheidend vaststellen van kenmerkende psychische eigenschappen om te
komen tot een goed omschreven beeld van een persoon of groep personen" (De
Zeeuw, Dekker, & Resing, 2004, p. 14)
VoorlopersChinese oudheid
• vorderingentoetsen voor dienaars
• selectie op basis van testscores in boogschieten, muziek, rekenen,...
vragen naar verschillen tussen mensen
selectie van dienaars op basis van testen
Oud TestamentRechters 7
Gideon en zijn leger stonden 's ochtends vroeg op en trokken naar de bron Harod, waar zij hun kamp
opsloegen. De troepen van Midian waren in het dal beneden hen gelegerd, aan de noordelijke kant
van de heuvel Moré.
De Heer zei tegen Gideon: "Uw leger is te groot! Ik wil u niet allemaal tegen de Midianieten laten
vechten, want anders zouden de Israëlieten er tegenover Mij prat op gaan dat zij zichzelf hebben
bevrijd! Zeg maar tegen het volk:
'Wie bang is, mag naar huis gaan." Toen gingen 22.000 mannen naar huis terug en er bleven slechts
10.000 over die bereid waren te vechten.
Maar de Heer zei tegen Gideon: "Het zijn er nog steeds te veel! Laat hen naar het water gaan en
daar zal Ik u laten zien wie met u zal meegaan en wie niet."
Toen ging Gideon met zijn mannen naar het water en de Heer zei tegen hem: " Verdeel hen in twee
groepen op grond van de manier waarop zij water drinken. De ene groep zijn de mannen, die met de
hand aan de mond het water opslurpen als een hond. Tot de andere groep behoort ieder die op de
knieën gaat zitten om het water te drinken."
Slechts driehonderd mannen behoorden tot de eerste groep; alle anderen gingen op de knieën
zitten om water te drinken.
"Ik zal de Midianieten verslaan met deze driehonderd man!" zei de Heer tegen Gideon. "Stuur alle
anderen naar huis."
Degiene die bang zijn mogen naar huis gaan
Manier van uit de beek drinken: op de knieën= onderdanig
Oude Grieken: typologie van de lichaamsvochtenTypologie: Typering op bisis van lichaamsvochten (slijm, bloed, gele gal, zwarte gal)
o Bloed: Vurige, energieke mensen werden verondersteld een overheersende
hoeveelheid bloed te hebben, en werden sanguïnisch genoemd.
o Gal: Het cholerische type werd verondersteld makkelijk irriteerbaar te zijn en snel
kwaad te worden als gevolg van een teveel aan gele gal. We komen dit tegen in het
Franse colère en het Spaanse cólera: woede.
o Zwarte gal: Een teveel aan zwarte gal werd verondersteld neerslachtigheid,
introversie en depressies te veroorzaken. Nog steeds worden neerslachtige
stemmingen aangeduid met de termen melancholie, vertaald als zwartgalligheid.
o Slijm: Flegmatici, mensen met veel slijm in hun lichaam, waren vooral kalm en weinig
emotioneel.
Fysiognomie: persoonlijkheid reflecteert naar gezichtsuitdrukking
Middeleeuwen en nieuwere tijd
Giambattista della Porta (1535-1615): zoölogische
methode, gebaseerd op dierfysiognomie oude
Grieken
Karakter eigenschappen op basis van
gezichtstrekken en hoe deze op dieren
lijken
Johann Kaspar Lavater (1741-1801): fysiognomiek
Karakter eigenschappen op basis van het silhouet van het gezicht
Silhouet machine: schaduw van gezicht over nemen om te
kunnen evalueren
Franz Joseph Gall (1758-1828): frenologie
Karkater afleiden uit de uitstulpingen op de schedel
Delen van de herenen gelinkt met bepaalde karakter
eigenschappen
Als dit deel goed ontwikkeld is komt er een uitstulping op de
hersenen
Bv. hij heeft een wiskunde knobbel
Carl Huter (1861-1912): psychofysiognomie gebaseerd op de kiembladentheorie
Embryonale ontwikkeling
Ectoderm (huid, zenuwen, zintuigen),
entoderm (interne organen), mesoderm
(bloedbanen, spieren)
Dominantie van kiembladen beïnvloed
karakter
Typisch te onderscheiden op basis vorm van
lichaam en gezicht
Césare Lombroso (1835-1909): criminele fysiognomie
Criminaliteit als effect van terugval in evaluatie
Evaluatie terugval is ook te zien aan het lichaam en gezicht
Aapachtig gezicht, afwijkende oren, aaneengegroeide
wenkbrauwen, brede kaken en een haviken neus
Hij heeft een boeventronie: hij heeft het gezicht van een
crimineel
Chiromantie
Verschillende kussentjes van de hand beïnvloeden karakter
Bv. Jupiter berg voor liefde
tot in recentere tijden uitlopers van theorieën over verband tussen lichamelijke kenmerken en
psychologische eigenschappen
konstitutionstypologie van Kretschmer
Lichaamelijke kenmerken
Pyknische type
Atletische type
Leptosome type
Verband tussen typen en bepaald gedrag/ kans
op aandoeningen
zulke theorieën werden vanaf het begin van de 20ste eeuw wel minder populair,
onder meer als gevolg van het ontstaan van een nieuw instrument: de psychologische test
Meer wetenschappelijke basis
Aanloopaanloop tot wetenschappelijke ontwikkeling testdiagnostiek in de loop van de 19de eeuw onder
stimulans van verschillende disciplines:
• psychiatrie: behoefte aan diagnosemogelijkheden met betrekking tot aard en niveau
van geestelijke afwijkingen
• genetica: interesse in verschillen tussen mensen
• experimentele psychologie: belang van gestandaardiseerde onderzoeksprocedures
stimulansen vanuit de psychiatriePhilippe Pinel (1745-1826)
- in een tijd dat men het verband tussen krankzinnigheid en misdadigheid als logisch ziet
- krankzinnigen zijn niet misdadig maar ziek
- ontstaan van interesse voor geestelijke abnormaliteit en zwakzinnigheid
Jean-Etienne Esquirol (1782-1840)
- onderscheid tussen zwakzinnigheid en krankzinnigheid
- een psychiatrische aandoening en een mentale handicap zijn niet hetzelfde
- zwakzinnigheid definiëren = mensen die niet in staat zijn zich informatie en
vaardigheden eigen te maken waartoe anderen van zijn leeftijd wel instaat zijn
Edouard Séguin (1812-1880)
- het vormen bord
- training van zwakzinnige kinderen
- focus op motorische en sensorische functies
- performantietest: Séguin Form Board
Charcot (1825-1893)
- grondlegger van de neurologie
- leidde een van de belangrijkste centra voor psychiatrie en neurologie in Europa: Hôpital
la Salpétrière in Parijs
- zette de psychiatrie in frankrijk op de kaart
Ebbinghaus (1850-1909)
- probeerde psychische vermoeidheid te meten aan de hand van test met onvolledige
zinnen
! nood aan onderscheid, categorisering en meting!
Al deze aandacht voor psychiatrische aandoeningen zorgde er voor dat er nood kwam aan om
een onderscheid te kunnen maken tussen geestenziekte en zwakzinnigheid, en om hier gradaties
in aan te kunnen leggen
stimulansen vanuit de geneticaFrancis Galton (1822-1911)
- neef van Darwin (Origin of Species: aandacht voor erfelijkheid van lichamelijke
eigenschappen)
- erfelijkheid van psychische eigenschappen aan dezelfde wetten onderhevig als de
erfelijkheid van lichamelijke eigenschappen
Galton legde de basis voor wetenschappelijk testonderzoek:
- belang van onderzoek naar individuele verschillen
- nood aan systematisering van onderzoekstechnieken
- weergave van onderzoeksresultaten in statistische termen (nadien verder uitgewerkt
door zijn collega Pearson)
“antropometrisch laboratorium” (peilde wel vooral naar
lichamelijke eigenschappen)
= een van eerste stappen naar test die eigenschappen en
verschillen tussen mensen meet
stimulansen vanuit de experimentele psychologieWilhelm Wundt (1832-1920)
- 1879: eerste psychologisch labo in Leipzig
- start systematisch experimenteel onderzoek op grote schaal
- veel belang aan beschrijving en standaardisatie
experimentele psychologie heeft zowel een stimulerende als een afremmende invloed
• stimulerend:
- exacte beschrijving van experimenteercondities
- rigoureuze controle van variabelen
- nauwkeurige verwerking van uitkomsten
• afremmend:
- focus op algemene wetten en samenhangen en niet op afwijkingen en verschillen
(waar we juist wel in geïnteresseerd zijn in de psychodiagnostiek)
- focus op primaire sensorische en motorische functies en niet op hogere en
complexere cognitieve en intellectuele processen
James McKeen Cattell (1860-1944)
- geïnteresseerd in individuele verschillen
- promoveerde bij Wundt over individuele verschillen in reactietijd
- 1890: artikel in tijdschrift Mind waarin voor het eerst het woord ‘test’ gebruikt
wordt
- ontwikkelde, geïnspireerd door de lichamelijke proeven van Galton, een reeks van
‘mentale’ tests (psychofysische proeven)
- stichtte in VS ‘laboratorium voor experimentele psychologie en testpsychologie’
kenmerken van deze periode
• nog geen psychologisch testen op grote schaal
• interesse incidenteel en theoretisch gericht
• onderzoek voornamelijk in laboratoria
• focus op sensorische en motorische functies, niet op complexere hogereordefuncties
later begon men te experimenteren met het gebruik van tests buiten het laboratorium
- onderwijs
- psychiatrie
- personeelsselectie
in die contexten werd duidelijk dat de methoden uit het experimenteel labo beperkingen
hadden
dit gaf aanleiding tot het ontstaan van nieuwe testvormen:
- intelligentietests
- psychotechnische proeven
- persoonlijkheidsvragenlijsten
- projectietests
drie afzonderlijke methoden met betrekking tot het testen van persoonlijkheid
observatietest:
- vooral populair in west Europa
- bedoeld om inzicht te geven in de kwalitatieve aspecten van de prestatie
persoonlijkheidsvragenlijsten:
- meer systematische vorm van verzameling van gegevens
- gestandariseerde, op schrift gestelde vragenlijsten
- specifieke terreinen bevragen
persoonlijkheidsdiagnostiek
- projectietests
- een stimulatie aangeboden waarop de persoon vrij mag reageren
- in de reactie wordt iets van de persoon zelf geopenbaart
- psycholoog interpreteert reactie
- persoonsbeschrijving, beoordeling van persoonskenmerken en diagnose van ziektebeeld
Intelligentietestsbakermat van de eerste intelligentietests = het onderwijs
- eind 19de eeuw: behoefte aan beter opgeleid personeel ten gevolge van
industrialisering en rationalisering van bedrijven
- meer doorstroming van lager naar vervolgonderwijs (men ging langer naar school)
- bij keuze van vervolgopleiding werden persoonlijke capaciteiten belangrijker dan
afkomst (wat ouders hebben gestudeerd)
- van daaruit behoefte aan instrumenten om geestelijke capaciteiten te meten
- ‘mentale tests’ van Cattell vertoonden geen verband met onderwijsprestaties
Alfred Binet (1857-1911)
- werkte bij Charcot in La Salpétrière
- was directeur van een laboratorium fysiologische psychologie aan de Sorbonne
- deed onderzoek
1896 Binet & Henri: La Psychologie Individuelle
- studie van individuen (differentiële psychologie) als alternatief voor algemene
psychologie
- criteria “mental test”:
• Gevarieerd genoeg zodat er zo veel mogelijk vermogens worden betrokken
• Betrekking op hoger denk vermogen
• Niet langer dan 1.5 uur
• Variatie zodat individu zich niet verveeld
• Aangepast aan leefwereld
• Geen ingewikkelde apparatuur
1904 opdracht ministerie van onderwijs: onderscheid maken tussen zwakbegaafde en luie
kinderen
Naar aanleiding van leerplicht
Minder begaafde kinderen ook naar school
Binet-simon 1905- leidde tot eerste intelligentietest: Binet-Simon 1905
30 proefjes (opgaven dagelijks leven)
uitgeprobeerd bij 50 normale kinderen van verschillende leeftijden
proefjes op grond van die prestaties gerangschikt volgens moeilijkheid en die
rekening hield met de leeftijd waarop de kinderen de proefjes kunnen oplossen.
(“leeftijdsdifferentiatie”)
nog geen objectieve scoring
- vernieuwende benadering
accent op complexe mentale processen
toetsing aan empirie
totaalscore als maat van intelligentie (“algemene intelligentie”)
- eerste test in wat later de Stanford-Binet traditie genoemd wordt
Binet-Simon 1908• gedeeltelijk andere items
• items gegroepeerd in leeftijdsschalen (3-12 jaar) (bv. De leeftijdsschaal van 3 jaar zijn
de testen die een 3 jarige moet kunnen)
• notie mentaal niveau:
o leeftijd van het normale kind waarmee de prestaties van het onderzochte kind in
overeenstemming zijn
o basisjaar + 1 jaar per vijf correct opgeloste items uit een hogere reeks
basis jaar= tot waar kind alle taken correct kan oplossen
Binet-Simon 1911• gelijk aantal proeven (n=5) per leeftijdsschaal
1 leeftijdsjaar= 5 vragen
• proeven voor jongere leeftijdsgroepen (3 mnd, 9 mnd, 1 jaar, 2 jaar)
• andere berekening mentaal niveau
o basisjaar + 1/5 jaar voor elke succesvol beëindigde proef uit een hogere categorie
o decimaal getal
Binet-Simon tests zijn ook populair in US
vertaling door Goddard, maar met andere bedoeling
- eugenetische beweging: doel om de goede kwaliteit van genetisch materiaal te
bewaren
- selectiemiddel
• toestemming tot immigratie
• verplichte sterilisatie (mensen met slechte gene mogen zich niet
voortplanten)
Lewis Terman (1877-1956)
- hoogleraar universiteit Stanford
- geëngageerd in eugenetische beweging
- lage intelligentie als voedingsbodem voor criminaliteit en als maatschappelijk gevaar
‘niet alle criminelen zijn zwakzinnig, maar alle zwakzinnige zijn in aanleg crimineel’
- gebruikte Binet-Simon tests als middel om aangeboren intelligentie te meten
Spearmann (1904)
- in alle tests spelen twee intelligentiefactoren een rol:
- algemene (g)factor
- specifieke (s)factor
- twee-factorentheorie
- intelligentie is de gemeenschappelijke factoren die men kan extraheren uit een
willekeurige serie van ‘intelligentietests’
- later de multi-factortheorie (door Thurstone)
Thorndike en Burt
- educational achievement test
- achtergebleven leerlingen herkennen
- prestaties van verschillende scholen vergelijken
Stanford-Binet 1916• gedeeltelijk andere items
• uitbreiding leeftijdsbereik tot 16 jaar
• vanaf 16 jaar intelligentie volledig ontwikkeld
• test ook bruikbaar voor oudere kinderen en volwassenen
• veel grotere proefgroep dan Binet (nog steeds wel alleen blanke Californiërs)
• invoering intelligentiequotiënt (geïnspireerd door Stern)
• quotiënt met in de teller Mentale Leeftijd (ML) en in de noemer Chronologische
Leeftijd (CL):
IQ= (ML/CL)*100
= traditioneel intelligentiequotiënt
+1= voor op leeftijd
-1= achter op leeftijd
1= op leeftijdsniveau
• maximale CL gefixeerd op 16 jaar
• hoogste ML die behaald kan worden is 19.5 jaar
• wordt ook wel ‘traditioneel IQ’ genoemd
kenmerken van de periode voor WO I (historische context)
- vooral in de praktijk van intelligentietesting grote vooruitgang
- theoretische vraag naar samenstellende elementen van intelligentie blijft grotendeels
onbeantwoord
- nog geen testings op grote schaal (collectieve afname)
- nog geen valideringsonderzoek
- door WO I grote nood aan instrumenten voor selectie voor en plaatsing in diverse
functies
- hierdoor kwam er een ander toepassingsdomein van intelligentietests op de voorgrond
- omdat individuele diagnostiek erg tijdrovend is, werd ook collectieve intelligentietest
geïntroduceerd: Army Alpha
soldaten moesten hand omhoog houden zodat ze allemaal op hetzelfde moment
konden beginnen met schrijven= standaardisering
- later ook niet-verbale variant: Army Bèta
mensen die geen Engels kunnen (immigranten)
pantomimische instructies (gebaren)
Na eerste wereldoorlog:
- test ontwikkeling in Amerika en Europa lopen sterk
uiteen
- Europa: Gestaltpsychologie, personalisme en fenomenologie individuele diagnostiek
Wijze waarop de proefpersoon de taak verricht is even belangrijk als de prestatie zelf
- Amerika: behavioristisch- positivistische en praktische behoeften groepstest
Ontwikkeling van Army beta door toenemende immigratie
Dit vormde later het standpunt voor onderzoek tussen verschillende volken
toch ook vooruitgang op vlak van individuele testdiagnostiek: Stanford-Binet 1937
- uitbreiding leeftijdsbereik (2 jaar – 22j 10m)
- verdere uitbreiding aantal proeven
- representatievere onderzoeksgroep (uit verschillende staten, maar nog steeds alleen
blank)
- invoering van parallelvormen
in een test twee subtesten die je parallel kan afnemen (hertesting op een ander
moment)
- meer psychometrische zorg
maar er kwam tegenwind...
David Wechsler (1896-1981)
- hoofdpsycholoog aan het Bellevue Psychiatric Hospital in New York
- professor klinische psychologie aan de New York University
- 1939 “the measurement of adult intelligence”
- kritiek op tests uit de Stanford-Binet traditie:
- Intelligentie is te gedifferentieerd om in één score te vatten
- Aard van de proeven verschilt naar gelang van de leeftijd (jonge kinderen krijgen
doe testen, oudere kinderen krijgen verbale testen)
- Proeven zijn hoofdzakelijk verbaal
- Mentale leeftijd is niet geschikt voor gebruik bij volwassenen (sommige aspecten
stoppen vroeger zich te ontwikkelen)
- twee nieuwe principes
- inhoudsschalen (i.p.v. leeftijdsschalen) schalen op basis van de inhoud van de proef
- verbale en performantiële intelligentie (i.p.v. algemene mentale bekwaamheid)
- deviatie-IQ
- tests uit de Wechslertraditie:
- Wechsler Intelligence Scale for Children (WISC-III)
- Wechsler Adult Intelligence Scale (WAIS-IV)
- Wechsler Preschool and Primary Scale of Intelligence (WPPSI-III)
- Wechsler Non Verbal scale of ability (WNV) (pathomimisch)
(tussen haakjes staan de meest recente Nederlandstalige versies van elke test)
Intussen kwamen er toch nog twee herzieningen Stanford-Binet
Stanford-Binet 1960- geen parallelvormen meer
- maximale chronologische leeftijd opgetrokken tot 18 jaar
- invoering deviatie-IQ (gemiddelde 100, SD 16)
- = uitvinding van Wechsler
- biedt oplossing voor twee problemen:
- ML stijgt niet zoals CL
- standaarddeviatie IQ verschilt naargelang leeftijdsgroep
- in 1972 ontwikkeling nieuwe normen voor de SB 1960 (niet uitsluitend blanken meer)
!! doordat er een andere standaarddeviatie is in de twee tradities heeft een getal een andere
betekenis !!
Stanford-Binet 1986- inhoudsschalen in plaats van leeftijdsschalen
- 15 schalen, in te delen in vier groepen
- verbaal
- abstract/visueel
- kwantitatief
- onmiddellijk geheugen
- nooit in het Nederlands verschenen
Psychotechnische proevenparallel aan intelligentietests in de context van onderwijs ontwikkelden zich psychotechnische
proeven in de context van personeelsselectie en beroepskeuzeadvies
- door technische en industriële revolutie waren rond de eeuwwisseling nieuwe
beroepen ontstaan
- nood aan instrumenten om geschiktheid voor deze beroepen te onderzoeken
- ontstaan van bureaus voor beroepskeuze
persoonlijke geschiktheid is belangrijker
Hugo Münsterberg (1863-1916)
- pionier van de psychotechniek
- van oorsprong Duitser
- werkzaam aan Harvard University
- ontwikkelde onder meer psychologische proeven voor de selectie van
trambestuurders
WO I stimuleerde de ontwikkeling van psychotechnische proeven voor selectiedoeleinden
- vooral in Duitsland erg populair
- psychotechnische laboratoria schieten als paddenstoelen uit de grond
rond 1930 gebeurden een aantal verschuivingen:
- geschiktheid voor een beroep hangt niet alleen af van capaciteiten maar ook van
persoonlijkheid
- hulp van psycholoog werd niet alleen ingeroepen bij selectie voor technische
beroepen maar ook bij selectie voor leidinggevende en organisatorische beroepen
deze verschuivingen leiden mee tot de intrede van een nieuw soort psychotechnische proeven:
observatieproeven
observatie mee nemen in beoordeling
verslag= portret van de persoon
vanaf de jaren 1930 bepaalden zulke proeven het beeld van de psychotechniek
- niet alleen aandacht voor prestatie van geteste persoon, maar ook voor gedrag
tijdens de proef
- persoonlijke inbreng diagnosticus werd belangrijker
- manier van verslagvoering veranderde
in de jaren 1940 ontstonden voorlopers van ‘assessment center’ technieken
- Burma Town test (spionnen)
- Maquettetest (stadsplanners)
Persoonlijkheidsvragenlijstendoor WO I ontstond nood aan instrumenten om emotioneel onstabiele recruten te kunnen
identificeren gaf in 1917 aanleiding tot eerste persoonlijkheidsvragenlijst: Woodworth Personal
Data Sheet
- 116 vragen
- gemaakt op vraag van Amerikaanse leger
- eerste vragenlijst waarin antwoorden worden opgeteld
- optelsom = index van ‘psychologische aanpassing’
uit die eerste aanpassingslijst kwamen in de jaren 1930 heel wat andere vragenlijsten voort.
Persoonlijkheid en aanpassing werden als erg gerelateerd gezien
- Bernreuter Personality Inventory
- Bell Adjustment Inventory
- California Test of Personality
deze ‘nakomelingen’ worden gekenmerkt door differentiatie
- diverse aspecten van aanpassing (introvert, extravert)
- diverse domeinen (sociale vaardigheden, persoonlijkheid)
vroege persoonlijkheidsvragenlijsten hebben sterk psychiatrische inslag
- focus op aanpassing
- psychiatrische ziektebeelden als vormen van ‘onaangepastheid’
in de jaren 1940 ontwikkelen Hathaway en McKinley een vragenlijst die erop gericht is
meerdere aspecten van persoonlijkheid en disfunctioneren te meten: de Minnesota Multiphasic
Personality Inventory (MMPI)
andere vragenlijsten zijn op de MMPI gebaseerd
- California Personality Inventory (CPI)
- ‘MMPI voor normalen’
minder nadruk op psychopathologie
dichter bij normaal spectrum
- Nederlandse Persoonlijkheidsvragenlijst (NPV)
- aanpassing van de CPI voor het Nederlandse taalgebied
vanuit de differentiële psychologie ontstaan factoranalytische persoonlijkheidsvragenlijsten
verschillende tradities in USA versus Engeland- USA (Guilford, Cattell): oblieke factoren (factoren zijn gecorreleerd)
- Engeland (Eysenck): orthogonale factoren (factoren zijn zo min mogelijk met elkaar
gecorreleerd)
Hoe factor rotatie wordt uitgevoerd
Of factoren met elkaar correleren
recente vragenlijsten die uit deze tradities voortkwamen:
- Guilford LTP Temperament Survey (GLTS ‘94)
- NEO-PI-R
- Eysenck Personality Inventory / Amsterdamse Biografische Vragenlijst
Projectietestsvanaf de jaren 1930 komt binnen de psychiatrie een nieuwe testvorm in zwang, specifiek
bedoeld voor de diagnostiek van persoonlijkheid: projectietests
- vanuit onvrede met apparaten-tests, die te veel focusten op de ‘buitenkant’ van de
persoon
- mede onder invloed van de opkomst van de psychoanalyse
- belang van verschillende soorten informatie, niet alleen op de buitenkant maar
ook op de binnenkant nood aan ander soort van instrumenten
Sigmund Freud (1856-1939)- grondlegger van de psychoanalyse
- lanceerde de idee dat emotioneel beladen herinneringen, die uit het bewustzijn
verdrongen zijn, weer bewust gemaakt kunnen worden met behulp van subtiele
duidingsmethoden
- inzicht krijgen op de herinneringen die verdrongen zijn via dromen
Carl Gustav Jung (1875-1961)- leerling van Freud
- gebruikte woord-associatietest om complexen van emotioneel beladen,
onverwerkte ervaringen bloot te leggen
Hermann Rorschach (1884-1922)- leerling van Freud en Jung
- vlekkentest
- gebruikte vlekken om inzicht te krijgen in diepere persoonlijkheidsstructuur
Rorschach vlekkentest
- 10 platen met inktvlekken (“wat zou dit kunnen zijn?”)
- voor het eerst voorgesteld in 1921 in “Psychodiagnostik”
5 zwart wit, 5 gekleurde vlekken
Allemaal symmetrisch
Begin: waarnemingstest
Later: psychodiagnostiek
hedendaagse test verschilt van oorspronkelijke
- minder platen
- kleinere platen
- zonder zwarte rand
- schakering ten gevolge van drukproces
Rorschach beschreef test als ‘waarnemingsexperiment’
- bij interpretatie niet zozeer letten op inhoud van de antwoorden, maar wel op de
vormkenmerken (de hele vlek, een stuk van de vlek, …)
test was aanvankelijk niet erg succesvol
“Rorschach is a blot on the history of psychology.”
na eerste kritische reacties komt er in de jaren 1930 wel een doorbraak en wordt de test een van
de populairste en meest gebruikte psychologische tests
succes van de Rorschachtest inspireerde anderen tot de ontwikkeling van andere tests,
gebaseerd op hetzelfde principe:
- platentests (bijv. Thematic Apperception Test)
platen met tafferelen, hier iets over vertellen. De mensen vertellen iets over deze plaat en
hebben hier hun fantasie voor nodig, wat een indicatie geeft van onderliggende dingen
- keuzetests (bijv. Szondi)
8 foto’s, elk representeert een categorie (depressie, sadistische, hysterische,
catatonische, paranoïde, manische en homofilie)
2 voorkeuren uitkiezen, reflecteren behoeften die geaccepteerd worden
2 afkeuren uitkiezen, reflecteren onvervulde behoeften die niet geaccepteerd worden
De keuzen geeft een indicatie aan van behoeften en noden
- tekentests (bijv. Boomtest)
cliënt tekent
dit wordt geïnterpreteerd
wat met tekent reflecteert over diepere lagen van persoonlijkheid
- in de jaren 1940 vonden projectietests ook hun weg naar de sector van personeelsselectie
en beroepskeuzeadvies
- ontwikkeling van speciale varianten (bijv. Vocational Apperception Test)
- Boomtest tot in de jaren 1970 frequent gebruikt voor personeelsselectie
voorbeeldvraag
In welke test werd intelligentie voor het eerst gekwantificeerd aan de hand van het traditioneel
IQ?
- Binet-Simon 1911
- Stanford-Binet 1914
- Stanford-Binet 1916
- Stanford-Binet 1937
Wat moet je voor dit hoofdstuk zeker niet van buiten leren?
- geboorte- en sterfdata van de figuren uit het historisch overzicht
- data van specifieke gebeurtenissen of publicaties
(uitzondering: data van tests uit de Stanford-Binet traditie)
Kenmerken van een wetenschappelijk
onderbouwde testhandboek pp. 41-46, 49-53,
146-156, 172-186, 190-194, 205-206, 328-341
Moeten we, als we een uitspraak willen doen over de eigenschappen van een persoon, wel een
test gebruiken?
Hoe onderscheidt een wetenschappelijk onderbouwde psychologische test zich van het
voorwetenschappelijke oordeel?
Efficiëntie- testconstructeur heeft verzameling van opgaven geselecteerd of geconstrueerd die
optimaal een appèl doen op de te meten eigenschap
- diagnosticus creëert een testsituatie waarin bijkomstigheden en storende invloeden zo
veel mogelijk worden geweerd
voorbeeld 1: intelligentietest
• bestaat uit taken die voor hun oplossing een beroep doen op diverse belangrijke aspecten
van intelligentie
• geeft in enkele uren tijd vrij volledig beeld van intelligentie, terwijl vergelijkbare observatie
van gedrag ‘in vivo’ meerdere dagen in beslag zou nemen
voorbeeld 2: persoonlijkheidsvragenlijst
• aan respondent wordt gevraagd zich een voorstelling te maken van groot aantal situaties
en hoe hij/zij er typisch op reageert
• via zelfrapportering respondent krijgt men op korte tijd indruk van belangrijkste
persoonlijkheidskenmerken, in plaats van langdurige observatie
Standaardisatie en objectiviteitTest afnemen Complex en veelzijdig proces
Variatie : zakelijk neutraal vs. Vorm die van zowel proefpersoon als proefleider een hoge mate
van persoonlijke inzet verreis
Schriftelijke testen:
- Proefpersoon krijgt instructies
- Maakt test zonder hulp
Assesment center (rollenspellen)
- Zowel profleider als proefpersoon spelen een actieve rol
Leerpotentieel:
- Testen en training van cognitieve vaardigheden wisselen elkaar af
Verschillen in motivatie, samenwerking, onbevangenheid en andere eigenschappen die de
relatie met de testleider beïnvloeden
Probleem met test ervaring
Proefleiders vormen geen constante factor in de testsituatie
- Variëren in training, ervaring, inzicht, sensitiviteit en bereidheid tot contact
Belang van standaardisatie: verschillende omstandigheden kunnen voor verschillende resultaten
zorgen
Testonderzoek is een complex proces want grote verschillen tussen:
- testsituaties
- onderzochte personen
- proefleiders
- tests
Belang van standaardisatie
- bij zowel afname als scoring
- voorwaarde voor vergelijkbaarheid van testprestaties of –scores
Afname:
testsituatie (objectief) standaardisatie betekent dat de onderzochte in maximaal gelijke omstandigheden wordt getest
- instructie goed uitgewerkt
- proefleider houdt zich aan instructie
- opvallende of specifieke omgevingsinvloeden worden geweerd (temperatuur, geluid,
helderheid van licht, lichtinval, ventilatie, schrijfcondities)
- storingen tijdens testafname worden voorkomen
- (bij groepstests) samenwerken of afschrijven wordt verhinderd
proefpersoon (gedrag) De situatie waarin de onderzochte verkeert moet zoveel mogelijk constant gehouden worden
Proefpersonen kunnen op hun prestatie en gedragswijzen een zeer duidelijke invloed
uitoefenen
Sommige factoren zijn tot op zeker hoogte controleerbaar
- vermoeidheid, emotionele opwinding,...
- (vermeende) verwachtingen proefleider inlossen
- sociale wenselijkheid
- vertrouwdheid met specifieke test of testonderzoek in algemeen
- motivatie grip op motivatie door te streven naar een ongedwongen relatie met
de onderzochte
- angst
proefleider voornamelijk problemen bij individuele testen: omdat hier spraken is van een
wisselwerking tussen testleider en proefpersoon
makkelijker te controleren
training voor het afnemen en score van een test is cruciaal
- interactie met proefpersoon (vooral bij individuele afname)
- onervarenheid (mbt specifieke test of testonderzoek in algemeen)
scoring- naar maten het scoringsproces meer gebaseerd is op de subjectieve oordeelsvorming, geven
de scores een grotere foutmarge te zien
- onderscheid scoring van reacties op items met open-vraagvorm en geprecodeerde items
- wordt ook wel ‘objectiviteit’ genoemd: onafhankelijkheid van storende invloeden vanuit de
persoon van de waarnemer, beoordelaar of interpretator
- bij een objectief testonderzoek maakt het niet uit wie de beoordelaar is
- objectiviteit impliceert openheid en reproduceerbaarheid van de
evaluatieprocedure
- vanuit deze omschrijving kan de overeenkomst tussen beoordelaars beschouwd worden als
een maat van objectiviteit
- tests verschillen van elkaar in de mate waarin ze (kunnen) beantwoorden aan de eis van
objectiviteit
- heel objectief: verwerking van antwoorden bij schriftelijke meerkeuzetests
- weinig objectief: interpretatie van antwoorden bij observatietests en projectieve
technieken
- hoe groter de inbreng van de beoordelaar in het proces van verwerken van gegevens, hoe
groter de kans op subjectieve beïnvloeding
- spanningsveld met relevantie
- indien men verder wil gaan dan objectief controleerbare gedragsaspecten gebruikt
men best exact voorgeschreven verwerkingsprocedure
- onderscheid tussen
- reacties op items met open-vraagvorm
- reacties op geprecodeerde items
scoring van reacties op items met openvraagvorm- reacties kunnen verbaal of niet-verbaal zijn
- door de openvraagvorm is er risico op subjectiviteit en lage overeenkomst tussen
beoordelaars
• zinvolle uitspraken en voorspellingen onmogelijk
• lage validiteit
- manieren om risico te verminderen:
• gebruik van coderingssysteem (= stelsel van regels en voorschriften dat
volledig, duidelijk en ondubbelzinnig is)
• goede instructie van de beoordelaars + gelegenheid tot training
- aandacht voor individuele antwoorden en verschillen
scoring van reacties op geprecodeerde items- ‘meerkeuzevragen’
- verschillende opties: handscoring, zelfscoring, machinale scoring
- handscoring:
corrector telt goede en foute antwoorden, overgeslagen of onvolledig ingevulde
items
aan de hand van correct ingevuld protocol of verbetersleutel (transparant of
geperforeerd karton)
nadelen: duurt lang, risico op fouten
- zelfscoring:
antwoordformulier scoort zichzelf door middel van een doordrukprocédé met een
aan het antwoordformulier vastgemaakt tweede vel met cirkeltjes
corrector moet alleen nog de markeringen in de cirkeltjes optellen
nadeel: kostprijs
voordelen: snelheid en efficiëntie
- machinescoring:
antwoorden worden aangebracht op speciale antwoordformulieren die nadien
ingelezen kunnen worden
verwerking gebeurt volledig machinaal (soms ook vergelijking met normen en
interpretatie)
laat toe om verzamelde gegevens voor onderzoek te gebruiken
- kwaliteitskenmerken van de test
- informatie over de geteste groep als geheel
wordt in sommige gevallen gecombineerd met computerafname
Bewerkte scores/Normeringoutput van een testafname = ruwe testscoresper item 0/1 of fijnere gradatie
itemscores worden gecombineerd (bijv. opgeteld) tot ruwe testscore
ruwe scores kunnen voor veel verschillende dingen staan
- aantal goede of foute antwoorden in een kennistest
- aantal ‘ja’-antwoorden op een persoonlijkheidsvragenlijst
- aantal mislukte pogingen op handvaardigheidstest
- som van scores op ‘ratingschaal’ van een attitudevragenlijst
De bedoeling is altijd om iets te zeggen over het individu dat de test heeft afgenomen
ruwe scores zeggen niet veel, ze moeten geïnterpreteerd worden
dat kan op verschillende manieren:
• criteriumgericht referentiekader : vergelijking met bepaalde standaard (criterium –
absoluut meten)
- hoeveel opgaven waren er?
- hoeveel punten worden er afgetrokken voor een fout? ...
• normgericht referentiekader : vergelijking met relevante anderen (normgroep –
relatief meten)
- hoe hebben anderen het gedaan?
- waren er veel die een betere/mindere prestatie leverden?
criteriumgericht referentiekader: vergelijking met een absolute standaard = absoluut meten
Criterium: de prestatie beoordelen, kijken waaraan deze voldoet
- prestatie wordt beoordeeld zonder er de prestaties van anderen bij te betrekken: hoe goed is
de prestatie in vergelijking met een absolute standaard?
- vaak gebruikt in onderwijskundige context
- in welke mate hebben leerlingen het nagestreefde onderwijskundige doel bereikt?
- hoeveel kennis/inzicht hebben leerlingen verworven?
- antwoord is voor iedere leerling onafhankelijk van wat andere leerlingen presteren
noodzakelijk = goede voorafgaande analyse
• welk proces wil men bij de onderzochte analyseren?
• kan de mate waarin het al dan niet verwezenlijkt zijn van beoogde doelen
betrouwbaar gemeten worden?
normgericht referentiekader‘norm’
= referentiekader voor de evaluatie van de ruwe scores dat is gebaseerd op de kenmerken
van de verdeling van de ruwe scores in een populatie; die kenmerken worden geschat opk basis
van een representatieve steekproef
- test wordt voorgelegd aan een representatieve, grote en op toeval samengestelde
steekproef uit de populatie waarvoor de test bedoeld is
- verzamelde testscores worden statistisch bewerkt zodat een vlotte vergelijking mogelijk
wordt tussen de testscore van een welbepaald persoon en die van de referentiegroep
- afhankelijkheid van groep proefpersonen waarop normen zijn vastgesteld
• generaliseerbaarheid van de norm hangt af van de grootte van de vergelijkingsgroep
• belangrijk om, bij rapportering, de specifieke kenmerken van de normgroep te
vermelden
• bij vertaling van een test kan men niet zomaar de normgegevens uit het
oorspronkelijke taalgebied overnemen
• normen zijn niet absoluut; geregelde revisie is noodzakelijk
cf. Flynn-effect: het IQ stijgt over de generaties heen
daarom moet men de normering om de zo veel jaar opnieuw doen
zonder hernormering stijgen de iq punten 3 tot 5 punten
normering kan gebeuren
- binnen één referentiegroep: een referentie groep met dezelfde kenmerken (bv. Bij
angstige mensen bij een test over angst)
- ten aanzien van meerdere referentiegroepen
• diverse leeftijdsgroepen
• mannen/vrouwen (bv. Wanneer meisjes angstiger zijn dan jongens=
geslachtsverschil )
• bevolkingsgroepen/klinische groepen ...
let op: bij normering is altijd sprake van een vergelijking met anderen, maar niet elke vergelijking
met anderen heeft een normkarakter!
Verhoudingsnormen: testscores gedeeld door een andere variabele (bv. leeftijd) en daardoor
onafhankelijk gemaakt van die variabel
vergelijking en normen gebaseerd op rangorderangscores- eenvoudigste vorm van vergelijking tussen individuen: rangordening
- ordening op rangorde, bv. van laagste naar hoogste
- bewerkte score = rangnummer
- interpretatie afhankelijk van groepsgrootte
nuttig voor snelle aanduiding van prestatie in vergelijking met anderen in dezelfde groep
zonder kennis van groepsgrootte en buiten de bewuste groep geen betekenis
percentielenpercentielen = de 99 punten die een frequentieverdeling verdelen in 100 groepen van gelijke
grootte
voorbeeld: Pc 70 = punt op de schaal waaronder (links er van) 70% van de verdeling
gelegen is
bekende percentielen:
– P50: mediaan
– P25: eerste kwartiel (Q1)
– P75: derde kwartiel (Q3)
wat als grote groep respondenten zelfde ruwe score heeft?
- ruwe score beslaat meerdere percentielen
- voorbeeld:
28% heeft ruwe score <=61
34% heeft ruwe score <= 62, dus 6% heeft score 62
met welk percentiel stemt 62 overeen?
28 + 0,5 (34-28) = 28 + 3 = Pc 31 percentiel in het midden
voordelen
- onafhankelijk van groepsgrootte
- eenvoudige en snelle berekening
- gemakkelijke toepasbaarheid en inzichtelijkheid
nadelen
- ordinaal meetniveau, waardoor beperkingen in mogelijke statistische bewerkingen (geen
gemiddelden/varianties, alleen rangcorrelaties)
- frequentieverdeling percentiele scores niet vergelijkbaar met die van ruwe scoren
in het midden van de gauscurve komt een zelfde score veel vaker voor, en zal dus ook
meer percentielen innemen dan scores op het einde
Voorbeeld: Competentiebelevingsschaal voor Adolescenten (CBSA)
- verschillende scores voor jongens en meisjes
- vergelijken van leerlingen
decielenFrequentieverdeling wordt in 10 gelijke groepen verdeeld
vigintielenfrequentieverdeling wordt in 20 gelijke groepen verdeeld
Voorbeeld: Zelfbeoordelingsvragenlijst (ZBV-K)
- vragenlijst die toestandsangst en angstdispositie meet
- telkens 20 vragen met drie alternatieven
- normen voor basisschool en voortgezet onderwijs
- ruwe subtestscores omgezet naar decielen
vergelijking en normen gebaseerd op gemiddelde en spreiding• omzetting van ruwe scores in standaardscore-eenheden
• diverse varianten:
- standaardscores: z-scores
- genormaliseerde standaardscores: T-scores, deviatie-IQ
standaardscores of z-scoresstandaardscore (Zx) drukt uit hoeveel standaarddeviaties (SDx) een ruwe score (X) van het
gemiddelde (gemX) afwijkt
formule: Zx = (X – gemX)/SDx
0= gemiddelde, -= onder gemiddelde, += boven gemiddelde; hoeveel we afwijken van het
gemiddelde drukken we uit met standaard deviaties
zonder transformatie hebben standaardscores vaak een klein bereik en zijn het zowel positieve
als negatieve getallen
Om de positieve en negatieve getallen weg te halen, kunnen we de scores optellen met een vast
getal (bv. 100) de verdeling blijft dan hetzelfde, maar de getallen veranderen
Door op te tellen of af te trekken veranderen de verhoudingen niet, door te vermenigvuldigen of
delen wel
om dat vermijden zijn lineaire transformaties (y=ax+b) mogelijk
het gemiddelde van alle scores aftrekken
de verdeling blijft bestaan
bij omzetting van ruwe scores naar standaardscores:
- wordt de verdeling verschoven (gemiddelde wordt van elke score afgetrokken)
- wordt de afstand tussen de scores veranderd (elke score wordt gedeeld door de
standaarddeviatie)
- maar blijven andere kenmerken (scheefheid, bimodaliteit,...) gelijk
standaardscores behouden dus dezelfde verdelingskenmerken als ruwe scores: z-scores zijn dus
niet automatisch normaal verdeeld!
genormaliseerde standaardscoresniet-lineaire transformatie: de verdeling van scores wordt zodanig
vervormd dat er een normale verdeling ontstaat
normaliseren: de transformatie op zo een manier doen zodat de
uiteindelijke verdeling een normaal verdeling heeft (we veranderen
de verdeling)
omdat we dan weten waar zich hoeveel scores bevinden
standaarddeviatie ligt op dezelfde plaats
niet altijd verantwoordbaar, enkel wanneer de geobserveerde verdeling in de buurt
komt bij een normaalverdeling
• vergroot gebruiksgemak, maar doet werkelijkheid soms geweld aan
• gekende voorbeelden:
- T-scores
- Stanines
- Deviatie-IQ
T-scores (gem 50, SD 10)- Genormaliseerde verdeling
Gestandaardiseerd gemiddelde is 50, SD= 10
T score 60 = percentiel 84
Stanines– komt van ‘standard score’ en ‘nine’
– schaal van 1 tot 9 met getalswaarden die corresponderen
met gelijke intervallen onder de normaalverdeling
– stanines komen niet exact overeen met bepaalde
ruwe scores, maar vertegenwoordigen een
breedte van 0,5 SD
– gemiddelde ligt in het midden van stanine 5
Voorbeeld: NEO-PI-R
normen beschikbaar voor diverse deelpopulaties (de situatie onder welke iemand de test
laat afnemen, veranderen de resultaten)
- volgens testsituatie (neutraal/selectie/begeleiding
- - volgens land (Nederland/België)
- volgens geslacht (mannen/vrouwen)
- volgens leeftijd (<30 / 30-50 / >50)
- volgens opleiding (laag/gemiddeld/hoog met indicatie van waar het wel of niet
aangewezen is deelnormen te gebruiken
ruwe subtestscores omgezet naar stanines
voorbeeld: normtabellen Job Stress Survey
Deviatie-IQ (gem 100, SD 15*)
*Stanford-Binet traditie: SD 16
Wecsler: 1 standaarddeviatie boven gemiddelde = 115
Gemiddelde= 100
SD= 15
Standford binet: 1 standaarddeviatie boven gemiddelde= 116
Gemiddelde = 100
SD= 16
Betrouwbaarheid"Reliability refers to the consistency of measurement when the testing procedure is repeated on
a population of individuals or groups"
(Standards for Educational and Psychological Testing, 1999, p. 25)
verwijst naar herhaalbaarheid van de meetresultaten: wanneer een test onder gelijkblijvende
condities diverse malen aan een zelfde persoon wordt voorgelegd, moet de verkregen testscore
over de testsessies heen zo weinig mogelijk variëren
bv. Meteen na elkaar op de weegschaal gaan staan en hetzelfde gewicht wordt aangegeven
een zinvolle herhaalbaarheid van metingen wordt bemoeilijkt door geheugeneffecten en
leerprocessen
net als fysische eigenschappen (lengte, gewicht,...) worden ook psychologische eigenschappen
(bijv. intelligentie) gemeten
bij psychologische metingen kan verwacht worden dat fluctuaties in prestaties en gedrag als
reactie op testvragen en –opgaven groter en complexer van aard zijn en dat de verschillen
tussen eerste en tweede meting dus ook groter zullen zijn er spelen andere factoren een rol
die de herhaalbaarheid ingewikkelder maken
doel = in kaart brengen wat de relatieve inbreng is van de onvoorspelbare invloeden over
testafnames heen op de testprestaties
testscore die een bepaalde persoon in een specifieke testsessie behaalt, kan opgesplitst worden
in twee componenten:
- systematisch deel dat over testafnames niet verandert (‘ware score’)
- toevallig deel dat over testafnames op onvoorspelbare wijze varieert
(‘foutencomponent’, toevallige ruis)
geen enkele meting is perfect betrouwbaar, er is altijd een meetfout.
foutencomponent verandert de score van de geteste persoon op toevallige wijze (soms naar
boven soms naar onder)
over herhalingen heen heffen de foutencomponenten elkaar op
↓
als men het gemiddelde neemt van een groot aantal herhalingen, krijgt men de “ware” score
onze ruis is niet systematisch, de ene keer wat meer naar boven en de andere keer wat meer
naar onder. Dit zorgt er voor dat de ruis tegen elkaar weg valt om tot de ware score te komen
bij betrouwbaarheid gaat het er om dat we de meting heel vaak herhalen, en dat we door deze
grote herhaalbaarheid tot de ware score kunnen komen
MAAR
psychologische metingen zijn niet herhaalbaar...
het is niet zinvol iemand diverse malen dezelfde test voor te leggen (geheugen, leren,...)
DUS
‘hypothetische’ herhaling nodig...
(= zoeken naar een realistische benadering van het ideaal van onafhankelijke
replicatie van de testprocedure)
vier benaderingen:
parallelvormmethodetwee inwisselbare (maar niet-identieke, dezelfde moeilijkheid, zelfde type vragen, …) tests
worden afgenomen bij groep proefpersonen
correlatie tussen de twee ‘parallelle’ testscores als schatting van betrouwbaarheid =
parallelbetrouwbaarheid
kanttekening: in de praktijk moeilijk om echt parallelle tests te ontwikkelen
test-hertestmethodetest wordt met een behoorlijke tussentijd tweemaal aan dezelfde groep proefpersonen
voorgelegd
correlatie tussen de testscores van de twee afnames als schatting van betrouwbaarheid
= test-hertest betrouwbaarhied
kanttekening: het is mogelijk dat de gemeten eigenschap verandert in de tussentijd en dat is
niet bij iedereen in gelijke mate zo
- leereffecten (de persoon groeit in de tussentijd, leert nieuwe dingen bij)
- geheugeneffecten (de persoon herinnerd zich de vorige afnamen en weet welke
tactiek hij toen gebruikte)
- directe invloed van eerste meting op gemeten eigenschap (bijv.
attitudeverandering)
hertestingsbetrouwbaarheid is enkel zinvol bij relatief stabiele gegevens zoals intelligentie, niet
bij dingen zoals meningen, stemming, …
splitsingsmethodetest wordt in twee helften met elk evenveel items gesplitst, die zoveel mogelijk parallel zijn
= efficiënte variant van de parallelvormmethode
correlatie tussen de scores op de twee testhelften schatting van betrouwbaarheid van de halve
test (correctie nodig) =splitsing betrouwbaarheid
kanttekening: in de praktijk moeilijk om een test in echt parallelle helften te splitsen
interneconsistentiemethodetest wordt één keer afgenomen
betrouwbaarheid wordt gebaseerd op de variantie van de testscore en alle covarianties tussen
de items = interneconsistentie betrouwbaarheid
nagaan hoe de items onderling samen hangen. De verschillende items worden als parallel van
elkaar gezien. We stellen meerdere vragen die samen een schaal vormen.
Door meerdere keren 1 schaal te bevragen zijn we zeker dat we een betrouwbaar antwoord
krijgen
bekendste coëfficiënt = Cronbach’s alpha (α)
betrouwbaarheidscoëfficiënten variëren tussen 0 en 1
evaluatieals de test gebruikt wordt om belangrijke beslissingen over individuen te nemen:
• .90+ goed
• .80-.90 voldoende
• <.80 onvoldoende
als de test gebruikt wordt om minder belangrijke beslissingen over individuen te nemen:
• .80+ goed
• .70-.80 voldoende
• <.70 onvoldoende
als de test gebruikt wordt voor groepsvergelijkingen of experimentele toepassingen (try-out van
nieuwe tests)
• .70+ goed
• .60-.70 voldoende
• <.60 onvoldoende
betrouwbaarheidsintervalgegeven dat geen enkele meting perfect betrouwbaar is, moeten we ervan uitgaan dat de
geobserveerde score slechts een schatting is van de ware score
bij herhalingen van de meting fluctueren de geobserveerde scores, terwijl de ware score gelijk
blijft
het is best om bij de interpretatie niet van slechts één schatting (geobserveerde score) uit te
gaan, maar een interval af te bakenen
betrouwbaarheidsinterval (BI): interval rond de geobserveerde waarvan het waarschijnlijk is dat
de ware score erin ligt
- 90% betrouwbaarheidsinterval
- 95% betrouwbaarheidsinterval
betekenis: bij herhaalde berekeningen van betrouwbaarheidsinterval zal de ware score in
90% tot 95% van de gevallen in het berekende interval liggen
betrouwbaarheid is een noodzakelijke voorwaarde voor validiteit
• een onbetrouwbare test geeft vooral meetfouten weer en kan de bedoelde
psychologische eigenschap hooguit heel zwak representeren
betrouwbaarheid is evenwel geen voldoende voorwaarde voor validiteit
• een betrouwbare test kan onbedoeld iets anders meten dan wat de bedoeling
was
• wat is wel nodig voor validiteit? (→ volgende onderdeel)
Validiteitkernvraag = meet een test wat hij verondersteld wordt te meten?
Meet ik wat ik beoog te meten
voorbeeld:
iemands intelligentie inschatten op basis van
• reactie op praktische problemen
• schoolprestaties
• belezenheid
• ...
zijn deze indicaties de juiste? tonen ze iemands intelligentie?
validiteit = mate waarin de test aan zijn doel beantwoordt
- niet eigenschap van de test op zich
- uitspraak over validiteit kan alleen met verwijzing naar de bedoeling van een test
- als een test meerdere doelen dient, kan het zijn dat hij voor het ene doel wel en
voor het andere niet valide is
validiteit is niet alleen afhankelijk van de test, maar ook hoe de test gebruikt wordt en waarvoor
de test gebruikt wordt
"Validity refers to the degree to which evidence and theory support the interpretations of test
scores entailed by proposed uses of the test"
(Standards for Educational and Psychological Testing, 1999, p. 9)
gemeenschappelijk doel van alle tests = via testgedrag iets kunnen zeggen over niet-testgedrag
- gedragingen die ook representatief zijn voor de gemeten eigenschap, maar die niet
door de specifieke verzameling van items in de test werden opgeroepen (bv.
intelligentie test) = psychologisch begrip meten, begripsvaliditeit
- gedragingen die representatief zijn voor de eigenschappen of prestaties, die men
met behulp van de testscore zou willen voorspellen (bv. ingangsexamen
geneeskunde) = voorspellen, predicatieve validiteit
via de test een uitspraak doen over iets buiten de test. We kiezen hiervoor gedragingen
we willen een bepaalde eigenschap meten of iets meten met een ander doen (bv. Toelating tot
studie)
validiteit gaat over de vraag of de sprong van het testgedrag naar het niet-testgedrag
verantwoord is
twee grote soorten doelstellingen en daaraan gelinkt twee hoofdtypes validiteit:
- doel = ander gedrag voorspellen
(→predictieve validiteit)
- doel = psychologisch begrip operationaliseren
(→begripsvaliditeit)
elk gebruik van een psychologische test is onder te brengen bij een van deze twee doelstellingen
predictieve validiteitprimair doel = bepaald gedrag of bepaalde prestatie buiten de testsituatie voorspellen (=
criterium)
predictie in methodologische zin, los van het tijdsaspect
- criterium in toekomst (predictie in enge zin) (hoe iemand in de toekomst zal
presteren)
= predictieve validiteit in enge zin
- criterium in heden (paradictie)(de maten van een bepaald eigenschap tijdens de
meting)
= gelijktijdige/concurrente validiteit
- criterium in verleden (postdictie)
om een goede voorspelling mogelijk te maken moet aan volgende voorwaarden voldaan zijn:
- zowel voor de predictor als voor het criterium moeten goede meetinstrumenten
voorhanden zijn
- zowel de test als het te voorspellen gedrag moeten uitingen zijn van eigenschappen
waartussen een aantoonbare relatie bestaat
goed meet instrument voor zowel criterium als predictor
gebaseerd op theorie vorming
er zijn diverse mogelijkheden om predictieve validiteit na te gaan
- associaties tussen test en criterium
- onderscheidend vermogen van de test ten aanzien van het criterium
voorbeeld: verschillen in scores op de Gezinsklimaatschaal tussen gezinnen met en zonder
problemen
Significatnet verschillen tussen een gewoon gezinsklimaat en een problematisch gezinsklimaat
voorbeeld: verschillen in WAIS-IV-scores tussen verschillende beroepsgroepen
begripsvaliditeitprimair doel = een capaciteit, persoonlijkheidstrek of attitude operationaliseren
begripsvaliditeit = de mate waarin een test het begrip meet dat hij beoogt te meten
deelvragen:
- komt de interne structuur van de test overeen met de verwachte structuur?
= interne begripsvaliditeit
- vertoont de test de verwachte mate van samenhang met andere tests die
operationaliseringen zijn van ofwel een zelfde begrip ofwel een verschillend begrip?
= externe begripsvaliditeit
• samenhang met tests die hetzelfde meten : convergente/congruente validiteit
• samenhang met tests die iets anders meten : divergente/ discriminante
validiteit
bv. Angst vragenlijst correleert hoog met andere angst vragenlijsten, maar
mag niet hoog correleren met depressie vragenlijsten
andere validiteitstermeninhoudsvaliditeit• hoe goed representeert de inhoud van de test een geheel van situaties, kennisinhouden of
vaardigheden waarover conclusies getrokken moeten worden?
• = indicatie van de mate waarin de test het domein van mogelijke items representeert
o vaak nagegaan door bevraging van deskundigen
o gevaar van cirkelredenering: vergelijking met andere test
• vooral relevant binnen onderwijskundige diagnostiek
• vaak aan de hand van een testpanel beoordeeld
indrukvaliditeit• mate waarin de persoon die de test aflegt de test relevant, zinvol acht voor datgene
waarvoor hij/zij getest wordt
o relatie tussen test en criterium is duidelijk
o betekenis van test is duidelijk
o is niet echt een vorm van validiteit, maar hoe de proefpersoon het ervaart
• staat los van of de test daadwerkelijk samenhangt met criterium of daadwerkelijk bedoelde
eigenschap meet (cf. ‘faith validity’)
• verwant met ‘transparantheid’
• is wenselijke maar niet noodzakelijke eigenschap van een goede test
incrementele validiteit
• betere voorspelling door het toevoegen van een of meerdere tests aan reeds aanwezige
informatie
• situeert zich op het domein van predictieve validiteit
• voegt de test iets extra toe aan een al bestaande test. Wat voegt het toe aan de al bestaande
test of al gevonden informatie. Is de test op deze manier relevant, nuttig
niet bij alle coëfficiënten ‘hoe hoger hoe beter’ (cf. discriminante validiteit)
tentatieve vuistregel:
• >.50 hoog
• >.30 medium
• >.10 laag
COTAN (niet vanbuiten kennen) • 1959 oprichting Commissie Test Aangelegenheden Nederland (COTAN), naar model van
Educational Test Services in VS
Evalueren van test
- overzicht/beoordeling van in Nederland bestaande en in gebruik zijnde tests:
Documentatie van Tests en Testresearch in Nederland
- vroeger twee boekdelen:
• Testbeschrijvingen
• Testresearch
(eerste editie 1961, nadien aanvullingen/updates)
- nu volledig electronisch systeem
te gebruiken in PPWBIB (paswoord vragen aan de balie)
www.cotandocumentatie.nl
Test kan voor beoordeling ingestuurd worden als hij aan een aantal voorwaarden voldoet:
- in Nederland verkrijgbaar
- voor het Nederlands taalgebied geconstrueerd, vertaald en/of bewerkt
- afnameprocedure gestandaardiseerd
- onderzoek naar of validiteit of betrouwbaarheid of normen
- voor professioneel gebruik ontwikkeld
- maakt direct of indirect uitspraken over personen mogelijk
Tests die niet officieel uitgegeven zijn of die niet genormeerd zijn (waardoor individuele
toepassing af te raden is), kunnen in COTAN opgenomen worden als researchinstrument.
richtlijnen van de COTAN versie mei 2010
1. uitgangspunten van testconstructie
2. kwaliteit van het testmateriaal
3. kwaliteit van de handleiding
4. normen
5. betrouwbaarheid
6. begripsvaliditeit
7. criteriumvaliditeit
Uitgangspunten (cat.1)
1.1. "is het gebruiksdoel van de test aangegeven?"
1.2. "is de herkomst van het constructie-idee beschreven en/of worden de te meten
constructen gedefinieerd?"
1.3. "wordt de relevantie van de testinhoud van de te meten constructen aannemelijk
gemaakt?"
Testmateriaal (cat. 2)
vragen voor papier- en potloodversie
2.1. "zijn de testopgaven gestandaardiseerd?"
2.2. "is er een objectief scoringssysteem?"
2.3. "zijn de vragen vrij van racistische, etnocentrische, seksistische of voor bepaalde
bevolkingsgroepen kwetsende inhoud?
2.4. "zijn items, testboekje, antwoordschalen en/of antwoordformulier zo ontworpen dat
fouten bij invulling vermeden kunnen worden?"
2.5. "is de instructie voor de geteste volledig en duidelijk?”
2.6. “zijn de items correct geformuleerd?”
2.7. “hoe is de kwaliteit van het testmateriaal?”
2.8. “is het scoringssysteem zodanig ontworpen en beschreven dat fouten bij de scoring
vermeden kunnen worden?”
Testmateriaal (cat. 2)
vragen voor afname via computer
2.9. “is de test gestandaardiseerd of worden bij adaptieve tests beslissingsregels
geëxpliciteerd?”
2.10. "is er sprake van een geautomatiseerd of objectief scoringssysteem?"
2.11. "zijn de items vrij van racistische, etnocentrische, seksistische of voor bepaalde
bevolkingsgroepen kwetsende inhoud?
2.12. “is de software zodanig ontworpen dat fouten door onjuist gebruik vermeden
kunnen worden?"
2.13. "is de instructie voor de geteste volledig en duidelijk?”
2.14. “zijn de items correct geformuleerd?”
2.15. “hoe is de kwaliteit van de vormgeving van de gebruikersinterface?”
2.16. “is de test voldoende beveiligd?”
Handleiding (cat. 3)
3.1. "is er een handleiding beschikbaar?"
3.2. "zijn de aanwijzingen voor de testleider volledig en duidelijk?"
3.3. "wordt informatie gegeven over de gebruiksmogelijkheden en beperkingen van de
test?"
3.4. "wordt er een samenvatting van de onderzoeksresultaten gegeven?"
3.5. "wordt met voorbeelden aangegeven hoe de testscores geïnterpreteerd kunnen
worden?"
3.6. "wordt gewezen op soorten informatie die bij de interpretatie van belang kunnen
zijn?"
3.7. "wordt de mate van deskundigheid vereist voor bij afname en interpretatie
vermeld?"
extra vragen bij computerafname
3.8. “wordt er informatie gegeven over de installatie van de computersoftware?”
3.9. “wordt er informatie gegeven over de bediening en mogelijkheden van de
software?”
3.10. “zijn er voldoende mogelijkheden voor technische ondersteuning?”
Normen (cat. 4)
4.1. “worden er normen verstrekt?”
4.2. “zijn de normen actueel?”
normgerichte interpretatie
4.3. “wat is de kwaliteit van de verstrekte normgroepen?”
a. groot genoeg?
b. representatief?
4.4. "worden betekenis en beperkingen van de normschaal duidelijk gemaakt voor de
gebruiker en is het type normschaal in overeenstemming met doel van de test?“
4.5. "worden gemiddelden, standaarddeviaties en gegevens over scoreverdeling
gemeld?“
4.6. "worden gegevens verstrekt over mogelijke verschillen tussen subgroepen?“
4.7. "worden er gegevens verstrekt over de nauwkeurigheid van de meting en de daarbij
behorende intervallen?”
domeingerichte interpretatie
4.8. “is er voldoende overeenstemming tussen beoordelaars?”
4.9. “zijn de procedures op grond waarvan de grensscores zijn bepaald correct?”
4.10. “zijn de beoordelaars naar behoren geselecteerd en getraind?”
criteriumgerichte interpretatie
4.11. “rechtvaardigen de onderzoeksresultaten het gebruik van grensscores?”
4.12. “is de onderzoeksgroep in overeenstemming met het bedoelde gebruik?”
4.13. “is de onderzoeksgroep groot genoeg?”
Betrouwbaarheid (cat. 5)
5.1. "worden er gegevens over de betrouwbaarheid verstrekt?"
5.2. "is betrouwbaarheid voldoende gelet op het beoogde type beslissingen?"
a) paralleltestbetrouwbaarheid
b) betrouwbaarheid op basis van inter-itemrelaties
c) test-hertestbetrouwbaarheid
d) interbeoordelaarsbetrouwbaarheid
e) methoden op basis van item-responstheorie
f) methoden op basis van generaliseerbaarheidstheorie of structurele
vergelijkingsmodellen
5.3. “wat is de kwaliteit van het onderzoek naar de betrouwbaarheid?”
g) "zijn de procedures om betrouwbaarheidsgegevens te berekenen correct?"
h) "zijn de steekproeven in overeenstemming met het beoogde gebruik?"
i) "maken de verstrekte gegevens een gefundeerd oordeel mogelijk?"
Begripsvaliditeit (cat. 6)
6.1. "worden gegevens over begripsvaliditeit vermeld?"
6.2. "maken de resultaten voldoende aannemelijk dat het begrip zoals bedoeld wordt
gemeten?”
a. dimensionaliteit van de scores
b. psychometrische kwaliteit van de items
c. invariantie van factorstructuur/mog. itembias bij verschillende groepen?
d. convergente en discriminante validiteit
e. verschillen tussen relevante groepen?
f. overige gegevens
6.3a. "zijn de procedures om begripsvaliditeitsgegevens te berekenen correct?“
6.3b. "zijn de steekproeven in overeenstemming met het beoogde gebruik?“
6.3c. "wat is de kwaliteit van de andere maten die in het onderzoek gebruikt zijn?“
6.3d. “is de kwaliteit van het onderzoek zodanig dat de beoordeling van de begripsvaliditeit
kan worden bevestigd?”
Criteriumvaliditeit (cat. 7)
7.1. "worden gegevens verstrekt over het verband test-criterium?”
7.2. “zijn de resultaten voldoende gelet op het beoogde type beslissingen?“
7.3a. "zijn de procedures om criteriumvaliditeitsgegevens te berekenen correct?“
7.3b. "zijn de steekproeven in overeenstemming met het beoogde gebruik?“
7.3c. ”wat is de kwaliteit van de criteriummaten?”
7.3d. "is de kwaliteit van het onderzoek zodanig dat de beoordeling van de
begripsvaliditeit kan worden bevestigd?”
werkwijze COTAN
elk van de zeven criteria wordt beoordeeld als 'onvoldoende', 'voldoende' of 'goed'
kwotering is soms argument voor al/niet gebruiken van een test, maar...
relativerende kanttekeningen
- 'goed' alleen voor gebruik bij geteste populatie
- sommige criteria belangrijker dan andere
- gebruik van testen die (nog) niet voldoende scoren moet beargumenteerd worden
COTAN-beoordeling WISC-III KAIT
1. uitgangspunten testconstructie goed goed
2. kwaliteit van het testmateriaal goed goed
3. kwaliteit van de handleiding goed goed
4. normen voldoende voldoende
5. betrouwbaarheid voldoende goed
6. begripsvaliditeit voldoende goed
7. criteriumvaliditeit onvoldoende1 onvoldoende1
1te weinig onderzoek
voorbeeldvragen
• Welke van onderstaande termen kan niet gebruikt worden om P25 aan te duiden?
- percentiel
- kwartiel
- bewerkte score
- deciel
intelligentietesten voor de diagnostische praktijk welke testen er op dit moment in de praktijk gebruikt worden om intelligentie te meten
ontwikkelingstests om ontwikkelingsniveau van jonge kinderen te bepalen
afname vereist training en inzicht in de vroegkinderlijke ontwikkeling
(ontwikkelingspsychologische kennis)
bv. Bayley-III-NL
Bayley Scales of Infant and Toddler Development –III-NLdoor het gebruik van spelmateriaal of door het gedrag van testleider/ouder worden bij het kind
op een gestructureerde manier gedragingen uitgelokt
gericht op het vaststellen van de algemene mentale en motorische ontwikkeling met het oog
op het opsporen van kinderen met risico op ontwikkelingsachterstand
geschikt voor leeftijdsbereik van 16 dagen t.e.m. 42 maanden en 15 dagen
afnameduur: anderhalf uur
interactieve situatie waarop ingespeeld wordt op het gedrag van het kind: er is geen vaste
vollegorde in het aanbieden van de prikkels, maar de onderzoeker die de test af neemt wordt
geacht in te spelen op de situatie en het gedrag van het kind. Zoekt op dat moment wat hij kan
voorleggen. Er moet ook aandacht zijn voor spontaan gedrag.
uitgangspunten:
bij baby’s zijn verschillende ontwikkelingsgebieden sterk verweven met elkaar
tijdens de eerste levensjaren leren kinderen vaardigheden steeds meer onafhankelijk van
elkaar uitvoeren, waardoor gedifferentieerde vaardigheidsgebieden ontstaan
de belangrijkste ontwikkelingsdomeinen tussen geboorte en drie jaar zijn:
cognitieve ontwikkeling
taalontwikkeling
motorische ontwikkeling
sociale en emotionele ontwikkeling
adaptieve ontwikkeling
Structuur:
Cognitie
- exploreren en manipuleren van voorwerpen
- aandacht voor nieuwe stimuli
- constructiespel
- symbolisch spel
- matchen van materiaal of plaatjes
- tellen
- …
Taal
Taalbegrip
- herkennen van bekende geluiden
- identificeren van voorwerpen en
personen
- woordbegrip
- meervoud
- instructies begrijpen
- ….
Taalproductie
- brabbelen
- gebaren
- deelname aan communicatie
- woord- en zinsgebruik
- ….
Motoriek
Fijne motoriek
oog-hand coördinatie
materiaal
manipuleren
fijne handmotoriek
Grove motoriek
hoofdbalans
voortbewegen
voorafgaand aan
lopen
staan
lopen en rennen
balanceren
Sociaal-emotionele ontwikkeling
emotionele en sociale uitingen begrijpen
emotieregulatie
interesse in personen en omgeving
aangaan en onderhouden van relaties
(vragenlijst voor ouders)
Adaptief gedrag
conceptuele vaardigheden, o.a. voorschoolse competenties
sociale vaardigheden, o.a sociaal contact
praktische vaardigheden, o.a. huishoudelijke activiteiten
(vragenlijst voor ouders)
Ook aangepaste versie beschikbaar voor kinderen met lichamelijke of communicatieve
beperkingen
= Bayley- 3- nl special needs addition
klassiekers uit de wechslertraditie Wechsler omschrijft intelligentie als “het vermogen van een individu om doelgericht te
handelen, rationeel te denken en effectief met de omgeving te kunnen omgaan.”
intelligentie is zowel globaal als complex
– globaal: conglomeraat van vaardigheden, algemene intelligentie
– complex: diverse vaardigheden, die inhoudelijk van elkaar te onderscheiden zijn
maar niet onafhankelijk zijn
WPPSI, WISC, WAIS
wechsler preschool en rimary scole of intelligence (WPPSI)
geschikt voor leeftijdsbereik van 2.5 tot 8 jaar
gedeeltelijk verschillende batterij voor jongere kinderen (<4 jaar) en oudere kinderen (>= 4 jaar)
14 subtests, verdeeld over twee vormen voor twee leeftijdscategorieën:
Jongere kinderen (2.5 tot 4 jaar)
Oudere kinderen (4 tot 8 jaar)
drie types subtests:
kernsubtests (nodig voor verbaal IQ, performaal IQ, totaal IQ)
aanvullende subtests (voor aanvullende info en onder bepaalde voorwaarden ter
vervanging van kernsubtests en/of om aparte indexscores te berekenen)
optionele subtests (om aparte indexscores te berekenen, maar nooit ter
vervanging van kernsubtests)
Jonge kinderen:
5 subtests, resulterend in 3 IQ-scores en een Algemene Taalindex
afnameduur 35-42 minuten (kernsubtests 30-35 minuten)
Oudere kinderen:
14 subtests, resulterend in 3 IQ-scores, een Verwerkingssnelheidsquotiënt en een
Algemene Taalindex
afnameduur 70-90 minuten (kernsubtests 40-50 minuten)
sommige subtests zijn vereenvoudigde versies van subtests uit de andere Wechslertests (WISC
en/of WAIS)
andere subtests zijn specifiek voor deze jongere leeftijdsgroep
binnen de wechsler traditie zijn de verschillende subtest parallel vormen van elkaar
Stimulus materiaal wppsi:
receptieve woordenschat
- 4 afbeeldingen van wolken
- Waar regent het?
Informatie
- 4 afbeeldingen
- Wat kan je opeten
Maatrix redeneren
- Wat hoort er op de plaats van het vraagteken
Plaatjes concepten
- 4 afbeeldingen in 2 groepen
- 2 afbeeldingen kiezen die samen horen (bv, 2 dieren)
Onvolledige tekeningen
wechsler intelligence scale (wisc)
geschikt voor leeftijdsbereik van 6 tot 17 jaar
13 subtests, resulterend in drie IQ-scores:
– Totaal IQ
– Verbaal IQ (IN, OV, RE, WO, BG, CRaanv)
– Performaal IQ (OT, SU, PO, BP, FL, Svopt, DHaanv)
en drie factorscores:
– Verbaal Begrip (IN, OV, WO, BG)
– Perceptuele Organisatie (OT, PO, BP, FL)
– Verwerkingssnelheid (SU, SV)
afnameduur: 50 tot 85 minuten
in 2014 is in de VS de WISC-V verschenen
momenteel wordt gewerkt aan vertaling, bewerking en normering voor het Nederlandse
taalgebied (verwacht in 2018)
totaal IQ en vier factorscores (Verbaal Begrip, Perceptueel Redeneren, Werkgeheugen,
Verwerkingssnelheid)
verbaal IQ en perforaal IQ geschrapt
wechsler adult intelligence scale (wais) geschikt voor leeftijdsbereik van 16 tot 85 jaar
15 subtests
10 corresponderend met subtests van WISC-III-NL
(IN, OV, RE, WO, BE, CR, OT, BP, SS-C, SZ)
noot: SS-C (Symbool Substitutie-Coderen) correspondeert met SU
2 niet-corresponderend met WISC-III-NL maar overgenomen uit WAIS-III-NL
- Cijfers en Letters Nazeggen (CLN)
Reeksen die zowel cijfers als letters bevatten
- Matrix Redeneren (MR)
3 volledig nieuwe subtests
- Figuur Samenstellen (FS)
Een figuur is opgedeeld in verschillende delen
De delen zoeken uit een aangeboden groep afbeeldingen
- Gewichten (GW)
Weegschaal in balans brengen
- Figuur Zoeken (FZ)
Al dezelfde figuren zoeken en doorstrepen
15 subtests, resulterend in
één IQ-score en
vier indexscores:
- Verbaal Begrip = VBI (IN, OV, WO, BGaanv)
- Perceptueel Redeneren = PRI (BP, MR, FS, GWaanv, OTaanv)
- Werkgeheugen = WgI (CR, RE, CLNaanv)
- Verwerkingssnelheid = VsI (SZ, SSC, FZaanv)
afnameduur 90 tot 120 minuten
Merk op dat in deze ‘vierde generatie’ VIQ en PIQ weggevallen zijn. In plaats daarvan moeten
nu de indexscores VBI en PRI gebruikt worden.
Overlap in leeftijdsbereik tussen WPPSI-III-NL en WISC-III-NL en tussen WISC-III-NL en WAIS-IV-
NL
Wat met proefpersonen die in dat overlappend leeftijdsbereik vallen? Keuze mee laten bepalen
door
- verwachte intelligentieniveau (bv. Lager leeftijdsbereik nemen als we verwachten dat de
persoon laag gaat scoren)
- bekendheid met een van de tests
- verwachte aandacht spannen (bij een hogere test gaat het kind ook meer items moeten
afleggen)
Bij bepaalde segmenten kan men kiezen welke intelligentie test men gebruikt
- Afhankelijk van het verwachte niveau
- Bij hertesting
- Aandachtspannen van het kind
niet verbale intelligenties wechsler non verbal scole of ability (wnv) explicatie niet verbale, wanneer taal voor een barrière zorgt
- gebaseerd op gedachtengoed van Wechsler, maar ontwikkeld door Naglieri
- aanwijzingen hoofdzakelijk visueel
- specifiek geschikt voor doven, slechthorenden, kinderen met spraak-en taalproblemen,
kinderen met een allochtone achtergrond en kinderen met autismespectrumstoornis
- geschikt voor leeftijdsbereik van 4 tot 22 jaar
Expliciet niet verbaal
Voor groepen waarbij er problemen zijn met de taalbeheersing/ taalontwikkeling
zes subtests in totaal, maar slechts vier per leeftijdscategorie
4 tot 8 jaar: jongste leeftijdscategorie
8 tot 22 jaar: oudste leeftijdscategorie
- voor elke leeftijdscategorie korte (2 subtests) en lange (4 subtests) versie
- resulteert in totaal IQ
- afnameduur: 20 tot 45 minuten
- subtests voor de jongste leeftijdscategorie
Matrix Redeneren (MR)
Substitutie (SU)
Figuur Leggen (FL)
Herkennen (HE)
- subtests voor de oudste leeftijdscategorie
Matrix Redeneren (MR)
Substitutie (SU)
Plaatjes Ordenen (PO)
Ruimtelijke Oriëntatie (RO)
Proefleider tikt een aantal blokken aan in een bepaalde volgorde. Geteste persoon moet deze
handeling herhalen. Varianten voorwaarts en achterwaarts.
pantomimische instructie WNV
Gebaren, wijzen, …
snijders-Oomen Niet-verbale intelligentietest (son-r 2.5-7) meet een breed gamma van intelligentieaspecten zonder van taal afhankelijk te zijn
doelgroep: gehoorgestoorde en dove kinderen, allochtone kinderen die de taal van de
testleider niet of beperkt beheersen, moeilijk testbare kinderen
geschikt voor leeftijdsbereik van 2.5 tot 7 jaar
handleiding bevat zowel verbale als niet-verbale instructie
- V: “Jij mag deze net zo maken”
- NV: Wijs naar het kind, dan naar het plaatje in het boek, vervolgens naar de kader
en maak een vragend gebaar.
afnameduur 50 tot 60 minuten
twee schalen
- Performale schaal (SON-PS)
Mozaïeken, Puzzels, Patronen
- Redeneerschaal (SON-RS)
Categorieën, Analogieën, Situaties
snijders-oomen niet verbale intelligentieteste (son-r 6-40)uitgangspunten en doelgroep vergelijkbaar met SON-R 2.5-7
geschikt voor leeftijdsbereik van 6 tot 40 jaar
vier subtests, resulterend in één IQ-score:
- Analogieën
- Mozaïeken
- Categorieën
- Patronen
afnameduur: 40 tot 70 min
theoretishe en factoriële inteligentietests Tests uit de Stanford-Binet en Wechsler tradities zijn weinig theoretisch en doorgaans niet sterk
gebaseerd op factoranalyse. De theorie en de factoranalyse zijn opgebouwd na het maken van
de test
Er bestaan intelligentietests waarbij dat wel veel explicieter het geval is (KAIT en RAKIT)
kaufman adolescent and adult intelligence test (Kait)gebaseerd op een integratie van drie modellen over intelligentie
- Horn en Cattell: Fluid/Chrystallized Intelligence
- Luria: vermogen tot planning
- Piaget: stadium van logische operaties
afnameduur 65 tot 90 minuten
doelgroep: adolescenten en volwassenen van 14
tot 85+ jaar
bestaat uit 10 subtests, resulterend in 3 IQ-scores :
- Totaal IQ
- Fluid IQ
- Chrystallized IQ
Definities:
Een woord vervolledigen
Aanwijzing met een definitie van het woord
Dubbele betekenisen
Een ander woord vinden dat voor 4 andere woorden overeen komt
Idool, maan, film, hemel ster
Symbolen leren
Een betekenis toekennen aan picotgrammen
Deze vormen een zin die de cliënt moet kunnen lezen
Geheime codes
Code aanleren die daarna gebruikt wordt in andere context
revisie amsterdamse kinder intelligentei test (rakit-2)- bedoeld om het niveau van zowel de algemene intelligentie als van specifieke
intelligentiefactoren te onderzoeken
- specifiek geschikt voor leerlingen met een lichte tot matige verstandelijke beperking
(IQ-range 40 tot 145)
- geschikt voor leeftijdsbereik van 4 tot 12;6 jaar
- sluit aan bij de opvattingen van Thurstone
- 12 subtests, resulterend in 1 IQ-score :
- Totaal IQ
vier factorscores :
- Verbaal Leren (o.a. Woordbetekenis, Namen Leren)
- Perceptueel Redeneren (o.a. Figuur Herkennen)
- Ruimtelijke Oriëntatie en Tempo (o.a. Doolhoven, Schijven)
- Verbale Vlotheid (o.a. Ideeënproductie)
afnameduur: 1,5 tot 2 uur
verkorte vorm met 6 subtests (45 min tot 1 uur), bedoeld om een globale indruk van het
cognitief functioneren te krijgen
Namen leren:
Aan de hand van plaatjes concepten leren
Figuren leren
Stukken van de figuur worden weg gelaten
De figuur moet herkend worden
Doolhoven
Schijven
Schijven met gaten passen op een bord met nagels
Ideeënproductie
Wat kan je optillen
Wat kan je allemaal doen op straat
Wat kan je allemaal zien in een winkel
Meet niet het convergent denken (een juist antwoord, ons denken zoekt dit ene
antwoord)
Divergent denken: er is niet een juist antwoord, maar veel verschillende goede
antwoorden
covat-chc basisversie - pen en papiertest geschikt voor afname bij kinderen tussen 9j6m en 13j11m
- opgesteld volgens het Catell-Horn-Caroll (CHC) model
- kan zowel individueel als in groep afgenomen worden
- bevat 9 subtests die vijf brede cognitieve vaardigheden meten:
- Puntreeksen (Gf)
- Figuurreeksen (Gf)
- Schiftingen (Gc)
- Tegenstellingen (Gc)
- Geheugen A (Gsm)
- Geheugen B (Gsm)
- Gedraaide Figuren (Gv)
- Dozen Plooien (Gv)
- Geheime code (Gs)
overzicht per leeftijd bruikbaar vanaf zuigelingenleeftijd
- Bayley-III-NL 16 dagen– 42 maanden 15 dagen
bruikbaar vanaf kleuterleeftijd
- WPPSI-III-NL 2.5 – 8 jaar
- SON2.5-7 2.5 – 7 jaar
- RAKIT-2 4 – 12.5 jaar
- WNV 4 – 22 jaar
bruikbaar vanaf lagereschoolleeftijd
- WISC-III-NL 6 – 17 jaar
- SON-R 6-40 6 – 40 jaar
- CoVaT CHC-basisversie 9;6 – 13;11 jaar
bruikbaar vanaf adolescentie
- KAIT 14 - 85 jaar
- WAIS-IV-NL 16- 85 jaar
persoonlijkheidsvragenlijsen voor de diagnostische praktijk constructiemethode
persoonlijkheidsvragenlijsten bestaan uit een set van items, die doorgaans verder
onderverdeeld worden in subschalen
afhankelijk van de constructiemethode worden items op verschillende manieren aan
subschalen toegekend
bekendste methoden:
- Empirisch
- Factoranalytisch
- theoretisch
empirisch/criteriumgericht
- betekenis van items/structuur van het instrument wordt bepaald op basis van de
samenhang met een specifiek criterium
- bijv. item komt in de schaal ‘depressie’ als het discrimineert tussen depressieven
en niet-depressieven
factoranalytisch/inductief
- betekenis van items/structuur van het instrument gebaseerd op factoranalytische
bevindingen
- items komen in de schaal corresponderend met de factor waarop ze hun hoogste
lading hebben
- clusters van items die samen gezet worden in een subschaal
theoretisch/apriori/deductief
– betekenis van items/structuur van het instrument a priori gedefinieerd op basis
van psychologische theorie
– bijv. als depressie geconceptualiseerd wordt als een multidimensioneel construct
bestaande uit drie deelcomponenten (affectief, cognitief, fysiologisch), dan wordt
een vragenlijst geconstrueerd bestaande uit drie schalen corresponderend met
de deelcomponenten
In de praktijk vaak combinatie van methoden (bijv. eerst a priori formulering, maar nadien toch
factoranalyse)
empirische vragenlijsten MMPI-2 MMPI-A MMPI-2 RF
minnesota multiphasic personality inverntory 2 (mmpi-2) MMPI is een van de oudste persoonlijkheidsvragenlijsten (eerste versie handleiding in
1943)
eerste versie ontwikkeld door McKinley en Hathaway om persoonlijkheidsaspecten van
patienten in kaart te brengen
sterk klinische inslag
huidige versie (MMPI-2):
- 567 items
- geschikt voor afname vanaf 18 jaar
- antwoordschaal ‘akkoord’ / ‘niet akkoord’
- afnameduur 60 tot 90 minuten
- ruwe scores omgezet in t-scores
Constructie van 10 ‘klinische schalen’:
- lijst van 1000 mogelijke items uit bestaande vragenlijsten, beoordelingsschalen,
psychiatrische interviews, handboeken psychiatrie, eigen klinische ervaring,...
- na eliminatie van redundante en weinig relevante items restten er 504 items, die
voorgelegd werden aan normalen en diverse klinische groepen
- schaalconstructie volgens de empirische methode, met als gevolg:
• sommige items weinig face valid
• schalen heterogeen van inhoud (want zijn allemaal op hetzelfde criterium
gebaseerd)
• items kunnen tot meerdere schalen behoren (items behoren niet
noodzakelijk tot 1 subschaal, maar kunnen meerdere meten)
Validiteitsschalen- ontwikkeld als controlemiddel omdat mensen door de grote hoeveelheid vragen
vaak niet meer helemaal correct antwoorden
- om na te gaan in welke mate de testresultaten beïnvloed zijn door
antwoordtendenzen (bijv. faking good/bad)
- diverse types:
• Vraagtekenschaal
• L-schaal
• F-schaal
• K-schaal
• Fb-schaal
• VRIN-schaal
• TRIN-schaal
Vraagtekenschaal (alle items)
• som van alle opengelaten of dubbel beantwoorde items
• cut-off=15 hoger dan 15 = vermelden in verslag
L-Schaal of Leugenschaal
• meet algemene tendens tot liegen
• items die doorgaans positief beantwoord worden
• “Niet akkoord” antwoorden = liegen
- Item 29: Zo nu en dan heb ik zin om te vloeken
- Item 77: Af en toe stel ik uit tot morgen wat ik vandaag had moeten doen
K-schaal
• meet neiging om defensief te antwoorden (men wil dit niet van zichzelf toegeven)
• 30 items, waarvan meeste doorgaans positief beantwoord worden (niet
akkoord=defensief)
- Item 37 (niet akkoord): soms heb ik zin om iets kapot te slaan
- Item 127 (niet akkoord): kritiek of uitbranders kwetsen mij
F-Schaal
- Meet deviante en atypische manieren van antwoorden (afwijkende antwoorden)
Kan erge afwijking aantonen, of een niet valide antwoord patroon
- 60 items die zelden (<10%) positief beantwoord worden
• Item 24 (akkoord): Af en toe ben ik bezeten door boze geesten
• Item 126 (niet akkoord): Ik vind dat de wet gehandhaafd moet worden
Fb-Schaal
• Meet deviante en atypische manieren van antwoorden
• zitten op het einde van de test, om effecten van vermoeidheid na te gaan
VRIN schaal (Variable Response Inconsistency)
• 67 itemparen - meet tendens om op een inconsistente manier te antwoorden, waarbij de
configuraties ‘ja/nee’ en ‘nee/ja’ teken zijn van inconsistentie
- Item 28A en Item 59NA
• Item 28 (Akkoord): Mijn maag is meerdere keren per week van streek
• Item 59 (Niet akkoord): Om de paar dagen of vaker heb ik last van een
onaangenaam gevoel in mijn maag
TRIN schaal (True Response Inconsistency)
• 23 itemparen - meet tendens om op een inconsistente manier te antwoorden, waarbij de
configuraties ja/ja en nee/nee teken zijn van inconsistentie
• Item 3A – Item 39A
- Item 3 (A): ‘s Morgens word ik meestal fris en uitgerust wakker
- Item 39 (A): Mijn slaap is onregelmatig en gestoord.
• Item 262NA– Item 275NA
- Item 262 (NA): Ik zou het niet vervelend vinden als ze mij in een groep mensen
zouden vragen een gesprek te beginnen
- Item 275 (NA): Op school vond ik het erg moeilijk om voor de klas te spreken
• Ja of nee zeg tendens: mensen zijn geneigd om op testen sneller ja of nee te antwoorden
Inhoudsschalen
• klassieke klinische schalen zijn door de empirische constructiewijze erg heterogeen van
inhoud, waardoor twee personen een zelfde score kunnen behalen vanuit een zeer
uiteenlopend antwoordpatroon
klinische schalen verder ingedeeld in subschalen door te kijken naar inhoudelijke
kenmerken inhoudsschalen
• Harris en Lingoes ontwikkelden subschalen voor zes van de tien klinische schalen met
items die een gelijkaardige inhoud hebben
- bijv voor Depressie: Subjectieve depressie (D1), Psychomotorische retardatie
(D2), Lichamelijk slecht functioneren (D3), Mentale vervlakking (D4) en Piekeren
(D5)
• Wiggins construeerde over de klinische schalen heen inhoudsschalen vertrekkend van
de hele pool van MMPI-items
- bijv ANX (angst), FAM (gezins- en sociale problemen), OBS (obsessiviteit), CYN
(cynisme), LSE (lage zelfwaardering)
- kunnen geclusterd worden in vier inhoudsgebieden: Inwendige symptomen (bijv
ANX), naar buiten gerichte agressie (bijv. CYN), negatief zelfbeeld (LSE), algemene
probleemgebieden (bijv. FAM)
• Ook vele anderen construeerden doorheen de tijd nieuwe subschalen; voor veel van
deze schalen is er tot op heden te evenwel weinig empirische onderbouw
MMPI AMMPI-2 ook interessant voor adolescenten
- puberteit is een periode van verhoogde kwetsbaarheid: belangrijk om een goed
diagnostisch instrument te hebben
maar afname ervan bij deze doelgroep valt tegen
- te lang en te moeilijk
- normen volwassenen niet bruikbaar: ‘normale’ adolescenten scoren op sommige
schalen hoger dan volwassenen vanwege de ‘sturm und drang’-fase
- sommige specifiek voor adolescentie relevante topics (bijv. schoolproblemen)
komen niet aan bod
constructie van een specifieke variant voor adolescenten (MMPI-A)
- bestaat uit 478 items
- geschikt voor leeftijdsbereik van 13 tot 18 jaar
- afnameduur 90 minuten
- bevat heel wat items en schalen die identiek zijn aan MMPI-2 items, maar
daarnaast ook specifiek op adolescentie betrekking hebbende items en
(inhouds)schalen
MMPI-2 RF (restructured form)• korte versie van de MMPI-2
• bestaat uit 338 items
• herziening klinische schalen (‘restructured clinical scales’):
- itemoverlap verwijderen (per paar van klinische schalen gemiddeld 6 items
overlap)
- items die naar ‘demoralisatie’ (=algemene distress) verwijzen in een aparte schaal
zetten
- daardoor sterk verminderde subschaal intercorrelaties in vergelijking met MMPI-
2
9 subschalen
• RCd Demoralisatie
- algemeen emotioneel ongenoegen, onzeker, pessimistisch, laag gevoel van
eigenwaarde, gevoel te hebben gefaald.
- Staat los van de andere
• RC1 Somatische klachten
- somatische klachten, excessieve preoccupatie met lichamelijke zorgen en
gezondheidsproblemen, moeheid, zwakte en chronische pijn.
- Vroeger hypochondrie
• RC2 Lage positieve emoties
- anhedonie, depressief, pessimistisch, neiging zich terug te trekken, verveling,
isolatie, gebrek aan energie, moeite met het nemen van beslissingen.
- Vroeger depressie
• RC3 Cynisme
- aangeven dat anderen niet vertrouwen zijn, oneerlijk, alleen voor zichzelf zorgen
en anderen uitbuiten.
- Vroeger hysterie
• RC4 Antisociaal gedrag
- antisociaal en oppositioneel gedrag, agressiviteit en boosheid, liegen en
bedriegen, moeite met zich te conformeren aan maatschappelijke normen,
problemen met justitie, familieconflicten, middelenmisbruik.
- Vroeger psychopathische deviatie
• RC6 Betrekkingsideeën
- persoon als schietschijf, slachtoffer van krachten van buiten, omringd met
boosaardige mensen.
- Vroeger wanen
• RC7 Dysfunctionele negatieve emoties
- angst, geïrriteerdheid, ongelukkig, hopeloos, piekeren, overgevoelig,
schuldgevoelens, instructieve gedachten.
• RC8 Afwijkende ervaringen
- hallucinaties, bizarre perceptuele ervaringen, waanachtige ideeën, gebrekkige
realiteitstoetsing.
- Vroeger schizofrenie
• RC9 Hypomanische activatie
- grandioos zelfbeeld, algehele opwinding, sensation seeking, risicovol gedrag,
slechte impulscontrole, euforie, verminderde behoefte aan nachtrust, ‘racing
thoughts’ en agressie
MMPI-2 RF heeft in totaal 51 schalen:
- 9 herziene klinische schalen
- 3 hogereordeschalen (cluster klinische schalen)
• emotionele dysfunctie / internaliseren
• dysfunctie in het denken
• gedragsmatige dysfunctie / externaliseren
- 9 validiteitsschalen
• VRIN-r
• TRIN-r
• F-r
• Fp-r (vergelijking met psychopathologiegroep)
• Fs (zeldzame somatische symptomen)
• FBS-r (“fake bad”)
• L-r
• K-r
- 23 specifieke probleemschalen
• somatisch/cognitieve schalen
• internaliserende schalen
• externaliserende schalen
• interpersoonlijke schalen
- 2 interesseschalen
• esthetisch-literair
• mechanisch-fysisch
- 5 schalen die peilen naar persoonlijkheidspathologie
• agressiviteit
• psychoticisme
• ontremming
• negatieve emotionaliteit
• introversie/lage positieve emotionaliteit
Klinische schalen worden geclusterd in hogereordeschalen
MMPI-2 RF heeft een betere constructvaliditeit en sluit beter aan bij recente theorieën en
bevindingen mbt persoonlijkheid en psychopathologie dan MMPI-2
MMPI-A RF in voorbereiding (aangekondigd voor 2016) (voor adolescenten gaat binnenkort ook
herwerkt worden)
factoranalytische vragenlijsten NEO-PI-R, NEO-FFi en HiPiC
neo-pi-3 en neo-ffi-3
• geworteld in de lexicale traditie:
- assumptie dat voor gedrag dat binnen een cultuur belangrijk geacht wordt één of
meer termen in de taal opgenomen zijn, meestal in de vorm van
persoonsbeschrijvende adjectieven
- om de 5 belangrijkste individuele verschillen in persoonlijkheid in kaart te
brengen kan men best vertrekken van in de taal aanwezige
persoonsbeschrijvende adjectieven
• oorsprong van het instrument ligt in factoranalytisch onderzoek van McCrae en Costa
• Amerikaanse traditie: geroteerde factoren (i.t.t. Engelse traditie: orthogonale factoren)
• oorspronkelijk slechts drie factoren/domeinen:
- Neuroticisme (N)
- Extraversie (E)
- Openheid (O) – vandaar ‘NEO’
• later twee toegevoegd:
- Altruisme
- Conscientieusheid
NEO-PI-3 bestaat uit 240 items
• geschikt voor afname vanaf 16 jaar
• afnameduur 40 tot 50 minute
• ruwe scores omgezet in stanines
• algemene bevolkingsnormen, afzonderlijk voor geslacht, leeftijd, opleidingsniveau
• voor elk domein verdere differentiatie in zes facetten:
– meten deelaspecten van het bredere domein
– binnen deze 6 facetten zitten nog onderverdelingen in gedragingen
– dit zorgt er voor dat we heel gedifferentieerde persoonlijkheidsdiagnostiek
kunnen doen
– garandeert dat voor elk domein een brede range aan ervaringen, gevoelens en
gedragingen gerepresenteerd is
– biedt mogelijkheid om individuele verschillen binnen een domein te detecteren
(=verfijning van de diagnostiek)
per schaal
per faccet
NEO-FFI-3 is verkorte versie, bestaande uit 60 items
• geschikt voor afname vanaf 16 jaar
• afnameduur 10 tot 20 minuten
• geen verdere differentiatie in facetten
Enkel domein scores, geen facettten
• domeinscores kunnen uitgezet worden in ‘stijlgrafieken’
• verschillende aspecten van ‘stijl’ gedefinieerd aan de hand van paren van
persoonlijkheidsdomeinen
- emoties N+E
- afweermechanismen N+O
- omgang met boosheid N+A
- beheersing impulsiviteit N+C
- interesses E+O
- sociale interacties E+A
- manier van doen E+C
- attitudes O+A
- leren O+C
- maatschappelijke houding A+C
Combinaties van domeinen om tot een unieke situatie te komen
hipic (hierarchische persoonlijkheidsvragenlijsten voor kindern)• in Vlaanderen ontwikkelde ‘Big Five’- vragenlijst voor kinderen van 6 tot 12/13 jaar
(Ned/Vlaanderen)
• bestaat uit 144 items
• primair bedoeld voor beoordeling door derden
(ouders, gezinsleden>16j, leerkrachten)
• multi-informant methode aanbevolen
• afnameduur 30 minuten
• ruwe scores omgezet in stanines
• 5 domeinen, op factoranalytische wijze verkregen
• Emotionele Stabiliteit
• Extraversie
• Vindingrijkheid
• Welwillendheid
• Consciëntieusheid
• verder onderverdeeld in 18 facetten
Emotionele Stabiliteit
Angst “maakt zich vlug zorgen over iets”
Zelfvertrouwen “neemt gemakkelijk beslissingen”(R)
Extraversie
Energie “heeft energie te koop”
Expressiviteit “houdt gevoelens en gedachten voor zichzelf” (R)
Optimisme “ziet de zonnige kant van de dingen”
Verlegenheid “zoekt contact met nieuwe klasgenoten” (R)
Vindingrijkheid
Creativiteit “heeft plezier in het creëren van iets”
Intellect “heeft vlug inzicht in iets”
Nieuwsgierigheid “leert graag iets bij”
Welwillendheid
Altruïsme “verdedigt de zwakkeren”
Dominantie “speelt de baas”
Egocentrisme “kan moeilijk met anderen iets delen”
Gehoorzaamheid “gehoorzaamt zonder protest”
Irriteerbaarheid “is vlug op de tenen getrapt”
Consciëntieusheid
Concentratie “werkt met volgehouden aandacht”
Doorzettingsvermogen “houdt vol tot het doel bereikt is”
Ordelijkheid “laat alles rondslingeren” (R)
Prestatiemotivatie “wil in alles uitblinken”
theoretische vragenlijsten temperament en karakter vragenlijst (TCI en VTCI)
• gebaseerd op de psychobiologische theorie van Cloninger
• personlijkheidstheorie die sterk klinisch georiënteerd is
• onderscheid tussen temperament en karakter
- temperament : erfelijk beïnvloed, vroeg observeerbaar, beïnvloedt leerprocessen
automatisch en onbewust
- karakter : komt pas op volwassen leeftijd tot volledige ontwikkeling, beinvloedt
persoonlijke en sociale effectiviteit en zelfwaardegevoel
• vier temperamentschalen met subschalen (lijkt gebaseerd op het 5 factoren model)
- Prikkelzoekend (lijkt op extraversie)
• ontdekkingsdrang (“ik verken graag nieuwe manieren om dingen te
doen”)
• impulsief (“ik lees graag alles wanneer me gevraagd wordt iets te
ondertekenen” (R))
• extravagant (“ik geef liever geld uit dan dat ik spaar”)
• wanordelijk (“ik ben graag goed georganiseerd en stel, wanneer ik maar
kan, regels op voor andere mensen” (R))
- Leedvermijdend
• dwangmatig-piekerend (“meestal ben ik bezorgder dan de meeste
mensen dat er in de toekomst iets mis zal gaan”)
• onzekerheidsangst (“ik voel me gewoonlijk gespannen en bezorgd als ik
iets nieuws en onbekends moet doen”)
• verlegen (“ik ben helemaal niet verlegen onder vreemden” (R))
• kwetsbaar (“ik herstel sneller dan de meeste mensen van kleine kwaaltjes
of stress” (R))
- Sociaalgericht
• sentimenteel (“ik ben vaak diep ontroerd door een mooie toespraak of
poëzie”)
• intimiteit (“ik hou mijn problemen het liefst voor mezelf (R))
• afhankelijk (“ik doe dingen gewoonlijk op mijn manier, liever dan toe te
geven aan de wensen van anderen” (R))
- Volhardend (geen subschalen)
“ik ben perfectionistischer dan de meeste mensen”
• drie karakterschalen, met subschalen (compmlexere combinaties van facetten van
persoonlijkheid)
- Zelfsturend
• verantwoordelijk (“mijn daden worden hoofdzakelijk bepaald door
invloeden waar ik geen controle over heb” (R))
• doelbewust (“mijn gedrag wordt sterk geleid door bepaalde doelen die ik
mezelf in het leven heb gesteld”)
• vindingrijk (“ik beschouw een moeilijke situatie meestal als een uitdaging
of een nieuwe kans”)
• positief zelfbeeld (“ik zou vaak willen dat ik slimmer was dan wie ook” (R))
• goede gewoontes (“mijn wilskracht is te zwak om erg grote verleidingen
te weerstaan, zelfs als ik weet dat ik onder de gevolgen zal lijden” (R))
- Coöperatief
• tolerant (“gewoonlijk respecteer ik de meningen van anderen”)
• empathisch (“ik schijn de meeste mensen niet zo goed te begrijpen” (R))
• behulpzaam (“ik help graag een oplossing voor problemen te vinden waar
iedereen beter van wordt”)
• vergevingsgezind (“ik vind het prettig anderen te helpen, zelfs als ze me
slecht behandeld hebben”)
• gewetensvol (“je hoeft niet oneerlijk te zijn om in bepaalde zaken te
slagen”)
- Zelftranscendent
• zelfverliezend (“ik heb wel eens het gevoel gehad dat ik onderdeel was
van iets zonder limieten of grenzen in tijd en ruimte”)
• natuurgericht (“ik heb vaak een sterk gevoel van eenheid met alle dingen
om me heen”)
• magisch denken (“ik geloof dat wonderen gebeuren”)
TCI
• bestaat uit 240 items
• geschikt voor afname bij jongeren en volwassenen vanaf 15 jaar (in de praktijk nog erg
moeilijk voor jongeren)
• afnameduur 40 minuten
VTCI
• is verkorte versie, bestaande uit 105 items
• bevat alleen de hoofdschalen
• geschikt voor afname vanaf 12 jaar
• afnameduur 15 tot 20 minute
• ruwe scores in beide versies omgezet in zevenpuntsnormscores
combinatie van methodes NPV-2-(r) en NPV-J-2
nederlandse persoonlijkheidsvragenlijst-2 (npv-2)• oorspronkelijk Nederlandstalig instrument, ontworpen om aspecten van
persoonlijkheid te meten die relevant zijn in verschillende praktijkgebieden
(gezondheidszorg, onderwijs, beroepskeuze, selectie...)
• tot stand gekomen via combinatie van constructiemethodes (empirisch,
factoranalytisch, apriori)
• geschikt voor afname bij jongeren en volwassenen vanaf 15 jaar
• 140 items, verdeeld over zeven subschalen:
- Inadequatie/Neuroticisme (IN)
- Sociale Inadequatie (SI)
- Rigiditeit (RG)
- Verongelijktheid (VE)
- Zelfgenoegzaamheid (ZE)
- Dominantie (DO)
- Zelfwaardering (ZW)
• Voorbeelditems
- IN “ik ben vaak zenuwachtig”
- SI “ik vind het vervelend met onbekenden te praten”
- RG “een regelmatig levenspatroon bevalt me het best”
- VE “er zijn maar weinig mensen die mij begrijpen”
- ZE “mensen vinden mij vaak egoïstisch”
- DO “in een gesprek ben ik meestal degene die aan het woord is”
- ZW “ik vind dat ik veel goede eigenschappen bezit”
• normgroepen uit diverse contexten (selectie, psychiatrische patiënten, somatische
patiënten, eerstelijnscliënten)
• afnameduur 30 minuten
• in 2013 verscheen de NPV-2, een herziene versie van de NPV, waarin een aantal items
taalkundig gewijzigd zijn en een aantal andere items vervangen door nieuwe items
• in 2014 verscheen de NPV-2-r, met mogelijkheid een aantal subschaalscores te
berekenen:
• Depressiviteit en Angst bij Inadequatie/Neuroticisme
• Verlegenheid en Sociale Vermijding bij Sociale Inadequatie
• Ordelijkheid en Inflexibiliteit bij Rigiditeit
• Leidinggeven en Autonomie bij Dominantie
junior nederlandse persoonlijkheidsvragenlijst-2 npv-j-2• geschikt voor leeftijdsbereik van 9 tot 16 jaar
• aanpassing voor kinderen van de NPV
• zelfrapportering
• 100 items, verdeeld over vijf subschalen:
- Inadequatie/Neuroticisme (IN)
- Volharding (VO)
- Sociale Inadequatie (SI)
- Recalcitrantie (RE)
- Dominantie (DO)
• afnameduur 20 minuten
• voorbeelditems
IN: “ik ben vaak bang in het donker”
VO: “voordat ik iets leuks ga doen, wil ik eerst mijn werk af hebben”
SI: “als mensen naar mij kijken word ik verlegen”
RE: “ik geloof dat veel mensen je proberen te bedriegen”
DO: “ik hou ervan tegen anderen te zeggen wat ze moeten doen”
gericht op een specifieke context NKPV en BIP
nederlandse klinische persoonlijkheidsvrgenlijst (nkpv)• ontwikkeld om klinisch relevante persoonlijkheidskenmerken in kaart te brengen bij
volwassenen in de geestelijke gezondheidszorg
• omdat gewone persoonlijkheidsvragenlijsten vaak niet goed differentiëren in het uiterste
van het persoonlijkheidsspectrum, de pathologie
• hoe situeert iemand zich ten aanzien van de gewone bevolking en van de klinische
doelgroep
• bruikbaar vanaf 17 jaar
• zelfrapportering
• 120 items, verdeeld over zes subschalen:
- Negativisme
- Somatisering
- Verlegenheid
- Ernstige Psychopathologie
- Extraversie
- Narcisme
• afnameduur 20 à 30 minuten
• genormeerd op zowel algemene bevolking als psychiatrische patiënten
• Het kan interessant zijn om bij een persoon met de twee normgroepen te werken
bip • ontwikkeld om persoonlijkheidskenmerken in kaart te brengen die relevant zijn voor het
functioneren in een werkomgeving, specifiek bedoeld voor de werkcontext
• bruikbaar vanaf 20 jaar
• zelfrapportering
• 196 items, verdeeld over veertien subschalen in vier domeinen
• afnameduur 45 minuten
overzicht per leeftijd bruikbaar vanaf kleuterleeftijd
– HiPIC 6-12/13 jaar
bruikbaar vanaf lagereschoolleeftijd of vroege adolescentie
– NPV-J2 9 – 16 jaar
– VTCI 12 jaar – hoogbejaard
– MMPI-A 13-18 jaar
bruikbaar vanaf adolescentie of volwassenheid
– TCI vanaf 15 jaar
– NPV-2 (r) vanaf 15 jaar
– NKPV vanaf 17 jaar
– MMPI-2 (RF) vanaf 18 jaar
– NEO-PI-R en NEO-FFI vanaf 18 jaar
– BIP vanaf 20 jaar
het diagnostisch proces het ongewapend oordeel een diagnostische vraag is geen eenvoudig gegeven
• diagnostiek = complex proces van verzamelen, interpreteren en afwegen van informatie met
het oog op het nemen van de beslissing of er iets, en zo ja wat, gedaan kan worden t.a.v.
vraag/klacht
• meestal geen pasklaar antwoord, diagnosticus moet oordelen en beslissen in onzekerheid
• dit vergt een heel beslissingsproces, in het nemen van deze beslissingen speelt de persoon
van de diagnosticus een belangrijke beïnvloedende rol. Het denken van mensen is
onderheven aan bepaalde denkfouten, aan vertekeningen. Hier moeten we ons als
diagnosticus tegen wapenen
• we kunnen ons tegen deze denkfouten wapenen door systematisch te werk te gaan
• als de diagnosticus niet op een systematische manier te werk gaat (="ongewapend
oordeel"), is er een groot risico op fouten en vertekeningen
• diagnostiekopleiding in het verleden voornamelijk gericht op kennis/vaardigheden in het
afnemen, scoren en interpreteren van tests. Nu wordt er ook meer aandacht gegeven aan
het proces en het denken, de systematische procedures
definitie van vroeger: cf. psychodiagnostiek = "het onderscheiden van personen naar hun
individuele psychische kenmerken, zoals die zich manifesteren in hun typische gedrags- en
uitingsvormen, en wel met behulp van tests" (De Zeeuw, 1983, p. 3)
Systematische procedures van besluitvorming zijn meer naar voren gekomen
• nu meer aandacht voor het aanleren van systematische procedures van diagnostische
besluitvorming en minder klemtoon op afnemen van tests
definitie van nu: cf. psychodiagnostiek = "het onderscheidend vaststellen van kenmerkende
psychische eigenschappen om te komen tot een goed omschreven beeld van een persoon of
groep personen" (De Zeeuw, Dekker, & Resing, 2004, p. 14)
kennis over hoe oordelen en beslissingen tot stand komen (cf. besliskunde) kan benut
worden om de diagnostische praktijk te optimaliseren
denkfouten • pioniers in het veld: Kahneman, Tversky, Ross & Nisbett
- Judgment under uncertainty: Heuristics and biases (1982)
- Human inference: Strategies and shortcomings of social judgment (1980)
• inspireerden hele generatie onderzoekers die tot onthutsende bevindingen kwamen over
hoe weinig kritisch en rationeel de modale mens denkt
• welke cognitieve mechanismen zijn onderliggend aan dit onkritisch oordelen en
irrationeel beslissen?
• De invloed van de soort informatie die men krijgt, hoe ons oordelen beïnvloed wordt
twee soorten:
• biases
• heuristieken
biases = stereotype neigingen, onbewuste tendensen of verborgen vooroordelen
- vertekenen de conclusies van ons redeneren en beslissen
- zijn er vaak op gericht ons zelfbeeld te beschermen of ons psychisch evenwicht te
herstellen na inbreuken op ons zelfbeeld
- cognitieve technieken waarmee we ons comfortabel voelen
Cognitieve technieken die er voor zorgen dat we ons niet oncomfortabel zouden voelen in
bepaalde omstandigheden
fundamentele attributiefout= neiging om andermans afkeurenswaardig gedrag toe te schrijven aan persoonlijke
kenmerken, maar het eigen afkeurenswaardig gedrag te wijten aan situationele
invloeden (+ omgekeerd voor lovenswaardig gedrag)
in het algemeen de invloed van situatie te weinig in rekening brengen
confirmatiebias= de neiging om informatie te zoeken, interpreteren of creëren die de eigen overtuiging
bevestigt en om ontkrachtende gegevens te negeren of minimaliseren
is er belangrijk in het diagnostisch onderzoek
Risico op vasthouden aan vooroordelen die getrokken worden uit een eerste ontmoeting
vals-consensuseffect= neiging om te denken dat anderen denken zoals wijzelf
kan een vertekend beeld geven van de sociale werkelijkheid omdat we ons vooral zullen
verbinden met mensen die eenzelfde mening of visie hebben als wij
we denken dat de mening die wij hebben door het mederdeel van de maatschappij gevolgd
wordt
dit kan deels voortvloeien uit het feit dat we voornamelijk optrekken met mensen die dezelfde
meningen hebben als wij, dit geeft een vertekend beeld van de sociale werkelijkheid
illusie van controle= perceptie dat toevalsgebeurtenissen controleerbaarder zijn dan ze werkelijk zijn
• ligt aan de basis van de ‘drogreden van de gokker’
bv. De kans dat een combinatie die reeks getrokken is opnieuw getrokken wordt kleiner
inschatten dan een andere specifieke combinatie, terwijl in werkelijkheid deze kans even
groot blijft, omdat er met teruglegging gewerkt wordt
heuristieken = cognitieve shortcuts, vuistregels voor het verwerken van informatie
– laten toe snel en eenvoudig te beslissen, maar leiden vaak ook tot foutief beslissen
– levensreddend in situaties waar beslissen beter is dan dralen
– levensgevaarlijk in contexten waar nauwgezet redeneren en weloverwogen deliberatie
noodzakelijk zijn
– in het dagelijks leven moeten we veel beslissingen maken, we zijn er op getraind om deze
snel te kunnen maken
– binnen de diagnostiek is het belangrijk om over onze keuzes en hun gevolgen na te
denken en een goede overweging te maken
representativiteit= als aan mensen gevraagd wordt de kans te schatten dat iets tot een bepaalde categorie
behoort, hebben ze de neiging hun oordeel steunen op de mate waarin het representatief
is voor die categorie
o rederenen aan de hand van typische voorbeelden is op zich niet verkeerd, zolang we
rekening houden met andere vormen van relevante informatie
o diverse soorten foutieve oordelen binnen deze heuristiek zijn het gevolg van het
onvoldoende in rekening brengen van relevante informatie (statistische verdeling van de
eigenschap in de populatie; steekproefomvang;...)
o heuristiek is wijdverspreid en hardnekkig: studenten die hogere opleiding in de statistiek
en kansrekening volgden, doen het nauwelijk beter dan anderen (85% vs. 90% maakt
oordeelsfout)
geen rekening houden met a priori waarschijnlijkheid van de verschillende categorieën
bijv. "Mijn vriend is professor. Hij schrijft graag gedichten, is nogal verlegen en klein van gestalte.
Op welk terrein is hij werkzaam: Chinese literatuur of psychologie?" De meeste mensen dat het
om een hoogleraar Chinese literatuur gaat.
ten onrechte denken dat een combinatie van eigenschappen waarschijnlijker is dan een van
de afzonderlijke eigenschappen (conjunctiefout)
bijv. "Linda is 31 jaar oud, alleenstaand, openhartig en bijzonder slim. Ze is afgestudeerd in de
filosofie. Als studente was ze zeer begaan met rassendiscriminatie en sociale
onrechtvaardigheid." Rangschik onderstaande beweringen van de meest naar de minst
waarschijnlijke: (a) Linda werkt op een bank; (b) Linda is actief in de vrouwenbeweging; (c) Linda
werkt op een bank en is actief in de vrouwenbeweging. De meeste mensen vinden (c)
waarschijnlijker dan (a).
beperkte omvang van de steekproef (=wet van de kleine getallen)
bijv. "In ziekenhuis A worden gemiddeld 45 baby's per dag geboren, in ziekenhuis B gemiddeld 15
per dag. Het gemiddelde aantal jongetjes dat geboren wordt, is 50%, maar het percentage
varieert van dag tot dag: soms 50%, soms meer, soms minder. Als men nu het aantal dagen zou
tellen waarop 60% jongens geboren worden, waar komt dit vaker voor: (a) in ziekenhuis A, (b) in
ziekenhuis B of (c) in beide ziekenhuizen even vaak? De meeste mensen denken dat (c) het juiste
antwoord is.
misvattingen over regressie
= over het hoofd zien dat variabele die bij eerste meting extreem scoort bij volgende meting
hoogstwaarschijnlijk dichter bij gemiddelde zal scoren (=regressie naar het gemiddelde)
bijv. Een leerkracht geeft na een toets de vijf best scorende leerlingen een beloning en de vijf
slechtst scorende leerlingen een straf. Op de volgende toets stelt ze vast dat de prestaties van de
beloonde leerlingen verslechterd zijn, terwijl die van de bestrafte leerlingen verbeterd zijn. Ze
concludeert dat beloning tot slechtere prestaties leidt en straf tot betere.
Als je een extremen meet, is de kans dat je de volgende keer dezelfde resultaten hebt
klein
De eerste keer een extreem hoge score? De volgende keer waarschijnlijk minder hoog
De eerste keer een extreem lage score? De volgende keer waarschijnlijk hoger
beschikbaarheid= als aan mensen gevraagd wordt de waarschijnlijkheid van iets in te schatten, laten ze zich
leiden door het gemak waarmee ze er voorbeelden van kunnen bedenken
bijv. "Welk type woorden zijn het meest frequent in het Engels? (a) woorden die beginnen met
een 'r' of (b) woorden die 'r' als derde letter hebben?" De meeste mensen vinden (a)
waarschijnlijker dan (b).
als diagnosticus zijn we geneigd om sneller diagnoses in de richting te stellen van in wat wij
gespecialiseerd zijn
voorstelling= neiging om zich te laten beïnvloeden door de manier waarop iets gepresenteerd of gekaderd
wordt
bijv. “slaagkans 80%” versus “faalkans 20%
verankeren= bij het inschatten van de waarschijnlijkheid van iets hebben mensen de neiging te vertrekken
van een initiële waarde (anker), vanwaar de schatting naar boven of onder aangepast
wordt op basis van bijkomende informatie
We baseren ons oordeel op eerdere informatie en passen de latere informatie hier aan aan
bijv. schat uitkomst van “2x3x4x5x6x7x8” versus “8x7x6x5x4x3x2”
in het eerste geval is schatting lager dan in het tweede geval. Dit komt omdat er bij de eerste
een lager getal gegeven wordt en bij de tweede een groter cijfer
als we lang binnen een bepaalde doelgroep gewerkt hebben, binnen een bepaald referentie
kader, zullen we een andere doelgroep hier tegen vergelijken en zo hun problematiek over
of onderschatten
Vasthouden aan een eerste oordeel op basis van de eerste info en de resterende info
interpreteren in functie van dit oordeel
oordeelsfouten kunnen vermeden worden door systematisch te werk te gaan
psychodiagnostiek als vorm van 'toegepast wetenschappelijk onderzoek'
Met de zelfde vereiste als ander wetenschappelijk onderzoek
de empirische cyclus • denkschema's inductie, deductie en toetsing kunnen opgevat worden als fasen in een
'empirische cyclus' (De Groot, 1961)
• logisch-methodologische manier van redeneren
• bij uitstek bruikbaar in de psychologie
• beschermt tegen fouten in besluitvorming
• gebruik van een prescriptief, hypothesetoetsend model, gebaseerd op methodologische
regels:
• toets vermoedens (hypothesen) aan gegevens en stel (voor)oordelen bij als daar
aanleiding toe is
• zoek doelgericht en systematisch naar gegevens die voor én tegen de
hypothesen pleiten en houd rekening met consistentie in die gegevens
• hanteer theoretisch verantwoorde redeneringen en gegevens uit recent
onderzoek
• gebruik voldoende betrouwbare, valide en genormeerde onderzoeksmiddelen
• leg verantwoording af aan collega’s en cliënten door de denk- en werkwijze
steeds te expliciteren
• stap 1: Observatie: eerste verzameling en groepering van gegevens ten behoeve van de
vraagstelling
• stap 2: Hypothese: formuleren van een vraagstelling op basis van ideeën opgedaan in de
observatie
• stap 3: Voorspelling: omzetten van de hypothese in een toetsbare voorspelling
(=consequentie van de hypothese)
• stap 4: Toetsing: verrichten van waarnemingen om de hypothese te toetsen (afname en
intepretatie van testmateriaal, bijkomende observaties,...)
• stap 5: Evaluatie: met elkaar in verband brengen van de verzamelde gegevens om tot
een conclusie te komen (kan aanleiding geven tot nieuwe hypothesen en start nieuwe
empirische cyclus)
hypothetische toetsende werkwijzen
Deze werkmethode voorkomt dat we onterechte conclusies trekken
• ideaalmodel
- diagnostiek in de praktijk kan hier niet steeds aan voldoen
- wenselijk vs. haalbaar
• spiegel voor reflectie en overleg met collega's/cliënten
- wat doe ik als diagnosticus en waarom?
het psychodiagnostisch procesactoren
• in het psychodiagnostisch onderzoek zijn er vier belangrijke actoren :
- psychodiagnosticus
- opdrachtgever (niet altijd de client bv. Huisarts, werkgever, ouders, verzorgers …)
- cliënt
- wetenschappelijk forum
Verantwoording moeten kunnen afleggen bij het wetenschappelijk forum
vooraf:
• bij dit stuk hoort geen extra tekst
• wat in het hoorcollege aan bod is, is wel ten dele gebaseerd op onderstaand boek, dat in
15 exemplaren (niet-uitleenbaar) beschikbaar is in PPWBIB (+77.10 KOOR 2009)
• wat in de les gezegd is, is de enige leerstof; het boek kan eventueel helpen om
onvolledige notities aan te vullen
actor 1: de psychodiagnosticus
– psychodiagnostiek als specifieke competentie van psychologen/pedagogen (resticties in
wie testmateriaal mag kopen)
– diagnosticus in verschillende rollen
- als expert: gedragswetenschapper (expertrol, zie ook actor 4)
- samenwerkingspartner in dialoog met opdrachtgever en cliënt (zie ook actoren 2
en 3) (cliënt moet gemotiveerd worden om deel te nemen)
actor 2: de opdrachtgever
– heeft een motief om iemand psychologisch te laten onderzoeken
– motief wordt aangegeven bij de aanvraag en dat daar voldoende naar geëxploreerd
wordt zodat al de motieven bekent zijn voor de diagnosticus
– daarnaast vaak nog impliciete doelstellingen
– psychodiagnosticus heeft er baat bij de opdrachtgever goed te kennen of uitgebreid
kennis met hem/haar te maken. De diagnosticus kan op basis hiervan een bepaalde
opdracht weigeren
Reden waarom er aan bepaalde zaken aandacht gegeven moet worden
actor 3: de cliënt
- kan uiteenlopende posities hebben
(vrijwillig meewerken vs. met tegenzin ondergaan)
- belang van "dialectische benadering": cliënt is geen willoos object, maar mede-
onderzoeker
- cliënt als samenwerkingspartner: de kwaliteit van het diagnose proces wordt mee
bepaald door de inbreng van de cliënt
- kwaliteit psychodiagnostisch onderzoek wordt mee bepaald door inzet cliënt: onwillige
cliënten kunnen onmogelijk goed onderzocht worden
- in sommige gevallen is cliënt opdrachtgever
- cliënt is niet noodzakelijk een individu (kan ook gezin, team, schoolklas, organisatie,...
zijn)
Belangrijk om cliënt als samenwerkingspartner te zien
Kwaliteit van onderzoek hangt af van samenwerking met cliënt
Cliënt is niet altijd een individu (bv gezin)
actor 4: het wetenschappelijk forum
– psychodiagnostiek is een vorm van wetenschappelijk handelen
– psychodiagnosticus past algemene denkschema's van inductie, deductie en toetsing toe
– ons handelen transparant en falsifieerbaar weer geven
psychodiagnostisch proces speelt zich af tussen
• de 'aanvraag' tot een psychodiagnostisch onderzoek
en
• het door de psychodiagnosticus afgeleverde psychologisch rapport
en is in overeenstemming met de stappen binnen de empirische cyclus
aanvraag/ hulpvraag
• potentiële opdrachtgever heeft geoordeeld dat psychodiagnostisch onderzoek
aangewezen is zich tot de diagnosticus gewend met een aanvraag voor een
psychodiagnostisch onderzoek
- belang van goede profilering diagnosticus (waarvan kan men bij hem/haar
terecht?)
- vaak is de aanvraag niet meer dan een vaag omlijnd idee, dat zonder verdere
toelichting tot misverstanden kan leiden
bijv. “deze man werkt hier al zes jaar, maar is zonder aanleiding gaan
disfunctioneren”
bijv. “is deze kandidaat geschikt voor de functie?”
bijv. “met deze cliënt kom ik geen stap verder, wat is er aan de hand?”
de diagnostische cyclus start op het moment dat er een vraag gesteld wordt. Deze vraag
kan komen van de opdrachtgever (aanvraag) of van de cliënt (hulpvraag).
De diagnosticus moet niet op de aanvraag ingaan, daarvoor is het belangrijk te weten wat
de reden is tot de aanvraag of hulpvraag
Verschillende soorten aanvragen, afhankelijk van uit welke hoek ze komt.
Niet elke vraag is even gemakkelijk te vertalen in een concrete onderzoeksvraag, daarom is
het belangrijk om dit vanaf het begin goed af te bakenen
• twee mogelijke situaties:
- externe opdrachtgever (bijv. huisarts, psychiater,...)
- cliënt (of zijn/haar wettelijke vertegenwoordiger) als aanvrager
• diagnosticus gaat in overleg met de aanvrager om een beeld te krijgen van de
achtergrond en het doel van de aanvraag
- waarom wil opdrachtgever een onderzoek?
- wat verwacht hij/zij ervan? op welke vragen moet er een antwoord gegeven
worden, is dit mogenlijk?
Wat kan de opdrachtgever verwachten, wat kan er nagegaan worden, op welke
vragen wordt er een antwoord gegeven
Belangrijke overwegingen voor eventuele weigeringen
• de aldus verkregen informatie helpt de diagnosticus te beslissen of hij/zij de aanvraag al
dan niet zal aannemen (oa. op basis van inschatting kennis, onderzoeksbaarheid,…)
• psychodiagnosticus kan aanvraag weigeren!
• in arbeids- en organisatiecontext kan deze eerste fase enigszins anders verlopen:
- psychodiagnostici (bijv. selectiebureaus) stappen zelf naar potentiële
opdrachtgevers om hun expertise aan te bieden
- opdrachtgevers vragen vaak offertes bij verschillende psychodiagnostici en kiezen
degene met het beste bod (zowel inhoudelijk als financieel)
- eerste fase resulteert in ‘contracting’
vraagstelling • nadat aanvraag duidelijk is aanvaard en de vraag duidelijk omschreven is
• voor aanvraag zijn er geen eisen in termen van duidelijkheid, zakelijkheid of
wetenschappelijkheid
• aanvraag moet vertaald worden in een onderzoekbare vraagstelling (haalbaar en
duidelijk)
- geeft het kader voor het psychodiagnostisch onderzoek
• gedetailleerde weergave van wat onderzocht zal worden
• geformuleerd als hypothese(n) (basis voor het onderzoek)
- onderdeel van psychologisch dossier
- kan in rapport opgenomen worden
• vooral als opdrachtgever zelf psycholoog/pedagoog is
Rapport krijgt andere vorm naar gelang de ontvanger van het rapport
Bv. voor iemand die niet uit het werkveld komt zal er meer gewerkt worden met
vertalingen van het vakjargon, zodat het onderzoek duidelijk is
- in de fase van vraagstelling gebeurt er een filtering, verheldering en/of
herformulering van de vragen uit de aanvraag
- dat resulteert in een of meerdere diagnostische vraagstellingen, die onder te
brengen in een van volgende categorieën:
• onderkenning ('wat is het geval?')
• verklaring ('hoe komt dat?')
• predictie (‘hoe zal de cliënt in de toekomst functioneren?’ wat is de kans
op herval)
• indicatie ('wat kunnen we eraan doen?')
- ze worden samengebracht in een zogenaamd ‘diagnostisch scenario’
• alle deelvragen worden ondergebracht in een van de categorieën
• de types worden in een bepaalde volgorde behandeld:
onderkenning → verklaring → predictie/indicatie
• niet alle diagnostische scenario’s bevatten alle subtypes van
vraagstellingen
toetsbare voorspellingen • diagnostisch scenario is opgebouwd uit hypothesen die aan evidentie getoetst moeten
worden
toetsbaar: we kunnen dit meten via een bepaald instrument
voorspelling: proberen op voorhand een voorspelling te doen over wat we moeten
vinden om een bepaalde hypothese te bevestigen
• hiertoe worden instrumenten gekozen, op basis waarvan toetsbare voorspellingen
geformuleerd kunnen worden
• bij de keuze van instrumenten gelden de kwaliteitscriteria besproken in thema 4
afname en verwerking per test • de gekozen tests worden op deskundige wijze afgenomen en verwerkt (standaardisatie,
objectiviteit,...)
• test per test verwerken zoals aangegeven in de handleiding en test voor test de
resultaten interpreteren
evaluatie van resultaten • de resultaten worden test per test verwerkt, gebruik makend van de toetsingscriteria
• de resultaten worden over tests heen geïntegreerd en teruggekoppeld naar de
hypothesen
• er wordt bekeken of alle vragen uit de aanvraag beantwoord zijn en of er al dan niet
bijkomend onderzoek nodig is
• soms geeft een onderzoek aanleiding tot nieuwe informatie, vanwaaruit nieuwe vragen
rijzen en een nieuwe cyclus kan ontstaan
Nieuwe informatie kan gevonden worden hieruit kunnen nieuwe vragen komen die
een nieuwe cyclus starten, vervolgonderzoek
het psychodiagnostisch rapport • waarom rapporteren?
• wat rapporteren?
• hoe rapporteren?
waarom rapporteren • vier redenen om te rapporteren:
- verantwoording
- verkoopbaar product
- effectieve communicatie
- betrokkenheid opdrachtgever
verantwoording- opdrachtgever wil begrijpen hoe conclusie tot stand gekomen is
- noodzaak van wetenschappelijke verantwoording en mogelijkheid tot verificatie
Begrijpen hoe de conclusie tot stand is gekomen
Welke overwegingen zijn er genomen
Welk proces is er gebruikt
Vergelijkbaar met andere onderzoeken
Mogelijkheid tot verificatie
verkoopbaar product- opdrachtgever wil 'waar voor zijn geld'
- rapport is vaak enige tastbare product dat uit het psychodiagnostisch onderzoek resulteert
- spanningsveld tussen 'nastreven van aantrekkelijkheid' en 'voldoen aan wetenschappelijke
en ethische standaarden'
kwaliteit van verslag
tastbaar product
effectieve communicatie- mondeling rapporteren is snel maar niet doelmatig
- rapport als naslagwerk, waarop beslissingen gebaseerd kunnen worden
Mogelijkheid tot verdere behandeling
In een mondeling verslag kan men nooit alles wat van invloed is geweest tijdens het
onderzoek weergeven
Men moet zich er van bewust zijn dat er veel valkuilen zijn aan mondelinge rapportage,
zoals het verkeerd overkomen of interpreteren van informatie
betrokkenheid opdrachtgever- Opdrachtgever betrekken bij het onderzoek
- opdrachtgever kan zich de gedachtengang van de psychodiagnosticus eigen maken
- advies valt niet uit de lucht
wat rapporteren • rapporteren maakt deel uit van het diagnostisch proces
- in elke stap van het proces is informatie verzameld die wel of niet in het rapport
terecht zal komen
- alleen informatie opnemen die relevant is en aan cliënt geen schade berokkent,
komt in het rapport
- informatie over het verloop van het onderzoek
• twee vereisten
- vraagstelling wordt, voor zover mogelijk, beantwoord
- antwoord wordt beargumenteerd
• diverse indelingen mogelijk
- in functie van voorkeuren aanvrager
- wel aantal vaste onderdelen
herkomst van de vraagstelling- geschiedenis van de aanvraag
- situering in tijd
beschrijving van de vraagstelling en het diagnostisch scenario- wat was de vraagstelling en hoe is deze tot stand gekomen
verloop onderzoek- omstandigheden van het onderzoek
- onderwerpen, bv.
• datum / tijdstip / duur
• stemming
• bijzondere voorvallen
• volgorde onderdelen
• observaties
• …
anamnese- achtergronden van cliënt voor zover relevant voor vraagstelling
- te uitvoerige anamnese kan schadelijk zijn voor de cliënt
- type anamnese afhankelijk van vraagstelling
- bevindingen van derden
resultaten onderzoek- alle verzamelde informatie
of
- selectie o.g.v. relevantie voor conclusie/advies (deze benadering geniet voorkeur,
want niet-relevante informatie kan een eigen leven gaan leiden)
samenvatting- korte herhaling vraagstelling
- weergave belangrijkste bevindingen
- antwoord op vraagstelling
conclusie/advies- verband tussen de vraagstelling en de bevindingen van het onderzoek
- eventueel (afhankelijk van vraagstelling) uitgebreider advies
hoe rapporteren het is belangrijk om op een correcte manier te rapporteren zodat de informatie juist overkomt bij de opdracht gever
stoorzenders: dingend ie fout lopen in de communicatie
• bij de opdrachtbevestiging
- schept verwachtingen over reikwijdte en doel van onderzoek en bereidt
opdrachtgever voor op rapportage
- bij nieuwe opdrachtgevers best persoonlijk contact (extra toelichting,
foldermateriaal)
- afspraken worden best ook schriftelijk bevestigd
• bij de overdracht van het rapport
- soms eerst mondelinge overdracht van resultaten (bijv. telefonisch)
- aandacht besteden aan deze communicatie want zal latere interpretatie van het
rapport beïnvloeden (belang van woordkeuze, toon, houding,...)
• bij de presentatie van het rapport
- belang van de verpakking (omslag, logo, papiersoort,...) presentatie moet
netjes zijn
- streven naar eenvoud
• bij de administratieve afwikkeling
- vermijden van slordigheden in verzending, spelfouten, vlekken op het papier,
onvoldoende frankering,...
- problemen op dit vlak doen afbreuk aan geloofwaardigheid
- voldoende aandacht geven aan adressering (zeker bij e-mail) en tijdigheid
taal en schrijfstijl
• vakjargon kan bron van irritatie voor opdrachtgever zijn
• taalgebruik van de ‘zender’ dient afgestemd te worden op dat van de ‘ontvanger’
• voortdurend lezer in gedachten houden bij het schrijven
• taal en schrijfstijl afstellen op ontvanger
• tips
- aandacht voor lengte van de zinnen
- actief taalgebruik
wetenschappelijkheid
• stappen in het schrijven van een rapport
- verzamelen van de gegevens
- ordenen van de gegevens
• welke informatie zal gebruikt worden en in welke volgorde?
• standaardpresentaties van anamnese en test- en observatiemateriaal
kunnen handig hulpmiddel zijn
- uitschrijven van de gegevens
• onderscheid maken tussen feiten, interpretaties en conclusies
• transparantie (helderheid van de redenering)
• toetsbaarheid (falsifieerbaarheid van de conclusie)
voorbeeld:
“Cliënt geeft af en toe blijk van dwangneurotische neigingen. Het zal hem moeilijk vallen zich in
groepstherapie te handhaven; daarom raden we groepstherapie af.”
niet transparant: waarom wordt hier groepstherapie afgeraden?
Er wordt niet duidelijk gemaakt op basis waarvan deze beslissing gemaakt wordt
Wat zijn de dwangneurotische neigingen
Waarom vormt dit een probleem
niet toetsbaar: wat zal er gebeuren als cliënt wel groepstherapie volgt?
Wat zou er gebeuren als de cliënt dit wel doen
Wat is het gevaar
Cliënt geeft af en toe blijk van dwangneurotische neigingen. Hij geeft aan bepaalde gedachten
niet van zich af te kunnen zetten en deze frequent met anderen te willen bespreken. Hij ziet
zelf in dat dit voor anderen hinderlijk kan zijn. Dit gedrag zal des te sterker de neiging
hebben zich te manifesteren in situaties die niet sterk gestructureerd zijn, zoals de in onze
setting gegeven groepstherapie. Het zal hem moeilijk vallen zich in groepstherapie te
handhaven; daarom raden we groepstherapie af.”
transparant: er is verduidelijkt waarom gedacht wordt dat groepstherapie niet aangewezen is
niet toetsbaar: wat zal er gebeuren als cliënt wel groepstherapie volgt?
“Cliënt geeft af en toe blijk van dwangneurotische neigingen. Hij geeft aan bepaalde gedachten
niet van zich af te kunnen zetten en deze frequent met anderen te willen bespreken. Hij ziet
zelf in dat dit voor anderen hinderlijk kan zijn. Dit gedrag zal des te sterker de neiging
hebben zich te manifesteren in situaties die niet sterk gestructureerd zijn, zoals de in onze
setting gegeven groepstherapie. Het zal hem moeilijk vallen zich in groepstherapie te
handhaven. We verwachten dat zijn gedrag al na enkele sessies (2 à 4) hinderlijk zal
worden voor de overige cliënten in de groep, doordat hij te vasthoudend zal zijn in het
uiten van zijn steeds terugkomende opinies. Daarom raden we groepstherapie af.”
transparant: er is verduidelijkt waarom gedacht wordt dat groepstherapie niet aangewezen is
toetsbaar: er wordt aangegeven welk risico er gelopen wordt als cliënt wel groepstherapie volgt
verwijzing naar normen
• ‘soortgelijken’ met elkaar vergelijken
• principe:
- relevante normgroep zoeken (soms kan vergelijking met meerdere groepen
interessant zijn)
- positie vaststellen
- verantwoorde uitspraak doen
Omschrijven met welke groep er vergeleken wordt
Valkuilen (problemen in het verslag)
• inhoudsproblemen
- ruwe data in het rapport (verkeerde conclusies trekken
- nadruk op verkeerde elementen
- ontbreken van essentiële informatie (bv leeftijd of geslacht)
- ontbreken van essentiële onderdelen van het rapport
• interpretatieproblemen
- stokpaardjes: te veel focus op een bepaald element, waardoor de andere
elementen op de achtergrond komen
bv, door specialisatie voor dit element
- beperkt referentiekader (bv. Enkel het dsm)
- systematische fouten in interpretatie van ruwe data
• attitude van de diagnosticus
- zich niet verplaatsen in de belevingswereld van de cliënt en/of externe
opdrachtgever
- onpraktische oplossingen
• communicatieproblemen
- zie ‘stoorzenders’
- slechte toegankelijkheid Slechte communicatie tussen onderzoeker en cliënt.
• professionele problemen
- fouten in de testopzet
- onwetendheid, optelfouten, nonchalance…
voorbeeld examenvraag
• Welke heuristiek gebruikt een diagnosticus die aan een cliënt een bepaalde therapie
adviseert louter omwille van het feit dat de cliënt in kwestie lijkt op een vroegere cliënt
bij wie deze therapie succesvol was?
– representativiteit
– beschikbaarheid
– verankeren
– voorstelling
intelligentie volgens het CHC-model intelligentiediagnostiek vandaag Bevraging Vlaams Forum Diagnostiek
(Studiedag 25/11/2011)
Intelligentie = één van de meest onderzochte domeinen in psychologische &pedagogische
hulpverlening
Vooral schalen van Wechsler: WPPSI-III, WISC-III, WAIS-IV
Definitie Wechsler basis voor intelligentie test
schalen van wechsler Schatting algemene intelligentie (g) a.d.h.v. brede variëteit aan taken: verbaal+ performaal
Indeling verwijst naar verschillende manieren om g te meten, niet naar 2 soorten intellectuele
vaardigheden
“different ‘languages’ … which may be easier or harder for different subjects” (Wechsler,
1974, p. 5)
“there is no such thing as “nonverbal” ability – only abilities that are expressed
nonverbally” (McGrew & Flanagan, 1998, p. 25)
Brede variatie aan taken
- Verbale taken (waarbij je een antwoord moet geven)
- Perforale taken (intelligentie tonen door iets te doen, bv, een puzzle maken)
Verbale en performale intelligentie
Verworpen
Non-verbale intelligentie bestaat niet, enkel intelligentie die zich op een non verbale
manier uit
gebruik van wechslerschalen doorheen de tijd
Profiel analyse:
- In verband brengen met klinische beelden
- Patronen onderzoeken
- Verschil tussen verbaal en performale intelligentie
- Profiel analyse via visuele inspectie, intuïtief
Geen wetenschappelijk onderbouwde empirie
Psychometrische profielanalyse
- Factor analyse op bepaalde scoren
- Intelligentie individueel bespreken afhankelijk van de verschillende factoren
- Niet gebaseerd op een theoretisch model
- Analyse is gebonden aan één specifieke test
Theorie gebaseerd werken
- Bruikbaar voor verschillende testen
NIET: stop met afnemen Wechsler tests want valide & betrouwbare schatting algemene
intelligentie!
WEL: pleidooi voor ‘intelligent’ gebruik
- Wees bewust van wat je meet en niet meet
- Kijk naar resultaten in termen van cognitieve sterktes & zwaktes
- Vul aan met andere cognitieve (sub)tests om vollediger profiel van cognitieve
vaardigheden te krijgen
- Gebruik daarbij een wetenschappelijk gefundeerd kader
chc model van cognitieve vaardigheden nieuw?1989: eerste kiem
1999: ontstaan benaming CHC model
Sindsdien vele publicaties in toonaangevende tijdschriften (Intelligence, Psychology in the
schools, Journal of School Psychology…)
(Newton & McGrew, 2010)
Maar… pas relatief recent toegepast in Vlaanderen
“De principes van Flanagan et al. zijn voor Vlaanderen uitgewerkt in de CAP-publicatie van 2007,
aangevuld in 2010 (CHC-platform) en binnen CAP-overleg van 2013.” (Bron: website CHC-
platform)
Recent in gebruik binnen Vlaanderen
In de vs al veel langer in gebruik
special issue in 2010
wetenschappelijke basis Combinatie van Cattell en Horns “extended Gf-Gc” theorie en Carrolls 3-stratum theorie
Carroll (1993): exploratorische factoranalyse op 460 datasets
- Carroll heeft een belangrijke invloed gehad op intelligentie testen
- Heranalyse op basis van factoranalyse
chc model: integratie van modellen cattell- horn en carroll
Verschillend aantal factoren die zijn onderscheiden
G factor algemene intelligentie: positieve samenhang tussen cognitieve vaardigheden
chc model van cognitieve vaardigheden
Groen: cognitieve factoren
Gele: achievement factoren
Meer afhankelijk van de instructie die je al hebt gehad, de dingen die je geleerd hebt
Pijlen geven de lading tot g aan
3-niveau hiërarchisch model
3 strata die worden onderscheiden
Smalle cognitieve vaardigheden
Subdimenties van de brede cognitieve vaardigheden
Brede cognitieve vaardigheden
Subdimenties van de algemene intelligentie
conclusies Confirmatorische factoranalyse binnen en tussen testbatterijen steun voor kernassumpties
- 3 niveaus
- differentiatie tussen verschillende cognitieve vaardigheden zoals vooropgesteld door CHC
theorie
- positieve, onderlinge samenhang g
- structuur equivalent over geslacht, etniciteit en leeftijd
Structuur van intelligentie wordt onderzocht aan de hand van factoranalyse
chc: brede cognitieve vaardigheden Covaar-II: Oefenboekje
fluid intelligence (GF°- Redeneren (e.g., inductief, deductief)
- Mentale operaties bij confrontatie met relatief nieuwe taak die men niet automatisch
kan oplossen (bv. concepten herkennen, verbanden ontdekken, extrapoleren)
- Hoge lading op ‘g’; voorspellend voor rekenen en begrijpend lezen (bij oudere kinderen)
(meta-analyse McGrew & Wendling, 2010)
- Geen (zuivere) meting in WISC-III
- 2, abstracte en alledaagse problemen
cristallized intelligence (Gc)comprehension-knowledge - De breedte en diepte van iemands verworven
kennis binnen een cultuur en de toepassing van die kennis
“Gc is primarily a store of verbal or language-based declarative (knowing what) and procedural (knowing how) knowledge acquired through the investment of other abilities during formal and informal educational and general life experiences” (Newton & McGrew, 2010, p. 623)
- Hoge lading op ‘g’; voorspellend voor technisch en begrijpend lezen en rekenen + toenemend belang doorheen ontwikkeling
- Goed vertegenwoordigd in WISC-III: Informatie, Overeenkomsten, Woordkennis, Begrijpen (Verbaal Begrip)
Verbaal verworven kennis binnen een bepaalde cultuur
Ligt nou samen met de prestaties op school
Veel van de verbalen testen meten gc
short-term memory (gsm)Vaardigheid om gedurende enkele seconden informatie vast te houden en te bewerken
bv. telefoonnummer lang genoeg onthouden om het te vormen, instructie lang genoeg
onthouden om ze uit te kunnen voeren
Voorspellend voor (technisch) lezen en rekenen (m.n. werkgeheugen) (+ gedrag/werkhouding!)
WISC III: slechts 1 subtest te weinig om betrouwbare, valide uitspraak te doen over cognitieve
vaardigheid; bijkomend bv. Reeksen opnoemen CELF-4-NL
Kort termijn geheugen en werk geheugen
Goed functioneren hiervan is af te leiden uit het gedrag van het kind
long-term storage and retrieval (glr)Vaardigheid om informatie in het lange termijn geheugen te bewaren en terug op te halen (de
efficiëntie waarmee de informatie opgeslagen wordt en terug opgehaald wordt)
Bv. Namen leren (RAKIT-2), Ideeënproductie (RAKIT-2), Woordassociaties (CELF-4-NL), …
Voorspellend voor lezen (technisch en begrijpend); minder consistente verbanden met rekenen
The ability to store and consolidate new information in long-term memory and later fluently
retrieve the stored information (e.g., concepts, ideas, items, names) through association.
Memory consolidation and retrieval can be measured in terms of information stored for
minutes, hours, weeks, or longer. Some Glr narrow abilities have been prominent in creativity
research (e.g., production, ideational fluency, or associative fluency)” (Newton & McGrew, 2010,
p. 626)
visual processing (gv)Vaardigheid om visuele patronen en stimuli te genereren, waar te nemen, te analyseren, te
synthetiseren, te manipuleren, te transformeren en ermee te denken; visueel-ruimtelijke
vaardigheden
Sterk vertegenwoordigd in WISC III: Onvolledige tekeningen, Blokpatronen, Figuur leggen,
Plaatjes ordenen (Perceptuele Organisatie)
Geen significant verband met taal en rekenen (“the Gv mystery”, McGrew & Wendling, 2010),
verklaringen: aard wiskundetests, …
Individuele verschillen hebben weinig invloed op de schoolse perstaties
Er moet een minimum aanwezig zijn, na dit minimum maakt het nog weinig uit
auditory processing (ga)Vaardigheid om informatie in geluid te detecteren en te verwerken, bv. fonologisch coderen
Voorspellend voor (technisch en begrijpend) lezen
(vooral fonologisch bewustzijn)
processing speed (gs)Vaardigheid om eenvoudige, repetitieve cognitieve taken snel en vlot uit te voeren. Het gaat
om betrekkelijk eenvoudige taken die snel moeten uitgevoerd worden, en die bijna iedereen
juist zou hebben wanneer er voldoende tijd zou gegeven worden
WISC III: Substitutie, Symbolen vergelijken (Verwerkingssnelheid)
Voorspellend voor technisch lezen en rekenen
het chc model in de praktijk chc in de praktijk: cross-battery benadering = testbatterij samenstellen op basis van subtests uit verschillende tests
één intelligentietest als kern van de batterij (‘basisbatterij’) bv. WISC-III of WPPSI-III
aanvullen met subtests (uit recente en kwaliteitsvolle tests) met normale scoreverdeling
Waarom? Nodig?
Ja, omwille van beperkingen van huidige intelligentietests in Vlaanderen
Maar wel volgens een gefundeerde,
internationaal aanvaarde werkwijze
Verschueren en Resing (2015, Box 3.1)
+ CHC-platform
principes cross-battery assessment (xba) Vertrek zoveel mogelijk vanuit één test die erkend is als algemene intelligentietest (bv.
Wechsler-schalen)
Vul aan met subtests van andere kwaliteitsvolle tests (recent en in dezelfde periode
genormeerd)
Gebruik niet meer verschillende tests dan nodig
Meting van BCV: meet minstens 2 kwalitatief verschillende smalle cognitieve vaardigheden
Integreer testgegevens met andere informatie over cliënt in functie van ecologische validiteit
(Verschueren & Resing, 2015; Box 3.1.)
Normering in dezelfde periode intelligentie stijgt doorheen de tijd, de scores moeten
vergelijkbaar zijn waardoor ze niet te ver van elkaar genormeerd mogen zijn
categorisatie subtests in bcvs Op basis van factoranalyse: Wechslerschalen (internationaal onderzoek)
Op basis van consensus expertoordelen na inhoudelijke analyse (Cross-battery Flanagan): CELF
4 NL, CELF Preschool 2
Op basis van analogie/inhoudelijke analyse (CAP- PDC Thomas More): SON-R 6 – 40, RAKIT 2
http://www.thomasmore.be/psychodiagnostisch-centrum/chc-platform-0
voorbeeld werkwijze (chc-platform)vertrekkend vanuit wisc iiiwisc-iii chc basisbatterij (chc-platform)
Brede cognitieve vaardigheid Test + Subtests
Gf: Fluïde intelligentie SON-R 6 – 40 Analogieën
SON-R 6 – 40 Categorieën
Gq: Kwantitatieve kennis WISC III Rekenen
Gc: Gekristalliseerde intelligentie WISC III Informatie
WISC III Woordkennis
WISC III Overeenkomsten
Gsm: Kortetermijngeheugen CELF 4 Reeksen Opsommen
CELF 4 Cijfers Herhalen
Gv: Visuele informatieverwerking WISC III Blokpatronen
WISC III Onvolledige Tekeningen
Gs: Verwerkingssnelheid WISC III Substitutie
voorbeeld werkwijze (chc-platform) vertrekkend vanuit wppsi iiiwppsi iii chc basisbatterij (chc-platform)
Brede cognitieve vaardigheid Test + Subtests
Gf: Vloeiende intelligentie WPPSI III Matrix Redeneren
WPPSI III Plaatjesconcepten
Gq: Kwantitatieve kennis WPPSI-R Rekenen
Gc: Gekristalliseerde intelligentie WPPSI III Informatie
WPPSI III Woordenschat
WPPSI III Woordredeneren
Gsm: Kortetermijngeheugen CELF 4 Reeksen Opsommen
CELF 4 Cijfers Herhalen
Gv: Visuele informatieverwerking WPPSI III Blokpatronen
WPPSI III Onvolledige Tekeningen
Ga: Auditieve informatieverwerking CELF 4 Fonologisch Bewustzijn
Glr : Langetermijngeheugen CELF 4 Snel Benoemen Tijd
Gs: Verwerkingssnelheid WPPSI III Substitutie
verder onderzoek brede cognitieve vaardigheden Uitdiepen van sommige brede cognitieve vaardigheden (BCV):
- op basis diagnostische vraagstelling
- omwille van inconsistentie bij berekening van index
voorbeeld uitdiepen gc m.b.v. subtesten celf4-nlTaalontwikkeling:
- Zinnen Formuleren
Luisteren:
- Begrippen en Aanwijzingen Volgen
- Zinnen Begrijpen
- Tekstbegrip
Grammaticale ontwikkeling:
- Woordstructuur
- Zinnen Samenstellen
wat levert het op Voorbeeld-tabel met resultaten volgens methode practica
School-psychologie
profielanalyse Profiel cognietieve sterktes / zwaktes: voordelen voor de praktijk
- Gedifferentieerd beeld; aandacht voor zwaktes maar ook voor sterktes
- Verklaring voor problemen op schools vlak; uiteenlopende visies
- Handvaten voor interventies
Versterken van zwakke cognitieve vaardigheden
Beroep doen op sterke cognitieve vaardigheden
Is een BCV-index significant sterk of zwak t.o.v. het totaal-IQ: wat zijn de sterke of zwakke
kanten van de leerling?
normeringsonderzoek van wisc-v-nlnormeringsonderzoek van wisc-v-nl
1. WISC-III-NL
2. WISC-V-NL
3. Normeringsonderzoek
4. Representatieve steekproef
5. Samenstelling steekproef
6. Extra onderzoeken
7. Statistische verwerking
8. Belang samenstelling steekproef: Voorbeelden
wisc iii nl
PIQ = hoe ga je praktisch om met je kennis, subtesten waarbij je iets moet doen om te
antwoorden, zijn de subtesten met materiaal
VIQ = heeft te maken met taal: taalbegrip, woordenschat, … Verbaal antwoorden
Subtesten schuin gedrukt worden niet gebruikt om één van beide IQ’s te berekenen, kan
gebruikt worden als vervangende subtest (behalve doolhoven)
TIQ = algemene intelligentie, g-factor, hiërarchisch model
Factoren kunnen berekenen, gebaseerd op factoranalytisch onderzoek
PO = perceptuele organisatie, grote overeenkomst PIQ, behalve substitutie
VB = verbaal begrip, grote overeenkomst VIQ, behalve rekenen
VS = verwerkingssnelheid
Problemen WISC-III-NL:
• Veroudering normen (Flynn-effect)
• Tweedeling verbaal/performaal IQ
• Ontbreken vloeiende intelligentie (Gf)
WISC-V-NL
• Normen moeten elke 15 jaar vernieuwd worden, omwille van stijging IQ: elke 10 jaar + 3
à 5 IQ-punten, in Westerse landen lijkt Flynn-effect zich te stabiliseren in Westerse
landen (voeding + onderwijs blijft ook stabiel)
• Onderzoek naar structuur intelligentie geeft geen evidentie voor bestaan VIQ en PIQ
• CHC-model: Gf heeft grootste lading op g (deze zit op dit moment niet in de wiks3,
daarom ontwikkeling wiks5)
wisc-v-nl Engelstalig Franstalig Ndlstalig
WISC-III 1992 1996 2002/2005
WISC-IV 2003 2004 /
WISC-V 2014 2016 Eind 2017
WISC-III-NL is voor Ndl + Vl uitgekomen op moment dat in Amerika WISC_IV uitkwam!
WISC-IV-NL is overgeslagen om aan te sluiten bij de rest van de wereld, anders achterop blijven
zitten
normeringsonderzoek van wisc-v-nl 1. Theoretische achtergrond
2. Subtesten
3. Indexen
4. WISC-V-NL en CHC
5. Verschil WISC-III-NL/WISC-V-NL
theoretische achtergrond Samenstelling subtesten gebaseerd op:
• Modellen van intelligentie, oa CHC
• Neuropsychologisch onderzoek
• Modellen over werkgeheugen
subtesten 1. Blokpatronen
2. Overeenkomsten
3. Matrix Redeneren
4. Cijferreeksen
5. Symbool Substitutie Coderen
6. Woordenschat
7. Gewichten
8. Figuur Samenstellen
9. Plaatjesreeksen
10. Symbool Zoeken
11. Cijfers en Letters Nazeggen
12. Figuur Zoeken
13. Begrijpen
14. Rekenen
indexen • Geen berekening VIQ en PIQ
• Vijf indexen:
- Verbale Begrip index (VBI)
- Visueel Ruimtelijke index (VRI)
- Fluid Reasoning index (FRI)
- Werkgeheugen index (WGI)
- Verwerkingssnelheid index (VSI)
TIQ
wisc-v-nl en chc Vijf indexen:
• Verbale Begrip index (VBI) = Gekristalliseerde intelligentie (Gc)
• Visueel Ruimtelijke index (VRI) = Visuele Infoverwerking (Gv)
• Fluid Reasoning index (FRI) = Vloeiende intelligentie (Gf)
• Werkgeheugen index (WGI) = Korte termijn geheugen (Gsm)
• Verwerkingssnelheid index (VSI) = Verwerkingssnelheid (Gs)
Vijf indexen hebben andere naam dan BCV, maar komen perfect overeen
verschil wisc-iii-nl/ wsc-v-nl Inhoudelijk: Samenstelling test CHC
Praktisch: Vereenvoudiging:
- Materiaal: responsformulieren, stimulusboek, blokjes voor blokpatronen
Afname met iPad mogelijk: http://www.helloq.nl /
- Omkeer- en afbreekregels
Omkeer – en afbreekregels altijd hetzelfde:
• omkeer: geen maximumscore op eerste twee items omkeren
• Afbreek: 4 opeenvolgende (BP 3 opeenvolgende) 0-scores
normeringsonderzoek Unieke samenwerking tussen Pearson en VFD:
Hogescholen: VIVES, Howest, Thomas More Antwerpen
Universiteiten: UGEnt, VUB, KU Leuven
COS Antwerpen: COS = Centrum voor OntwikkelingsStoornissen onderzoek bij doelgroepen:
autisme
VFD = Vlaams Forum Diagnostiek: vzw die alle spelers in het werkveld rond (psycho)diagnostiek
verenigt
Alle instellingen die opleiding toegepaste psychologie of psychologie aanbieden, werken mee
aan normering
timing Ontwikkeling test kost ongeveer 3 jaar
• Pilot: feb – april 2015
• Try-out: sept – dec 2015
• Normering + extra onderzoeken: sept 2016 – juni 2017
• Publicatie WISC-V-NL: eind 2017
pilot • Instructie testen
• Iteminformatie verzamelen
• N = 40 Ndl, N = 20 Vl, kinderen van 6-7 jaar en van 16-17 jaar
• Uitgevoerd door Pearson
• Instructie: zowel voor PL als PP
• Iteminfo: items, materialen en instructies die niet werken er uit halen.
• Functioneert test op alle leeftijden en alle niveaus
try out • Itemselectie
• Itemvolgorde
• Iteminstructie
• N = 220 (20 per jaar, 14 Ndl, 6 Vl)
• Uitgevoerd door studenten HoWest en VIVES
• Gespreid naar opleidingsniveau moeder, opleidingsniveau kind, sekse, etniciteit, regio,
urbanisatie. Waarvan ook N=6 verstandelijk beperkten.
Taalexperts Nederland/Vlaanderen
Cultuurbiais allochtonen
Verschil tussen Ndl en Vl proberen uit te sluiten, vb in woordgebruik
Komt ook terug in instructies, vb item Begrijpen: Waarom is het niet toegelaten om je mobiele
telefoon (VL ev: GSM) te gebruiken tijdens sommige lessen?
Items waarvan uit onderzoek gebleken is dat allochtonen benadeeld worden, eruit laten
normering • Data verzamelen
• Nederland: N = 875
• Vlaanderen: N = 356
Pearson hoopt gegevens samen te kunnen voegen
representatieve steekproef Steekproef moet representatief zijn voor populatie
Om op basis van normgegevens verzameld in steekproef uitspraken te kunnen doen over
populatie (= elk kind dat niet tot de normgroep behoorde en dat getest wordt met WISC-V-NL)
Zoals al eerder aangegeven zal de uitvoering van een TE uiteindelijk resulteren in informatie
over elk element van de steekproef. Men zou kunnen wensen dat, in termen van sommige
aspecten van deze informatie, de steekproef gelijkt op de populatie. Men spreekt in dit geval
van een representatieve steekproef met betrekking tot deze informatie-aspecten.
Definitie statistiek 1
TE = toevalsexperiment
… populatie op basis van beschikbare informatie wordt opgesplitst in homogene
deelpopulaties of strata. Een gestratificeerde steekproef wordt dan bekomen door per stratum
op ZTW een steekproef te trekken en de resulterende steekproeven vervolgen samen te
voegen.
Definitie gestratificeerde steekproef statistiek 1
Dat is wat in bovenstaande gedaan werd: steekproef stratificeren voor kleur: je gaat na hoeveel
subjecten van elke kleur in de populatie zitten, je zorgt dat dezelfde % terugkomen in
steekproef. Per stratum = per eigenschap. Binnen elk stratum ppen op ZTW selecteren, is niet
volledig ZTW, want pp moet voldoen aan die bepaalde eigenschap. Dit zorgt ervoor dat in je
steekproef die bepaalde eigenschap representatief is voor populatie. Doe je dus enkel voor
eigenscshappen waarvan je wilt dat ze in de steekproef representatief zijn voor populatie. Voor
intelligentie is haarkleur bijvoorbeeld niet relevant.
samenstelling steekproef 1. Stratificatie voor:
- Leeftijd
- Regio
- Onderwijsnet
- Schoolniveau
2. Monitoren voor:
- Geslacht
- Opleidingsniveau moeder
- Etniciteit
- Urbanisatie
stratificatie Stratificatie: voor deze eigenschap: zelfde % als in populatie
Wordt verwacht mogelijk een invloed te hebben op IQ
leeftijd Intelligentie stijgt met de leeftijd
Rekening houden met het Flint effect
regio Intelligentie kan verschillend zijn in verschillende regio’s
Verschillend onderwijssysteem
Er moet gestandaardiseerd worden op regio
Zo zijn testen gestandaardiseerd in Nederland niet altijd representatief voor België
onderwijsnet Scholen in te delen naar soort inrichtende macht.
Het gaat dan in eerste plaats om scholen van kleuter-, lager- en secundair onderwijs.
Schoolniveau: secundair onderwijs• 1ste graad:
- A stroom
- B stroom
• 2de en 3de graad:
- Aso
- Bso
- Kso
- Tso
monitoren voor:Andere variabelen die ook belangrijk zijn voor representativiteit, maar waarvoor niet
gestratificeerd wordt, omdat anders de aantallen per cel zo klein zouden worden, dat de
trekking op ZTW in gedrang komt en recruteren van ppen te ingewikkeld
Zal tijdens verzamelen normgegevens nagegaan worden of streef% ongeveer bereikt worden en
indien nodig bijgestuurd
geslacht Even veel vouwen als mannen
opleidingsniveau moeder Laag: max lager SO
Midden: max hoger SO
Hoog: hoger onderwijs of universiteit
6de jaar BSO = getuigschrift, geen diploma, dus laag opgeleid
etniticiteit Moeilijk om hier een vaste definitie voor vast te stellen
Wanneer behoren mensen tot een andere etniciteit?
urbanisatie Dichtbevolkt gebied: 54%
Gemengd gebied: 45,7%
Dunbevolkt gebied: 0,3%
In Vl komen bijna geen dunbevolkte gebieden meer voor.
extra onderzoeken Test-hertestonderzoek
Interbeoordelaarsonderzoek
Validiteitsonderzoek met WPPS-III-NL en WAIS-IV-NL
Klinische groepen
statistische verwerking DIF: afzonderlijke normen Ndl/Vl?
Continue normering + IRT: normen opstellen met kleinere aantallen
belang samenstelling steekproefWat zijn de gevolgen als er iets fout loopt bij de samenstelling?
1. WAIS-IV-NL
2. Bayley-III-NL
3. TEA-Ch
wais-iv-nl • Normen verzameld bij Nederlandse en Vlaamse proefpersonen, 16-85 jaar
• Opleidingsniveau:
- Laag
- Midden
- Hoog: 7de jaar bso
Ndl proefpersonen scoren significant hoger
bayley-iii-nl • Ontwikkeling kinderen 16 d – 42m 15 d
• Schalen:
- Cognitie
- Taal
- Motoriek
- Sociaal emotioneel gedrag
- Adaptief gedrag
• Vlaamse normen: 1192 kinderen, gespreid over 17 leeftijdsgroepen
• Representativiteit?
www.kwaliteitscentrumdiagnostiek.be
Bedenkingen geformuleerd door Kwaliteitscentrum Diagnostiek: overheidsinstantie met als
opdracht diagnostiek in Vl te verbeteren
- Foute streefpercentages opleidingsniveau moeder
• Ondervertegenwoordiging laag opleidingsniveau!
• Uit Vlaams normeringsonderzoek:
Kinderen laagopgeleide moeders scoren significant lager:
- Voor ‘Cognitie’ en ‘Taal’ dan kinderen midden- en hoogopgeleide moeders
- Voor ‘Motoriek’ dan kinderen hoogopgeleide moeders
Opleidingsniveau moeder blijkt zeer relevantie variabele te zijn moet representatief zijn!
• Ondervertegenwoordiging laag opleidingsniveau!
Transformatie ruwe scores naar:
Gevolg van ondervertegenwoordiging:
Ruwe scores van kinderen uit steekproef worden omgezet naar normscores (normtabellen),
transformatie naar gauss-curve, met gemiddelde 100 en st dev 15
Representatieve steekproef
Steekproef met ondervertegenwoordiging laag
Stel: door oververtegenwoordiging kinderen midden- en hoogopgeleide moeders
verschuiving van curve: ruwe scores steekproef liggen hoger dan wanneer meer kinderen met
laagopgeleide moeders in steekproef. Gemiddelde wordt omgezet op 100, dit wordt al norm
genomen!
Ondervertegenwoordiging laag opleidingsniveau!
Risico:
• Te hoge normscores
• Overdiagnosticering
Overdiagnosticering van kinderen met lage scores hulpvraag
• Vlaamse normen: 1192 kinderen, gespreid over 17 leeftijdsgroepen
• Representativiteit?
– Foute streefpercentages opleidingsniveau moeder
– Ten opzichte van streefpercentages ondervertegenwoordiging van:
• Niet-Vlaamse kinderen
• Kinderen laag- en middenopgeleide moeders
• Kinderen uit regio West
Tweede probleem
Laatste (regio West) is niet zo’n probleem, heeft geen invloed op bekomen resultaat
• Niet-Vlaamse kinderen: 2% (streef%: 7,8%)
• Ndl normeringsonderzoek: kinderen van allochtone ouders scoren significant lager dan
kinderen van autochtone ouders op ‘Cognitie’ en ‘Taal’
Representativiteit?
• Foute streefpercentages opleidingsniveau moeder
• Ten opzichte van streefpercentages ondervertegenwoordiging van:
– Niet-Vlaamse kinderen
– Kinderen laag- en middenopgeleide moeders
– (Kinderen uit regio West)
Te hoge normscores
Voorzichtigheid met interpretatie testscores is nodig!
tea-ch Meet aandachtsproblemen bij kinderen 6-16 jaar
• Meet aandachtsproblemen bij kinderen 6-16 jaar
• Publicatie 2004: 293 Australische kinderen
Problemen:
- Te weining kinderen
- Enkel Australische kinderen