pedagogischekringleuven.files.wordpress.com€¦ · Web view2020. 9. 24. · Sigmund Freud...

Definitie, classificaties en toepassingen van de testhandboek pp. 38-41, 61-72, 76-96, 106-113

definitie test:

een test is een systematisch classificatie of meetprocedure waarbij het mogelijk is uitspraken te

doen over een of meerdere empirisch-theoretisch gefundeerde eigenschappen van de

onderzochte of over specifiek niet-testgedrag, dor uit te gaan van een objectieve verwerking van

reactie van hem, in vergelijking tot anderen, op een aantal gestandaardiseerde zorgvuldig

gekozen stimuli

Psychologisch metenpsychodiagnostiek is een vorm van meten

- assumptie: psychologische constructen bestaan en kunnen gemeten worden

- wetenschap van psychologisch meten = psychometrie

- diverse types meetinstrumenten beschikbaar (o.m. observatie, interview, taak): tests als

meetlatten voor psychologische eigenschappen

psychologische eigenschappen worden ondersteund door theorieën

- de test die men ontwerpt om een eigenschap te meten valt niet samen met de eigenschap

we proberen zo hier zo dicht mogelijk bij te komen, om een valide test te ontwikkelen

- de test is een in mindere of meerdere mate geslaagde poging om een goede schatting van de

eigenschap te maken

om psychologische eigenschappen te meten, moeten verschillende stappen doorlopen worden:

- identificatie van de te meten eigenschap

- operationalisering van de te meten eigenschap

- onderzoek en kwantificering van reacties

- terugkoppeling naar de theorie

stap 1: identificatie van de te meten eigenschap- de theorie(ën) met betrekking tot de eigenschap in kaart brengen bijv. theorieen/definities

rekenvaardigheid

- kiezen welke theorie het uitgangspunt van de test zal worden

- probleem: voor sommige eigenschappen is theorievorming beperkt of onduidelijk

Stap 2: operationalisering van de te meten eigenschapWe gaan opzoek naar een reeks van gedragingen waaruit de eigenschap blijkt voor te komen

- = specificatie van de operaties die nodig zijn om de eigenschap te meten

- definitie van een domein van gedragingen die typisch zijn voor de bedoelde eigenschap (bv.

rekenvaardigheid: optellen, aftrekken, vermenigvuldigen, delen)

- keuze van stimuli die aan de proefpersoon kunnen worden voorgelegd om reacties uit te

lokken die een indicatie geven van de te meten eigenschap (= items)

• uitspraken over het eigen gedrag in relatie tot de eigen persoonlijkheid

(persoonlijkheidsvragenlijsten)

• taken (intelligentietests) opdracht voor elke soort bewerking

• vragen (vaardigheidstests)

stap 3: onderzoek en kwantificering van reacties- reacties van de persoon op de items geven informatie over de te meten eigenschap

antwoorden (bijv 1+1=2)

- reacties zijn in eerste instantie kwalitatief (woorden, gedragingen) en moeten

gekwantificeerd worden

• uitgangspunt: bij items is het zo dat antwoorden van elkaar verschillen in het

niveau van de achterliggende eigenschap dat ze aangeven

• kwantificering bestaat erin dat men aan reacties van een hoger niveau een

hogere numerieke waarde toekent 1 = juist, 0 = fout

• de veronderstelling dat een hogere score overeenstemt met een hoger niveau

van de eigenschap kan getoetst worden aan de hand van statistische

testmodellen

- in de constructiefase van een test wordt een proefversie voorgelegd aan een steekproef van

proefpersonen

- daarna worden itemscores geanalyseerd met behulp van een of meerdere testmodellen, die

specificeren aan welke eisen de gegevens dienen te voldoen

(bijv. als we ervan uitgaan dat items naar dezelfde eigenschap peilen, verwachten we

positieve correlaties van ongeveer dezelfde grootte ertussen)

stap 4: terugkoppeling naar de theorie- als uit de statistische analyses blijkt dat de test aan de technische vereisten voor een

geslaagde meting voldoet en de bedoelde eigenschap meet, biedt dit eveneens

ondersteuning voor de theorie

- ook niet-succesvolle testconstructie kan bijdragen tot theorie-ontwikkeling (herziening of

keuze voor rivaliserende theorie)

kwaliteit van test: test die meet wat hij beoogt te meten

Psychologische test: definitie en onderdelenTest= wetenschappelijk onderzoek

Een psychologische test is “een systematisch onderzoek van gedrag met behulp van speciaal

geselecteerde vragen of opgaven, met de bedoeling inzicht te krijgen in een psychologisch

kenmerk van de betrokkene in vergelijking met anderen” (Drenth & Sijtsma, 2006, p. 40)

- systematische werkwijze

- steekproef van gedragingen (omdat je nooit alle gedragingen kan testen)

- doel = uitspraak over individu

(voorspelling bv. het effect van therapie,

Classificatie diagnose toewijzen,

beschrijving)

- vergelijking met grote representatieve groep (eigen score in tabel situeren)

“A psychological test is the measurement of a sample of behavior obtained under standardized

conditions and that has established rules for scoring or interpreting this sample” (Anastasi, 1988)

- steekproef van gedragingen

- gestandaardiseerde condities (= systematisch, altijd hetzelfde)

- uitgewerkte regels voor scoring en interpretatie

Een verantwoorde en gepubliceerde test heeft doorgaans volgende onderdelen:

- testmateriaal

- testformulieren

- testhandleiding

testmateriaal

- kan erg divers zijn

- soms geen tastbaar materiaal

(testmateriaal WPPSI III) (wereldtest)

(tekentest) (inktvlekkentest)

testformulieren

- voor het verzamelen van materiaal (antwoorden, reacties, gedragsgegevens) waarop de

interpretaties en conclusies gebaseerd zullen worden

- in te vullen door respondent (de geteste persoon) of proefleider

testhandleiding

- grote variatie in uitvoerigheid

- vier basisingrediënten

• testinstructie (concrete gang van zaken tijdens het testonderzoek)

• verwerkingsprocedure (toekenning numerieke scores aan antwoorden en

reacties op de opgaven)

• normtabellen (scores van representatieve normgroep waarmee scores van de

geteste persoon vergeleken kunnen worden)

• informatie over wetenschappelijke kwaliteit van de test (betrouwbaarheid,

validiteit)

- voor scoring wordt soms gebruik gemaakt van een plastic sleutel

Plastieksleutel

- minder gebruikt

- elektronische verwerking/ afnamen

- antwoorden vergelijken met gewenste antwoorden

- punten toekenning

Classificatie van psychologische testsTests kunnen op verschillende manieren ingedeeld worden:

- volgens instructie en afneming

- volgens de aard van de testvragen

- volgens testgedrag

classificatie volgens instructie en afnemingindividuele tests versus groepstestsindividuele test: testleider formuleert vragen/opdrachten en registreert reacties/prestaties van

de onderzochte tijdens een individueel contact

populair in Europa

voordelen:

onderzochte kan gestimuleerd worden indien nodig

testleider kan nagaan of onderzochte instructies begrepen heeft

mogelijkheid tot observatie en verzamelen kwalitatieve gegevens

groepstest: testleider geeft collectieve instructie voor hele groep tegelijk, surveilleert, geeft

aanwijzingen tijdens afname en zamelt de voltooide opgaven in

moeilijker bij jonge kinderen en bij patiënten

optimale groepsgrootte hangt af van aard test, doel onderzoek en leeftijd

onderzochte groep

geen 1:1 interactie

proces/ redenering proefpersoon worden niet gevolgd door testleider

voordelen:

efficiënt, besparing van tijd en geld

snelheidstests versus niveautests snelheidstest: peilt naar snelheid waarmee de onderzochte kan werken

- maat = aantal opgaven dat onderzochte kan voltooien binnen bepaalde tijd

- aantal opgaven is groter dan wat de meeste mensen binnen de voorziene tijd kunnen

voltooien

- opgaven hebben vaak ongeveer zelfde moeilijkheidsgraad

- opgaven zijn makkelijk zodat er nauwelijks fouten gemaakt worden

niveautest: peilt naar het prestatieniveau dat de onderzochte behaalt

- maat = aantal correct opgeloste opgaven

- opgaven variëren in moeilijkheidsgraad

- opgaven worden meestal in volgorde van oplopende moeilijkheidsgraad voorgelegd

- er wordt geen tijdsdruk opgelegd

classificatie volgens aard van de vragencultuurvrije versus niet-cultuurvrije tests

cultuurvrije test: test die (vrijwel) geen appèl doet op vaardigheden/eigenschappen

die door cultuur en onderwijs worden beïnvloed

vaak nonverbaal, omdat taal bij uitstek cultuurbepaald is

bij uitstek geschikt voor onderzoek naar verschillen tussen volkeren en

culturen in psychologische eigenschappen

gradueel begrip: volledig cultuurvrije tests bestaan niet

voorbeeld: Raven Progressive Matrices

niet-cultuurvrije test: test die een appèl doet op condities die door cultuur en

onderwijs worden beïnvloed

verbale tests zijn bijna vanzelfsprekend niet-cultuurvrij

ook veel niet-verbale tests zijn cultuurbepaald (bijv. verwijzing naar westerse

schoolcontext)

directe versus indirecte tests directe test: test waarbij het voor de onderzochte duidelijk is wat men wil meten of

voorspellen

proef persoon weet wat er getest wordt en dat hij getest wordt

prestatieniveautests

vorderingentests

biografische informatievragenlijsten

opinievragenlijsten

attitudetests, ...

indirecte test: test waarbij het voor de onderzochte niet duidelijk is wat men wil

meten of voorspellen

proef persoon weet niet dat hij getest wordt of wat er getest wordt

test wordt geïnterpreteerd

projectieve methoden

Rorschach voorgesteld als ‘fantasietest’ (creativiteit en onderbewust zijn

Boomtest voorgesteld als ‘tekentest’

vragenlijsten met indirecte vragen

tests met vrije antwoorden versus keuzeantwoorden test met vrije antwoorden: test waarbij de onderzochte zelf het antwoord moet

bedenken en formuleren

= open vragen

= ongecodeerde vragen

test met keuze-antwoorden: test waarbij de onderzochte verzocht wordt een keuze

te maken uit vooraf door de testconstructeur geformuleerde

antwoordmogelijkheden

= gesloten vragen

= geprecodeerde vragen

Classificatie volgens testgedragtests voor prestatieniveau versus tests voor gedragswijze

tests voor prestatieniveau van de onderzochte persoon wordt een maximale prestatie gevraagd

duidelijke norm voor wat ‘goed’ is en wat ‘fout’

meting van intelligentie, cognitieve capaciteiten, kennis, inzicht,…

categorie 1: enkelvoudige algemene niveautests

meten ‘general ability’ (algemene bekwaamheid) en leiden tot één indicatie

van intelligentie

doel = algemene niveaubepaling, niet differentiatie in deelaspecten

drie soorten

ontwikkelingstests en individuele intelligentietests voor kinderen

bijv. Wechsler Intelligence Scale for Children (WISC-III)

o zeer jonge kinderen

o ontwikkelingsniveau meten

individuele intelligentietests voor volwassenen

bijv. Kaufmann Adolescent and Adult Intelligence Test (KAIT)

algemene collectieve intelligentietests

bijv. Nederlandse DifferentiatieTestserie (NDT)

o test in groep afgenomen

o algemeen niveau bepalen

illustratie: Nederlandse Differentiatie Testserie

doelgroep: leerlingen van 11 tot 15 jaar die in aanmerking komen voor plaatsing binnen het

voorbereidend middelbaar beroepsonderwijs (vmbo)

bestaat uit 9 subtests, peilend naar:

Redeneervermogen (bijv. Reeksen)

Verbaal vermogen (bijv. Overeenkomsten)

Ruimtelijk inzicht (bijv. Draaien)

→ IQ-score

Visueel werkgeheugen (bijv. Plaatjes Onthouden)

Semantisch werkgeheugen (bijv. Woordparen)

→ Werkgeheugen

+ Indices voor Nauwkeurigheid en Werktempo (Coderen)

categorie 2: veelvoudige algemene niveautests

doel = differentiatie in deelaspecten

voorwaarde: deeltests moeten afzonderlijk voldoende betrouwbaar zijn en

onderling voldoende onafhankelijk

men spreekt over testbatterijen

twee soorten

testbatterijen voor intelligentiefactoren

bijv. Drenth testserie voor het hoger niveau (NAT, VAT, TNVA)

testbatterijen voor geschiktheden

bijv. General Aptitude Testbattery (GATB)

illustratie: Drenth Testserie Hoger Niveau (DTHN)

doelgroep: volwassenen binnen de hogere intelligentieniveaus

bestaat uit drie onderdelen, die afzonderlijk of samen afgenomen kunnen worden:

Test voor Niet-Verbale Abstractie (TNVA)

Verbale AanlegTest (VAT)

Functies van Woorden

Verbale Analogieën

Woordenschat

Numerieke AanlegTest (NAT)

Rekenvaardigheid

Cijferreeksen

illustratie: General Aptitude Test Battery (GATB)

meet cognitieve vaardigheden relevant om een veelheid aan functies met succes te

vervullen

8 schriftelijke subtests, peilend naar:

4. Verbaal vermogen (Woordenschat)

5. Numeriek vermogen (Elementair Cijferwerk)

6. Ruimtelijk inzicht (Driedimensionale Ruimte)

7. Vormwaarneming (Gereedschap Vergelijken)

8. Waarneming van administratief materiaal (Namen Vergelijken)

9. Motorische coördinatie (Strepen Zetten)

10. Algemeen Leervermogen/Intelligentie (diverse)

4 apparatentests, peilend naar

11. Handvaardigheid (Plaatsen)

12. Vingervaardigheid (Monteren)

categorie 3: speciale niveautests

toegespitst op een speciaal segment van begaafdheid

drie soorten

tests voor speciale intelligentiefactoren

bijv. Raven Progressive Matrices (PM; redeneervaardigheid)

tests voor speciale geschiktheden

bijv. d2 (aandacht en concentratie)

tests voor speciale niet-intelligentiefactoren

bijv. tests voor kleurenblindheid, handvaardigheid,...

categorie 4: vorderingentests

doel = meten in hoeverre de onderzochte het doel van een opleiding bereikt

heeft, hoe gevorderd men is in wat beoogd wordt

verder onderscheid mogelijk tussen

schoolvorderingentest (‘achievement test’): specifiek gericht op

schoolse kennis

bijv. CITO-toetsen

vaardigheidstest (‘proficiency test’): gericht op vaardigheden buiten de

directe cognitieve sfeer en kennis

tests voor gedragswijze focus op hoe iemand iets doet of op welke manier zijn prestatie of reactie plaatsvindt

geen vooraf gekende ‘goed/fout’-sleutel

meting van persoonlijkheidstrekken, voorkeuren, houdingen,…

categorie 1: observatietests

beoordelaar (de psychodiagnosticus) observeert de cliënt

aanvangsgegevens zijn al het resultaat van een informatieverwerkingsproces

eerste informatie zijn de notities van de observator

observator verwerkt info voor hij ze opschrijft (interpretatie)

info is afhankelijk van observator

twee soorten

individuele observatietests

bijv. individuele opdrachten binnen assessment center

groepsobservatietests

bijv. groepsopdrachten binnen assessment center

Assessment center: individuele opdrachten

Stel bijvoorbeeld dat je een verkoopsleider zoekt. Dan kunnen individuele opdrachten er zo uitzien:

De kandidaat moet een presentatie verzorgen voor de directie over de aankoop van een softwaresysteem.

Hij moet kiezen tussen drie softwaresystemen en vervolgens zijn keuze funderen. (presentatie)

De kandidaat moet een functioneringsgesprek voeren met een jonge verkoper, waarover de klanten de

laatste tijd klachten hebben. Hij moet peilen naar de oorzaken van het minder presteren en samen met

hem een oplossing vinden. (gesprekssimulatie)

De kandidaat moet een bakje met post (klachtbrieven, uitnodigingen,…) ordenen en de juiste prioriteiten

stellen. Hij merkt bijvoorbeeld dat de eigenaar van het postbakje drie afspraken tegelijk heeft: met de juf

van zijn dochtertje, met zijn collega, met een potentiële grote klant. Aan hem om te beslissen welke

afspraak voorrang heeft. (postbakoefening)

Assessment center: groepsopdrachten opdrachten

Stel bijvoorbeeld dat je een verkoopsleider zoekt. Dan kan een groepsopdracht er zo uitzien: De kandidaat

moet met de andere sollicitanten een vergadering voeren over de verdeling van een extra budget. Het is

de bedoeling dat hij zoveel mogelijk geld binnenrijft. (groepsdiscussie)

categorie 2: somatofysiologische methoden

psychologische kenmerken wordt afgeleid uit meting van lichamelijke

kenmerken of processen

twee soorten

morfologische methoden (vooral historisch belang)

karakter eigenschappen afleiden vanuit lichamelijke kenmerken

bijv. fysiognomiek karaktertrekken afleiden uit gezichtstrekken,

zoölogische methode kenmerken afleiden uit dier waar we op lijken,

frenologie kenmerken afleiden uit bulten op hoofd,...

fysiologische methoden

aan de hand van bulten op de schedel kenmerken afleiden

bijv. EEG, hersenscans, huidgeleiding,...

we zien enkel nog maar afwijkingen als groep

categorie 3: zelfbeoordelingen

meestal in de vorm van vragenlijsten

vier soorten

interessetests

waarde- en attitudetests

biografische vragenlijsten

persoonlijkheidsvragenlijsten

andere methoden:

Osgood schalen / semantische differentiaal

o Werken met twee tegenpolen en tussen maten

o Altijd, soms, nooit

Q-technique / Q-sort

o Op voorhand het aantal antwoorden per categorie vaststellen

o Er is een normaal verdeling in de antwoorden: meer neutrale

en minder extreme antwoorden

o Score afhankelijk van plaats antwoord

categorie 4: kwalitatieve prestatietests

cliënt krijgt opdracht; niet goed of fout uitvoeren is van belang, wel wijze

waarop

twee soorten

niveautests voor gedragswijze

bijv. tests voor perceptuele stijl (bijv. Embedded Figures Test)

projectieve technieken

» perceptietests (bijv. Rorschach)

» interpretatietests (bijv. Thematic Apperception Test verhaal

vertellen over tekening)

» expressietests (bijv. Boomtest)

» constructietests (bijv. Wereldspel)

» associatietests (bijv. Zinaanvultest)

bijv. “ik raak soms in de problemen door...”

» keuzetests (bijv. Szondi foto test, voorkeur/afkeur)

Toepassingenbeoordeling van individuen

- met grote nauwkeurigheid een uitspraak doen over het gedrag van de onderzoekt

- voorspelling over een in de toekomst gelegen criterium aan de eisen waarvan men al of

niet kan voldoen

- advies in de keuze tussen minstens twee opties, die kwalitatief of kwantitatief van

elkaar verschillen

- vergelijking tussen verschillende vaardigheden of interesses van een zelfde persoon

- vergelijking tussen de scores van een zelfde persoon op verschillende momenten

- beschrijving van een persoon

- een niet directieve vorm van therapie: het samen met de cliënt analyseren, bewust

maken en herformuleren van het probleem waarmee de cliënt geconfronteerd wordt

beoordeling van groepen- onderzoek naar verschillen tussen groepen

- dit soort onderzoek heeft belang voor de keuze van een goede vergelijkingsgroep in

individuele diagnostiek

- verschil tussen bevolkingsgroepen, leeftijdsgroepen en leerlingen

- cross-culturele psychologie

beoordeling van invloed van situaties of methoden- onderzoek naar verschillen groepen die van elkaar verschillen in experimentele

condities

- beoordeling van methoden en situatie

- procedures vergelijken

bv. schoolvorderingstoets (bestudering van resultaten van een klas in vergelijking met andere

klassen

voorbeeldvraag

Welk woord ontbreekt in onderstaande definitie?

“Een psychologische test is een ................. onderzoek met behulp van speciaal geselecteerde

vragen of opgaven, met de bedoeling inzicht te krijgen in een psychologisch kenmerk van de

betrokkene.”

vergelijkend

gevalideerd

systematisch

objectief

Historische ontwikkeling van het testenhandboek pp. 15-35

Oorsprong van de term ‘psychodiagnostiek’Etymologie

• stamt uit het Grieks:

– ψυχή (“psychè”): 'ziel'

– διά (“dia”): 'uiteen'

– γνώσis (“gnosis”): 'kennis'

• letterlijk: het onderscheidend vaststellen van psychische eigenschappen

vroeger "psychotechniek“

diagnostiek via ‘machines’

diagnostiek via testen

nu is een test maar een fase van de cyclus

intussen is nadruk op technische aspecten sterk afgenomen en is term 'psychotechniek' in

onbruik geraakt

definities:

"het onderscheiden van personen naar hun individuele psychische kenmerken, zoals die

zich manifesteren in hun typische gedrags- en uitingsvormen, en wel met het behulp

van tests" (De Zeeuw, 1983, p. 3)

"het onderscheidend vaststellen van kenmerkende psychische eigenschappen om te

komen tot een goed omschreven beeld van een persoon of groep personen" (De

Zeeuw, Dekker, & Resing, 2004, p. 14)

VoorlopersChinese oudheid

• vorderingentoetsen voor dienaars

• selectie op basis van testscores in boogschieten, muziek, rekenen,...

vragen naar verschillen tussen mensen

selectie van dienaars op basis van testen

Oud TestamentRechters 7

Gideon en zijn leger stonden 's ochtends vroeg op en trokken naar de bron Harod, waar zij hun kamp

opsloegen. De troepen van Midian waren in het dal beneden hen gelegerd, aan de noordelijke kant

van de heuvel Moré.

De Heer zei tegen Gideon: "Uw leger is te groot! Ik wil u niet allemaal tegen de Midianieten laten

vechten, want anders zouden de Israëlieten er tegenover Mij prat op gaan dat zij zichzelf hebben

bevrijd! Zeg maar tegen het volk:

'Wie bang is, mag naar huis gaan." Toen gingen 22.000 mannen naar huis terug en er bleven slechts

10.000 over die bereid waren te vechten.

Maar de Heer zei tegen Gideon: "Het zijn er nog steeds te veel! Laat hen naar het water gaan en

daar zal Ik u laten zien wie met u zal meegaan en wie niet."

Toen ging Gideon met zijn mannen naar het water en de Heer zei tegen hem: " Verdeel hen in twee

groepen op grond van de manier waarop zij water drinken. De ene groep zijn de mannen, die met de

hand aan de mond het water opslurpen als een hond. Tot de andere groep behoort ieder die op de

knieën gaat zitten om het water te drinken."

Slechts driehonderd mannen behoorden tot de eerste groep; alle anderen gingen op de knieën

zitten om water te drinken.

"Ik zal de Midianieten verslaan met deze driehonderd man!" zei de Heer tegen Gideon. "Stuur alle

anderen naar huis."

Degiene die bang zijn mogen naar huis gaan

Manier van uit de beek drinken: op de knieën= onderdanig

Oude Grieken: typologie van de lichaamsvochtenTypologie: Typering op bisis van lichaamsvochten (slijm, bloed, gele gal, zwarte gal)

o Bloed: Vurige, energieke mensen werden verondersteld een overheersende

hoeveelheid bloed te hebben, en werden sanguïnisch genoemd.

o Gal: Het cholerische type werd verondersteld makkelijk irriteerbaar te zijn en snel

kwaad te worden als gevolg van een teveel aan gele gal. We komen dit tegen in het

Franse colère en het Spaanse cólera: woede.

o Zwarte gal: Een teveel aan zwarte gal werd verondersteld neerslachtigheid,

introversie en depressies te veroorzaken. Nog steeds worden neerslachtige

stemmingen aangeduid met de termen melancholie, vertaald als zwartgalligheid.

o Slijm: Flegmatici, mensen met veel slijm in hun lichaam, waren vooral kalm en weinig

emotioneel.

Fysiognomie: persoonlijkheid reflecteert naar gezichtsuitdrukking

Middeleeuwen en nieuwere tijd

Giambattista della Porta (1535-1615): zoölogische

methode, gebaseerd op dierfysiognomie oude

Grieken

Karakter eigenschappen op basis van

gezichtstrekken en hoe deze op dieren

lijken

Johann Kaspar Lavater (1741-1801): fysiognomiek

Karakter eigenschappen op basis van het silhouet van het gezicht

Silhouet machine: schaduw van gezicht over nemen om te

kunnen evalueren

Franz Joseph Gall (1758-1828): frenologie

Karkater afleiden uit de uitstulpingen op de schedel

Delen van de herenen gelinkt met bepaalde karakter

eigenschappen

Als dit deel goed ontwikkeld is komt er een uitstulping op de

hersenen

Bv. hij heeft een wiskunde knobbel

Carl Huter (1861-1912): psychofysiognomie gebaseerd op de kiembladentheorie

Embryonale ontwikkeling

Ectoderm (huid, zenuwen, zintuigen),

entoderm (interne organen), mesoderm

(bloedbanen, spieren)

Dominantie van kiembladen beïnvloed

karakter

Typisch te onderscheiden op basis vorm van

lichaam en gezicht

Césare Lombroso (1835-1909): criminele fysiognomie

Criminaliteit als effect van terugval in evaluatie

Evaluatie terugval is ook te zien aan het lichaam en gezicht

Aapachtig gezicht, afwijkende oren, aaneengegroeide

wenkbrauwen, brede kaken en een haviken neus

Hij heeft een boeventronie: hij heeft het gezicht van een

crimineel

Chiromantie

Verschillende kussentjes van de hand beïnvloeden karakter

Bv. Jupiter berg voor liefde

tot in recentere tijden uitlopers van theorieën over verband tussen lichamelijke kenmerken en

psychologische eigenschappen

konstitutionstypologie van Kretschmer

Lichaamelijke kenmerken

Pyknische type

Atletische type

Leptosome type

Verband tussen typen en bepaald gedrag/ kans

op aandoeningen

zulke theorieën werden vanaf het begin van de 20ste eeuw wel minder populair,

onder meer als gevolg van het ontstaan van een nieuw instrument: de psychologische test

Meer wetenschappelijke basis

Aanloopaanloop tot wetenschappelijke ontwikkeling testdiagnostiek in de loop van de 19de eeuw onder

stimulans van verschillende disciplines:

• psychiatrie: behoefte aan diagnosemogelijkheden met betrekking tot aard en niveau

van geestelijke afwijkingen

• genetica: interesse in verschillen tussen mensen

• experimentele psychologie: belang van gestandaardiseerde onderzoeksprocedures

stimulansen vanuit de psychiatriePhilippe Pinel (1745-1826)

- in een tijd dat men het verband tussen krankzinnigheid en misdadigheid als logisch ziet

- krankzinnigen zijn niet misdadig maar ziek

- ontstaan van interesse voor geestelijke abnormaliteit en zwakzinnigheid

Jean-Etienne Esquirol (1782-1840)

- onderscheid tussen zwakzinnigheid en krankzinnigheid

- een psychiatrische aandoening en een mentale handicap zijn niet hetzelfde

- zwakzinnigheid definiëren = mensen die niet in staat zijn zich informatie en

vaardigheden eigen te maken waartoe anderen van zijn leeftijd wel instaat zijn

Edouard Séguin (1812-1880)

- het vormen bord

- training van zwakzinnige kinderen

- focus op motorische en sensorische functies

- performantietest: Séguin Form Board

Charcot (1825-1893)

- grondlegger van de neurologie

- leidde een van de belangrijkste centra voor psychiatrie en neurologie in Europa: Hôpital

la Salpétrière in Parijs

- zette de psychiatrie in frankrijk op de kaart

Ebbinghaus (1850-1909)

- probeerde psychische vermoeidheid te meten aan de hand van test met onvolledige

zinnen

! nood aan onderscheid, categorisering en meting!

Al deze aandacht voor psychiatrische aandoeningen zorgde er voor dat er nood kwam aan om

een onderscheid te kunnen maken tussen geestenziekte en zwakzinnigheid, en om hier gradaties

in aan te kunnen leggen

stimulansen vanuit de geneticaFrancis Galton (1822-1911)

- neef van Darwin (Origin of Species: aandacht voor erfelijkheid van lichamelijke

eigenschappen)

- erfelijkheid van psychische eigenschappen aan dezelfde wetten onderhevig als de

erfelijkheid van lichamelijke eigenschappen

Galton legde de basis voor wetenschappelijk testonderzoek:

- belang van onderzoek naar individuele verschillen

- nood aan systematisering van onderzoekstechnieken

- weergave van onderzoeksresultaten in statistische termen (nadien verder uitgewerkt

door zijn collega Pearson)

“antropometrisch laboratorium” (peilde wel vooral naar

lichamelijke eigenschappen)

= een van eerste stappen naar test die eigenschappen en

verschillen tussen mensen meet

stimulansen vanuit de experimentele psychologieWilhelm Wundt (1832-1920)

- 1879: eerste psychologisch labo in Leipzig

- start systematisch experimenteel onderzoek op grote schaal

- veel belang aan beschrijving en standaardisatie

experimentele psychologie heeft zowel een stimulerende als een afremmende invloed

• stimulerend:

- exacte beschrijving van experimenteercondities

- rigoureuze controle van variabelen

- nauwkeurige verwerking van uitkomsten

• afremmend:

- focus op algemene wetten en samenhangen en niet op afwijkingen en verschillen

(waar we juist wel in geïnteresseerd zijn in de psychodiagnostiek)

- focus op primaire sensorische en motorische functies en niet op hogere en

complexere cognitieve en intellectuele processen

James McKeen Cattell (1860-1944)

- geïnteresseerd in individuele verschillen

- promoveerde bij Wundt over individuele verschillen in reactietijd

- 1890: artikel in tijdschrift Mind waarin voor het eerst het woord ‘test’ gebruikt

wordt

- ontwikkelde, geïnspireerd door de lichamelijke proeven van Galton, een reeks van

‘mentale’ tests (psychofysische proeven)

- stichtte in VS ‘laboratorium voor experimentele psychologie en testpsychologie’

kenmerken van deze periode

• nog geen psychologisch testen op grote schaal

• interesse incidenteel en theoretisch gericht

• onderzoek voornamelijk in laboratoria

• focus op sensorische en motorische functies, niet op complexere hogereordefuncties

later begon men te experimenteren met het gebruik van tests buiten het laboratorium

- onderwijs

- psychiatrie

- personeelsselectie

in die contexten werd duidelijk dat de methoden uit het experimenteel labo beperkingen

hadden

dit gaf aanleiding tot het ontstaan van nieuwe testvormen:

- intelligentietests

- psychotechnische proeven

- persoonlijkheidsvragenlijsten

- projectietests

drie afzonderlijke methoden met betrekking tot het testen van persoonlijkheid

observatietest:

- vooral populair in west Europa

- bedoeld om inzicht te geven in de kwalitatieve aspecten van de prestatie

persoonlijkheidsvragenlijsten:

- meer systematische vorm van verzameling van gegevens

- gestandariseerde, op schrift gestelde vragenlijsten

- specifieke terreinen bevragen

persoonlijkheidsdiagnostiek

- projectietests

- een stimulatie aangeboden waarop de persoon vrij mag reageren

- in de reactie wordt iets van de persoon zelf geopenbaart

- psycholoog interpreteert reactie

- persoonsbeschrijving, beoordeling van persoonskenmerken en diagnose van ziektebeeld

Intelligentietestsbakermat van de eerste intelligentietests = het onderwijs

- eind 19de eeuw: behoefte aan beter opgeleid personeel ten gevolge van

industrialisering en rationalisering van bedrijven

- meer doorstroming van lager naar vervolgonderwijs (men ging langer naar school)

- bij keuze van vervolgopleiding werden persoonlijke capaciteiten belangrijker dan

afkomst (wat ouders hebben gestudeerd)

- van daaruit behoefte aan instrumenten om geestelijke capaciteiten te meten

- ‘mentale tests’ van Cattell vertoonden geen verband met onderwijsprestaties

Alfred Binet (1857-1911)

- werkte bij Charcot in La Salpétrière

- was directeur van een laboratorium fysiologische psychologie aan de Sorbonne

- deed onderzoek

1896 Binet & Henri: La Psychologie Individuelle

- studie van individuen (differentiële psychologie) als alternatief voor algemene

psychologie

- criteria “mental test”:

• Gevarieerd genoeg zodat er zo veel mogelijk vermogens worden betrokken

• Betrekking op hoger denk vermogen

• Niet langer dan 1.5 uur

• Variatie zodat individu zich niet verveeld

• Aangepast aan leefwereld

• Geen ingewikkelde apparatuur

1904 opdracht ministerie van onderwijs: onderscheid maken tussen zwakbegaafde en luie

kinderen

Naar aanleiding van leerplicht

Minder begaafde kinderen ook naar school

Binet-simon 1905- leidde tot eerste intelligentietest: Binet-Simon 1905

30 proefjes (opgaven dagelijks leven)

uitgeprobeerd bij 50 normale kinderen van verschillende leeftijden

proefjes op grond van die prestaties gerangschikt volgens moeilijkheid en die

rekening hield met de leeftijd waarop de kinderen de proefjes kunnen oplossen.

(“leeftijdsdifferentiatie”)

nog geen objectieve scoring

- vernieuwende benadering

accent op complexe mentale processen

toetsing aan empirie

totaalscore als maat van intelligentie (“algemene intelligentie”)

- eerste test in wat later de Stanford-Binet traditie genoemd wordt

Binet-Simon 1908• gedeeltelijk andere items

• items gegroepeerd in leeftijdsschalen (3-12 jaar) (bv. De leeftijdsschaal van 3 jaar zijn

de testen die een 3 jarige moet kunnen)

• notie mentaal niveau:

o leeftijd van het normale kind waarmee de prestaties van het onderzochte kind in

overeenstemming zijn

o basisjaar + 1 jaar per vijf correct opgeloste items uit een hogere reeks

basis jaar= tot waar kind alle taken correct kan oplossen

Binet-Simon 1911• gelijk aantal proeven (n=5) per leeftijdsschaal

1 leeftijdsjaar= 5 vragen

• proeven voor jongere leeftijdsgroepen (3 mnd, 9 mnd, 1 jaar, 2 jaar)

• andere berekening mentaal niveau

o basisjaar + 1/5 jaar voor elke succesvol beëindigde proef uit een hogere categorie

o decimaal getal

Binet-Simon tests zijn ook populair in US

vertaling door Goddard, maar met andere bedoeling

- eugenetische beweging: doel om de goede kwaliteit van genetisch materiaal te

bewaren

- selectiemiddel

• toestemming tot immigratie

• verplichte sterilisatie (mensen met slechte gene mogen zich niet

voortplanten)

Lewis Terman (1877-1956)

- hoogleraar universiteit Stanford

- geëngageerd in eugenetische beweging

- lage intelligentie als voedingsbodem voor criminaliteit en als maatschappelijk gevaar

‘niet alle criminelen zijn zwakzinnig, maar alle zwakzinnige zijn in aanleg crimineel’

- gebruikte Binet-Simon tests als middel om aangeboren intelligentie te meten

Spearmann (1904)

- in alle tests spelen twee intelligentiefactoren een rol:

- algemene (g)factor

- specifieke (s)factor

- twee-factorentheorie

- intelligentie is de gemeenschappelijke factoren die men kan extraheren uit een

willekeurige serie van ‘intelligentietests’

- later de multi-factortheorie (door Thurstone)

Thorndike en Burt

- educational achievement test

- achtergebleven leerlingen herkennen

- prestaties van verschillende scholen vergelijken

Stanford-Binet 1916• gedeeltelijk andere items

• uitbreiding leeftijdsbereik tot 16 jaar

• vanaf 16 jaar intelligentie volledig ontwikkeld

• test ook bruikbaar voor oudere kinderen en volwassenen

• veel grotere proefgroep dan Binet (nog steeds wel alleen blanke Californiërs)

• invoering intelligentiequotiënt (geïnspireerd door Stern)

• quotiënt met in de teller Mentale Leeftijd (ML) en in de noemer Chronologische

Leeftijd (CL):

IQ= (ML/CL)*100

= traditioneel intelligentiequotiënt

+1= voor op leeftijd

-1= achter op leeftijd

1= op leeftijdsniveau

• maximale CL gefixeerd op 16 jaar

• hoogste ML die behaald kan worden is 19.5 jaar

• wordt ook wel ‘traditioneel IQ’ genoemd

kenmerken van de periode voor WO I (historische context)

- vooral in de praktijk van intelligentietesting grote vooruitgang

- theoretische vraag naar samenstellende elementen van intelligentie blijft grotendeels

onbeantwoord

- nog geen testings op grote schaal (collectieve afname)

- nog geen valideringsonderzoek

- door WO I grote nood aan instrumenten voor selectie voor en plaatsing in diverse

functies

- hierdoor kwam er een ander toepassingsdomein van intelligentietests op de voorgrond

- omdat individuele diagnostiek erg tijdrovend is, werd ook collectieve intelligentietest

geïntroduceerd: Army Alpha

soldaten moesten hand omhoog houden zodat ze allemaal op hetzelfde moment

konden beginnen met schrijven= standaardisering

- later ook niet-verbale variant: Army Bèta

mensen die geen Engels kunnen (immigranten)

pantomimische instructies (gebaren)

Na eerste wereldoorlog:

- test ontwikkeling in Amerika en Europa lopen sterk

uiteen

- Europa: Gestaltpsychologie, personalisme en fenomenologie individuele diagnostiek

Wijze waarop de proefpersoon de taak verricht is even belangrijk als de prestatie zelf

- Amerika: behavioristisch- positivistische en praktische behoeften groepstest

Ontwikkeling van Army beta door toenemende immigratie

Dit vormde later het standpunt voor onderzoek tussen verschillende volken

toch ook vooruitgang op vlak van individuele testdiagnostiek: Stanford-Binet 1937

- uitbreiding leeftijdsbereik (2 jaar – 22j 10m)

- verdere uitbreiding aantal proeven

- representatievere onderzoeksgroep (uit verschillende staten, maar nog steeds alleen

blank)

- invoering van parallelvormen

in een test twee subtesten die je parallel kan afnemen (hertesting op een ander

moment)

- meer psychometrische zorg

maar er kwam tegenwind...

David Wechsler (1896-1981)

- hoofdpsycholoog aan het Bellevue Psychiatric Hospital in New York

- professor klinische psychologie aan de New York University

- 1939 “the measurement of adult intelligence”

- kritiek op tests uit de Stanford-Binet traditie:

- Intelligentie is te gedifferentieerd om in één score te vatten

- Aard van de proeven verschilt naar gelang van de leeftijd (jonge kinderen krijgen

doe testen, oudere kinderen krijgen verbale testen)

- Proeven zijn hoofdzakelijk verbaal

- Mentale leeftijd is niet geschikt voor gebruik bij volwassenen (sommige aspecten

stoppen vroeger zich te ontwikkelen)

- twee nieuwe principes

- inhoudsschalen (i.p.v. leeftijdsschalen) schalen op basis van de inhoud van de proef

- verbale en performantiële intelligentie (i.p.v. algemene mentale bekwaamheid)

- deviatie-IQ

- tests uit de Wechslertraditie:

- Wechsler Intelligence Scale for Children (WISC-III)

- Wechsler Adult Intelligence Scale (WAIS-IV)

- Wechsler Preschool and Primary Scale of Intelligence (WPPSI-III)

- Wechsler Non Verbal scale of ability (WNV) (pathomimisch)

(tussen haakjes staan de meest recente Nederlandstalige versies van elke test)

Intussen kwamen er toch nog twee herzieningen Stanford-Binet

Stanford-Binet 1960- geen parallelvormen meer

- maximale chronologische leeftijd opgetrokken tot 18 jaar

- invoering deviatie-IQ (gemiddelde 100, SD 16)

- = uitvinding van Wechsler

- biedt oplossing voor twee problemen:

- ML stijgt niet zoals CL

- standaarddeviatie IQ verschilt naargelang leeftijdsgroep

- in 1972 ontwikkeling nieuwe normen voor de SB 1960 (niet uitsluitend blanken meer)

!! doordat er een andere standaarddeviatie is in de twee tradities heeft een getal een andere

betekenis !!

Stanford-Binet 1986- inhoudsschalen in plaats van leeftijdsschalen

- 15 schalen, in te delen in vier groepen

- verbaal

- abstract/visueel

- kwantitatief

- onmiddellijk geheugen

- nooit in het Nederlands verschenen

Psychotechnische proevenparallel aan intelligentietests in de context van onderwijs ontwikkelden zich psychotechnische

proeven in de context van personeelsselectie en beroepskeuzeadvies

- door technische en industriële revolutie waren rond de eeuwwisseling nieuwe

beroepen ontstaan

- nood aan instrumenten om geschiktheid voor deze beroepen te onderzoeken

- ontstaan van bureaus voor beroepskeuze

persoonlijke geschiktheid is belangrijker

Hugo Münsterberg (1863-1916)

- pionier van de psychotechniek

- van oorsprong Duitser

- werkzaam aan Harvard University

- ontwikkelde onder meer psychologische proeven voor de selectie van

trambestuurders

WO I stimuleerde de ontwikkeling van psychotechnische proeven voor selectiedoeleinden

- vooral in Duitsland erg populair

- psychotechnische laboratoria schieten als paddenstoelen uit de grond

rond 1930 gebeurden een aantal verschuivingen:

- geschiktheid voor een beroep hangt niet alleen af van capaciteiten maar ook van

persoonlijkheid

- hulp van psycholoog werd niet alleen ingeroepen bij selectie voor technische

beroepen maar ook bij selectie voor leidinggevende en organisatorische beroepen

deze verschuivingen leiden mee tot de intrede van een nieuw soort psychotechnische proeven:

observatieproeven

observatie mee nemen in beoordeling

verslag= portret van de persoon

vanaf de jaren 1930 bepaalden zulke proeven het beeld van de psychotechniek

- niet alleen aandacht voor prestatie van geteste persoon, maar ook voor gedrag

tijdens de proef

- persoonlijke inbreng diagnosticus werd belangrijker

- manier van verslagvoering veranderde

in de jaren 1940 ontstonden voorlopers van ‘assessment center’ technieken

- Burma Town test (spionnen)

- Maquettetest (stadsplanners)

Persoonlijkheidsvragenlijstendoor WO I ontstond nood aan instrumenten om emotioneel onstabiele recruten te kunnen

identificeren gaf in 1917 aanleiding tot eerste persoonlijkheidsvragenlijst: Woodworth Personal

Data Sheet

- 116 vragen

- gemaakt op vraag van Amerikaanse leger

- eerste vragenlijst waarin antwoorden worden opgeteld

- optelsom = index van ‘psychologische aanpassing’

uit die eerste aanpassingslijst kwamen in de jaren 1930 heel wat andere vragenlijsten voort.

Persoonlijkheid en aanpassing werden als erg gerelateerd gezien

- Bernreuter Personality Inventory

- Bell Adjustment Inventory

- California Test of Personality

deze ‘nakomelingen’ worden gekenmerkt door differentiatie

- diverse aspecten van aanpassing (introvert, extravert)

- diverse domeinen (sociale vaardigheden, persoonlijkheid)

vroege persoonlijkheidsvragenlijsten hebben sterk psychiatrische inslag

- focus op aanpassing

- psychiatrische ziektebeelden als vormen van ‘onaangepastheid’

in de jaren 1940 ontwikkelen Hathaway en McKinley een vragenlijst die erop gericht is

meerdere aspecten van persoonlijkheid en disfunctioneren te meten: de Minnesota Multiphasic

Personality Inventory (MMPI)

andere vragenlijsten zijn op de MMPI gebaseerd

- California Personality Inventory (CPI)

- ‘MMPI voor normalen’

minder nadruk op psychopathologie

dichter bij normaal spectrum

- Nederlandse Persoonlijkheidsvragenlijst (NPV)

- aanpassing van de CPI voor het Nederlandse taalgebied

vanuit de differentiële psychologie ontstaan factoranalytische persoonlijkheidsvragenlijsten

verschillende tradities in USA versus Engeland- USA (Guilford, Cattell): oblieke factoren (factoren zijn gecorreleerd)

- Engeland (Eysenck): orthogonale factoren (factoren zijn zo min mogelijk met elkaar

gecorreleerd)

Hoe factor rotatie wordt uitgevoerd

Of factoren met elkaar correleren

recente vragenlijsten die uit deze tradities voortkwamen:

- Guilford LTP Temperament Survey (GLTS ‘94)

- NEO-PI-R

- Eysenck Personality Inventory / Amsterdamse Biografische Vragenlijst

Projectietestsvanaf de jaren 1930 komt binnen de psychiatrie een nieuwe testvorm in zwang, specifiek

bedoeld voor de diagnostiek van persoonlijkheid: projectietests

- vanuit onvrede met apparaten-tests, die te veel focusten op de ‘buitenkant’ van de

persoon

- mede onder invloed van de opkomst van de psychoanalyse

- belang van verschillende soorten informatie, niet alleen op de buitenkant maar

ook op de binnenkant nood aan ander soort van instrumenten

Sigmund Freud (1856-1939)- grondlegger van de psychoanalyse

- lanceerde de idee dat emotioneel beladen herinneringen, die uit het bewustzijn

verdrongen zijn, weer bewust gemaakt kunnen worden met behulp van subtiele

duidingsmethoden

- inzicht krijgen op de herinneringen die verdrongen zijn via dromen

Carl Gustav Jung (1875-1961)- leerling van Freud

- gebruikte woord-associatietest om complexen van emotioneel beladen,

onverwerkte ervaringen bloot te leggen

Hermann Rorschach (1884-1922)- leerling van Freud en Jung

- vlekkentest

- gebruikte vlekken om inzicht te krijgen in diepere persoonlijkheidsstructuur

Rorschach vlekkentest

- 10 platen met inktvlekken (“wat zou dit kunnen zijn?”)

- voor het eerst voorgesteld in 1921 in “Psychodiagnostik”

5 zwart wit, 5 gekleurde vlekken

Allemaal symmetrisch

Begin: waarnemingstest

Later: psychodiagnostiek

hedendaagse test verschilt van oorspronkelijke

- minder platen

- kleinere platen

- zonder zwarte rand

- schakering ten gevolge van drukproces

Rorschach beschreef test als ‘waarnemingsexperiment’

- bij interpretatie niet zozeer letten op inhoud van de antwoorden, maar wel op de

vormkenmerken (de hele vlek, een stuk van de vlek, …)

test was aanvankelijk niet erg succesvol

“Rorschach is a blot on the history of psychology.”

na eerste kritische reacties komt er in de jaren 1930 wel een doorbraak en wordt de test een van

de populairste en meest gebruikte psychologische tests

succes van de Rorschachtest inspireerde anderen tot de ontwikkeling van andere tests,

gebaseerd op hetzelfde principe:

- platentests (bijv. Thematic Apperception Test)

platen met tafferelen, hier iets over vertellen. De mensen vertellen iets over deze plaat en

hebben hier hun fantasie voor nodig, wat een indicatie geeft van onderliggende dingen

- keuzetests (bijv. Szondi)

8 foto’s, elk representeert een categorie (depressie, sadistische, hysterische,

catatonische, paranoïde, manische en homofilie)

2 voorkeuren uitkiezen, reflecteren behoeften die geaccepteerd worden

2 afkeuren uitkiezen, reflecteren onvervulde behoeften die niet geaccepteerd worden

De keuzen geeft een indicatie aan van behoeften en noden

- tekentests (bijv. Boomtest)

cliënt tekent

dit wordt geïnterpreteerd

wat met tekent reflecteert over diepere lagen van persoonlijkheid

- in de jaren 1940 vonden projectietests ook hun weg naar de sector van personeelsselectie

en beroepskeuzeadvies

- ontwikkeling van speciale varianten (bijv. Vocational Apperception Test)

- Boomtest tot in de jaren 1970 frequent gebruikt voor personeelsselectie

voorbeeldvraag

In welke test werd intelligentie voor het eerst gekwantificeerd aan de hand van het traditioneel

IQ?

- Binet-Simon 1911

- Stanford-Binet 1914



Wat moet je voor dit hoofdstuk zeker niet van buiten leren?

- geboorte- en sterfdata van de figuren uit het historisch overzicht

- data van specifieke gebeurtenissen of publicaties

(uitzondering: data van tests uit de Stanford-Binet traditie)

Kenmerken van een wetenschappelijk

onderbouwde testhandboek pp. 41-46, 49-53,

146-156, 172-186, 190-194, 205-206, 328-341

Moeten we, als we een uitspraak willen doen over de eigenschappen van een persoon, wel een

test gebruiken?

Hoe onderscheidt een wetenschappelijk onderbouwde psychologische test zich van het

voorwetenschappelijke oordeel?

Efficiëntie- testconstructeur heeft verzameling van opgaven geselecteerd of geconstrueerd die

optimaal een appèl doen op de te meten eigenschap

- diagnosticus creëert een testsituatie waarin bijkomstigheden en storende invloeden zo

veel mogelijk worden geweerd

voorbeeld 1: intelligentietest

• bestaat uit taken die voor hun oplossing een beroep doen op diverse belangrijke aspecten

van intelligentie

• geeft in enkele uren tijd vrij volledig beeld van intelligentie, terwijl vergelijkbare observatie

van gedrag ‘in vivo’ meerdere dagen in beslag zou nemen

voorbeeld 2: persoonlijkheidsvragenlijst

• aan respondent wordt gevraagd zich een voorstelling te maken van groot aantal situaties

en hoe hij/zij er typisch op reageert

• via zelfrapportering respondent krijgt men op korte tijd indruk van belangrijkste

persoonlijkheidskenmerken, in plaats van langdurige observatie

Standaardisatie en objectiviteitTest afnemen Complex en veelzijdig proces

Variatie : zakelijk neutraal vs. Vorm die van zowel proefpersoon als proefleider een hoge mate

van persoonlijke inzet verreis

Schriftelijke testen:

- Proefpersoon krijgt instructies

- Maakt test zonder hulp

Assesment center (rollenspellen)

- Zowel profleider als proefpersoon spelen een actieve rol

Leerpotentieel:

- Testen en training van cognitieve vaardigheden wisselen elkaar af

Verschillen in motivatie, samenwerking, onbevangenheid en andere eigenschappen die de

relatie met de testleider beïnvloeden

Probleem met test ervaring

Proefleiders vormen geen constante factor in de testsituatie

- Variëren in training, ervaring, inzicht, sensitiviteit en bereidheid tot contact

Belang van standaardisatie: verschillende omstandigheden kunnen voor verschillende resultaten

zorgen

Testonderzoek is een complex proces want grote verschillen tussen:

- testsituaties

- onderzochte personen

- proefleiders

- tests

Belang van standaardisatie

- bij zowel afname als scoring

- voorwaarde voor vergelijkbaarheid van testprestaties of –scores

Afname:

testsituatie (objectief) standaardisatie betekent dat de onderzochte in maximaal gelijke omstandigheden wordt getest

- instructie goed uitgewerkt

- proefleider houdt zich aan instructie

- opvallende of specifieke omgevingsinvloeden worden geweerd (temperatuur, geluid,

helderheid van licht, lichtinval, ventilatie, schrijfcondities)

- storingen tijdens testafname worden voorkomen

- (bij groepstests) samenwerken of afschrijven wordt verhinderd

proefpersoon (gedrag) De situatie waarin de onderzochte verkeert moet zoveel mogelijk constant gehouden worden

Proefpersonen kunnen op hun prestatie en gedragswijzen een zeer duidelijke invloed

uitoefenen

Sommige factoren zijn tot op zeker hoogte controleerbaar

- vermoeidheid, emotionele opwinding,...

- (vermeende) verwachtingen proefleider inlossen

- sociale wenselijkheid

- vertrouwdheid met specifieke test of testonderzoek in algemeen

- motivatie grip op motivatie door te streven naar een ongedwongen relatie met

de onderzochte

- angst

proefleider voornamelijk problemen bij individuele testen: omdat hier spraken is van een

wisselwerking tussen testleider en proefpersoon

makkelijker te controleren

training voor het afnemen en score van een test is cruciaal

- interactie met proefpersoon (vooral bij individuele afname)

- onervarenheid (mbt specifieke test of testonderzoek in algemeen)

scoring- naar maten het scoringsproces meer gebaseerd is op de subjectieve oordeelsvorming, geven

de scores een grotere foutmarge te zien

- onderscheid scoring van reacties op items met open-vraagvorm en geprecodeerde items

- wordt ook wel ‘objectiviteit’ genoemd: onafhankelijkheid van storende invloeden vanuit de

persoon van de waarnemer, beoordelaar of interpretator

- bij een objectief testonderzoek maakt het niet uit wie de beoordelaar is

- objectiviteit impliceert openheid en reproduceerbaarheid van de

evaluatieprocedure

- vanuit deze omschrijving kan de overeenkomst tussen beoordelaars beschouwd worden als

een maat van objectiviteit

- tests verschillen van elkaar in de mate waarin ze (kunnen) beantwoorden aan de eis van

objectiviteit

- heel objectief: verwerking van antwoorden bij schriftelijke meerkeuzetests

- weinig objectief: interpretatie van antwoorden bij observatietests en projectieve

technieken

- hoe groter de inbreng van de beoordelaar in het proces van verwerken van gegevens, hoe

groter de kans op subjectieve beïnvloeding

- spanningsveld met relevantie

- indien men verder wil gaan dan objectief controleerbare gedragsaspecten gebruikt

men best exact voorgeschreven verwerkingsprocedure

- onderscheid tussen

- reacties op items met open-vraagvorm

- reacties op geprecodeerde items

scoring van reacties op items met openvraagvorm- reacties kunnen verbaal of niet-verbaal zijn

- door de openvraagvorm is er risico op subjectiviteit en lage overeenkomst tussen

beoordelaars

• zinvolle uitspraken en voorspellingen onmogelijk

• lage validiteit

- manieren om risico te verminderen:

• gebruik van coderingssysteem (= stelsel van regels en voorschriften dat

volledig, duidelijk en ondubbelzinnig is)

• goede instructie van de beoordelaars + gelegenheid tot training

- aandacht voor individuele antwoorden en verschillen

scoring van reacties op geprecodeerde items- ‘meerkeuzevragen’

- verschillende opties: handscoring, zelfscoring, machinale scoring

- handscoring:

corrector telt goede en foute antwoorden, overgeslagen of onvolledig ingevulde

items

aan de hand van correct ingevuld protocol of verbetersleutel (transparant of

geperforeerd karton)

nadelen: duurt lang, risico op fouten

- zelfscoring:

antwoordformulier scoort zichzelf door middel van een doordrukprocédé met een

aan het antwoordformulier vastgemaakt tweede vel met cirkeltjes

corrector moet alleen nog de markeringen in de cirkeltjes optellen

nadeel: kostprijs

voordelen: snelheid en efficiëntie

- machinescoring:

antwoorden worden aangebracht op speciale antwoordformulieren die nadien

ingelezen kunnen worden

verwerking gebeurt volledig machinaal (soms ook vergelijking met normen en

interpretatie)

laat toe om verzamelde gegevens voor onderzoek te gebruiken

- kwaliteitskenmerken van de test

- informatie over de geteste groep als geheel

wordt in sommige gevallen gecombineerd met computerafname

Bewerkte scores/Normeringoutput van een testafname = ruwe testscoresper item 0/1 of fijnere gradatie

itemscores worden gecombineerd (bijv. opgeteld) tot ruwe testscore

ruwe scores kunnen voor veel verschillende dingen staan

- aantal goede of foute antwoorden in een kennistest

- aantal ‘ja’-antwoorden op een persoonlijkheidsvragenlijst

- aantal mislukte pogingen op handvaardigheidstest

- som van scores op ‘ratingschaal’ van een attitudevragenlijst

De bedoeling is altijd om iets te zeggen over het individu dat de test heeft afgenomen

ruwe scores zeggen niet veel, ze moeten geïnterpreteerd worden

dat kan op verschillende manieren:

• criteriumgericht referentiekader : vergelijking met bepaalde standaard (criterium –

absoluut meten)

- hoeveel opgaven waren er?

- hoeveel punten worden er afgetrokken voor een fout? ...

• normgericht referentiekader : vergelijking met relevante anderen (normgroep –

relatief meten)

- hoe hebben anderen het gedaan?

- waren er veel die een betere/mindere prestatie leverden?

criteriumgericht referentiekader: vergelijking met een absolute standaard = absoluut meten

Criterium: de prestatie beoordelen, kijken waaraan deze voldoet

- prestatie wordt beoordeeld zonder er de prestaties van anderen bij te betrekken: hoe goed is

de prestatie in vergelijking met een absolute standaard?

- vaak gebruikt in onderwijskundige context

- in welke mate hebben leerlingen het nagestreefde onderwijskundige doel bereikt?

- hoeveel kennis/inzicht hebben leerlingen verworven?

- antwoord is voor iedere leerling onafhankelijk van wat andere leerlingen presteren

noodzakelijk = goede voorafgaande analyse

• welk proces wil men bij de onderzochte analyseren?

• kan de mate waarin het al dan niet verwezenlijkt zijn van beoogde doelen

betrouwbaar gemeten worden?

normgericht referentiekader‘norm’

= referentiekader voor de evaluatie van de ruwe scores dat is gebaseerd op de kenmerken

van de verdeling van de ruwe scores in een populatie; die kenmerken worden geschat opk basis

van een representatieve steekproef

- test wordt voorgelegd aan een representatieve, grote en op toeval samengestelde

steekproef uit de populatie waarvoor de test bedoeld is

- verzamelde testscores worden statistisch bewerkt zodat een vlotte vergelijking mogelijk

wordt tussen de testscore van een welbepaald persoon en die van de referentiegroep

- afhankelijkheid van groep proefpersonen waarop normen zijn vastgesteld

• generaliseerbaarheid van de norm hangt af van de grootte van de vergelijkingsgroep

• belangrijk om, bij rapportering, de specifieke kenmerken van de normgroep te

vermelden

• bij vertaling van een test kan men niet zomaar de normgegevens uit het

oorspronkelijke taalgebied overnemen

• normen zijn niet absoluut; geregelde revisie is noodzakelijk

cf. Flynn-effect: het IQ stijgt over de generaties heen

daarom moet men de normering om de zo veel jaar opnieuw doen

zonder hernormering stijgen de iq punten 3 tot 5 punten

normering kan gebeuren

- binnen één referentiegroep: een referentie groep met dezelfde kenmerken (bv. Bij

angstige mensen bij een test over angst)

- ten aanzien van meerdere referentiegroepen

• diverse leeftijdsgroepen

• mannen/vrouwen (bv. Wanneer meisjes angstiger zijn dan jongens=

geslachtsverschil )

• bevolkingsgroepen/klinische groepen ...

let op: bij normering is altijd sprake van een vergelijking met anderen, maar niet elke vergelijking

met anderen heeft een normkarakter!

Verhoudingsnormen: testscores gedeeld door een andere variabele (bv. leeftijd) en daardoor

onafhankelijk gemaakt van die variabel

vergelijking en normen gebaseerd op rangorderangscores- eenvoudigste vorm van vergelijking tussen individuen: rangordening

- ordening op rangorde, bv. van laagste naar hoogste

- bewerkte score = rangnummer

- interpretatie afhankelijk van groepsgrootte

nuttig voor snelle aanduiding van prestatie in vergelijking met anderen in dezelfde groep

zonder kennis van groepsgrootte en buiten de bewuste groep geen betekenis

percentielenpercentielen = de 99 punten die een frequentieverdeling verdelen in 100 groepen van gelijke

grootte

voorbeeld: Pc 70 = punt op de schaal waaronder (links er van) 70% van de verdeling

gelegen is

bekende percentielen:

– P50: mediaan

– P25: eerste kwartiel (Q1)

– P75: derde kwartiel (Q3)

wat als grote groep respondenten zelfde ruwe score heeft?

- ruwe score beslaat meerdere percentielen

- voorbeeld:

28% heeft ruwe score <=61

34% heeft ruwe score <= 62, dus 6% heeft score 62

met welk percentiel stemt 62 overeen?

28 + 0,5 (34-28) = 28 + 3 = Pc 31 percentiel in het midden

voordelen

- onafhankelijk van groepsgrootte

- eenvoudige en snelle berekening

- gemakkelijke toepasbaarheid en inzichtelijkheid

nadelen

- ordinaal meetniveau, waardoor beperkingen in mogelijke statistische bewerkingen (geen

gemiddelden/varianties, alleen rangcorrelaties)

- frequentieverdeling percentiele scores niet vergelijkbaar met die van ruwe scoren

in het midden van de gauscurve komt een zelfde score veel vaker voor, en zal dus ook

meer percentielen innemen dan scores op het einde

Voorbeeld: Competentiebelevingsschaal voor Adolescenten (CBSA)

- verschillende scores voor jongens en meisjes

- vergelijken van leerlingen

decielenFrequentieverdeling wordt in 10 gelijke groepen verdeeld

vigintielenfrequentieverdeling wordt in 20 gelijke groepen verdeeld

Voorbeeld: Zelfbeoordelingsvragenlijst (ZBV-K)

- vragenlijst die toestandsangst en angstdispositie meet

- telkens 20 vragen met drie alternatieven

- normen voor basisschool en voortgezet onderwijs

- ruwe subtestscores omgezet naar decielen

vergelijking en normen gebaseerd op gemiddelde en spreiding• omzetting van ruwe scores in standaardscore-eenheden

• diverse varianten:

- standaardscores: z-scores

- genormaliseerde standaardscores: T-scores, deviatie-IQ

standaardscores of z-scoresstandaardscore (Zx) drukt uit hoeveel standaarddeviaties (SDx) een ruwe score (X) van het

gemiddelde (gemX) afwijkt

formule: Zx = (X – gemX)/SDx

0= gemiddelde, -= onder gemiddelde, += boven gemiddelde; hoeveel we afwijken van het

gemiddelde drukken we uit met standaard deviaties

zonder transformatie hebben standaardscores vaak een klein bereik en zijn het zowel positieve

als negatieve getallen

Om de positieve en negatieve getallen weg te halen, kunnen we de scores optellen met een vast

getal (bv. 100) de verdeling blijft dan hetzelfde, maar de getallen veranderen

Door op te tellen of af te trekken veranderen de verhoudingen niet, door te vermenigvuldigen of

delen wel

om dat vermijden zijn lineaire transformaties (y=ax+b) mogelijk

het gemiddelde van alle scores aftrekken

de verdeling blijft bestaan

bij omzetting van ruwe scores naar standaardscores:

- wordt de verdeling verschoven (gemiddelde wordt van elke score afgetrokken)

- wordt de afstand tussen de scores veranderd (elke score wordt gedeeld door de

standaarddeviatie)

- maar blijven andere kenmerken (scheefheid, bimodaliteit,...) gelijk

standaardscores behouden dus dezelfde verdelingskenmerken als ruwe scores: z-scores zijn dus

niet automatisch normaal verdeeld!

genormaliseerde standaardscoresniet-lineaire transformatie: de verdeling van scores wordt zodanig

vervormd dat er een normale verdeling ontstaat

normaliseren: de transformatie op zo een manier doen zodat de

uiteindelijke verdeling een normaal verdeling heeft (we veranderen

de verdeling)

omdat we dan weten waar zich hoeveel scores bevinden

standaarddeviatie ligt op dezelfde plaats

niet altijd verantwoordbaar, enkel wanneer de geobserveerde verdeling in de buurt

komt bij een normaalverdeling

• vergroot gebruiksgemak, maar doet werkelijkheid soms geweld aan

• gekende voorbeelden:

- T-scores

- Stanines

- Deviatie-IQ

T-scores (gem 50, SD 10)- Genormaliseerde verdeling

Gestandaardiseerd gemiddelde is 50, SD= 10

T score 60 = percentiel 84

Stanines– komt van ‘standard score’ en ‘nine’

– schaal van 1 tot 9 met getalswaarden die corresponderen

met gelijke intervallen onder de normaalverdeling

– stanines komen niet exact overeen met bepaalde

ruwe scores, maar vertegenwoordigen een

breedte van 0,5 SD

– gemiddelde ligt in het midden van stanine 5

Voorbeeld: NEO-PI-R

normen beschikbaar voor diverse deelpopulaties (de situatie onder welke iemand de test

laat afnemen, veranderen de resultaten)

- volgens testsituatie (neutraal/selectie/begeleiding

- - volgens land (Nederland/België)

- volgens geslacht (mannen/vrouwen)

- volgens leeftijd (<30 / 30-50 / >50)

- volgens opleiding (laag/gemiddeld/hoog met indicatie van waar het wel of niet

aangewezen is deelnormen te gebruiken

ruwe subtestscores omgezet naar stanines

voorbeeld: normtabellen Job Stress Survey

Deviatie-IQ (gem 100, SD 15*)

*Stanford-Binet traditie: SD 16

Wecsler: 1 standaarddeviatie boven gemiddelde = 115

Gemiddelde= 100

SD= 15

Standford binet: 1 standaarddeviatie boven gemiddelde= 116

Gemiddelde = 100

SD= 16

Betrouwbaarheid"Reliability refers to the consistency of measurement when the testing procedure is repeated on

a population of individuals or groups"

(Standards for Educational and Psychological Testing, 1999, p. 25)

verwijst naar herhaalbaarheid van de meetresultaten: wanneer een test onder gelijkblijvende

condities diverse malen aan een zelfde persoon wordt voorgelegd, moet de verkregen testscore

over de testsessies heen zo weinig mogelijk variëren

bv. Meteen na elkaar op de weegschaal gaan staan en hetzelfde gewicht wordt aangegeven

een zinvolle herhaalbaarheid van metingen wordt bemoeilijkt door geheugeneffecten en

leerprocessen

net als fysische eigenschappen (lengte, gewicht,...) worden ook psychologische eigenschappen

(bijv. intelligentie) gemeten

bij psychologische metingen kan verwacht worden dat fluctuaties in prestaties en gedrag als

reactie op testvragen en –opgaven groter en complexer van aard zijn en dat de verschillen

tussen eerste en tweede meting dus ook groter zullen zijn er spelen andere factoren een rol

die de herhaalbaarheid ingewikkelder maken

doel = in kaart brengen wat de relatieve inbreng is van de onvoorspelbare invloeden over

testafnames heen op de testprestaties

testscore die een bepaalde persoon in een specifieke testsessie behaalt, kan opgesplitst worden

in twee componenten:

- systematisch deel dat over testafnames niet verandert (‘ware score’)

- toevallig deel dat over testafnames op onvoorspelbare wijze varieert

(‘foutencomponent’, toevallige ruis)

geen enkele meting is perfect betrouwbaar, er is altijd een meetfout.

foutencomponent verandert de score van de geteste persoon op toevallige wijze (soms naar

boven soms naar onder)

over herhalingen heen heffen de foutencomponenten elkaar op

↓

als men het gemiddelde neemt van een groot aantal herhalingen, krijgt men de “ware” score

onze ruis is niet systematisch, de ene keer wat meer naar boven en de andere keer wat meer

naar onder. Dit zorgt er voor dat de ruis tegen elkaar weg valt om tot de ware score te komen

bij betrouwbaarheid gaat het er om dat we de meting heel vaak herhalen, en dat we door deze

grote herhaalbaarheid tot de ware score kunnen komen

MAAR

psychologische metingen zijn niet herhaalbaar...

het is niet zinvol iemand diverse malen dezelfde test voor te leggen (geheugen, leren,...)

DUS

‘hypothetische’ herhaling nodig...

(= zoeken naar een realistische benadering van het ideaal van onafhankelijke

replicatie van de testprocedure)

vier benaderingen:

parallelvormmethodetwee inwisselbare (maar niet-identieke, dezelfde moeilijkheid, zelfde type vragen, …) tests

worden afgenomen bij groep proefpersonen

correlatie tussen de twee ‘parallelle’ testscores als schatting van betrouwbaarheid =

parallelbetrouwbaarheid

kanttekening: in de praktijk moeilijk om echt parallelle tests te ontwikkelen

test-hertestmethodetest wordt met een behoorlijke tussentijd tweemaal aan dezelfde groep proefpersonen

voorgelegd

correlatie tussen de testscores van de twee afnames als schatting van betrouwbaarheid

= test-hertest betrouwbaarhied

kanttekening: het is mogelijk dat de gemeten eigenschap verandert in de tussentijd en dat is

niet bij iedereen in gelijke mate zo

- leereffecten (de persoon groeit in de tussentijd, leert nieuwe dingen bij)

- geheugeneffecten (de persoon herinnerd zich de vorige afnamen en weet welke

tactiek hij toen gebruikte)

- directe invloed van eerste meting op gemeten eigenschap (bijv.

attitudeverandering)

hertestingsbetrouwbaarheid is enkel zinvol bij relatief stabiele gegevens zoals intelligentie, niet

bij dingen zoals meningen, stemming, …

splitsingsmethodetest wordt in twee helften met elk evenveel items gesplitst, die zoveel mogelijk parallel zijn

= efficiënte variant van de parallelvormmethode

correlatie tussen de scores op de twee testhelften schatting van betrouwbaarheid van de halve

test (correctie nodig) =splitsing betrouwbaarheid

kanttekening: in de praktijk moeilijk om een test in echt parallelle helften te splitsen

interneconsistentiemethodetest wordt één keer afgenomen

betrouwbaarheid wordt gebaseerd op de variantie van de testscore en alle covarianties tussen

de items = interneconsistentie betrouwbaarheid

nagaan hoe de items onderling samen hangen. De verschillende items worden als parallel van

elkaar gezien. We stellen meerdere vragen die samen een schaal vormen.

Door meerdere keren 1 schaal te bevragen zijn we zeker dat we een betrouwbaar antwoord

krijgen

bekendste coëfficiënt = Cronbach’s alpha (α)

betrouwbaarheidscoëfficiënten variëren tussen 0 en 1

evaluatieals de test gebruikt wordt om belangrijke beslissingen over individuen te nemen:

• .90+ goed

• .80-.90 voldoende

• <.80 onvoldoende

als de test gebruikt wordt om minder belangrijke beslissingen over individuen te nemen:

• .80+ goed



als de test gebruikt wordt voor groepsvergelijkingen of experimentele toepassingen (try-out van

nieuwe tests)

• .70+ goed



betrouwbaarheidsintervalgegeven dat geen enkele meting perfect betrouwbaar is, moeten we ervan uitgaan dat de

geobserveerde score slechts een schatting is van de ware score

bij herhalingen van de meting fluctueren de geobserveerde scores, terwijl de ware score gelijk

blijft

het is best om bij de interpretatie niet van slechts één schatting (geobserveerde score) uit te

gaan, maar een interval af te bakenen

betrouwbaarheidsinterval (BI): interval rond de geobserveerde waarvan het waarschijnlijk is dat

de ware score erin ligt

- 90% betrouwbaarheidsinterval

- 95% betrouwbaarheidsinterval

betekenis: bij herhaalde berekeningen van betrouwbaarheidsinterval zal de ware score in

90% tot 95% van de gevallen in het berekende interval liggen

betrouwbaarheid is een noodzakelijke voorwaarde voor validiteit

• een onbetrouwbare test geeft vooral meetfouten weer en kan de bedoelde

psychologische eigenschap hooguit heel zwak representeren

betrouwbaarheid is evenwel geen voldoende voorwaarde voor validiteit

• een betrouwbare test kan onbedoeld iets anders meten dan wat de bedoeling

was

• wat is wel nodig voor validiteit? (→ volgende onderdeel)

Validiteitkernvraag = meet een test wat hij verondersteld wordt te meten?

Meet ik wat ik beoog te meten

voorbeeld:

iemands intelligentie inschatten op basis van

• reactie op praktische problemen

• schoolprestaties

• belezenheid

• ...

zijn deze indicaties de juiste? tonen ze iemands intelligentie?

validiteit = mate waarin de test aan zijn doel beantwoordt

- niet eigenschap van de test op zich

- uitspraak over validiteit kan alleen met verwijzing naar de bedoeling van een test

- als een test meerdere doelen dient, kan het zijn dat hij voor het ene doel wel en

voor het andere niet valide is

validiteit is niet alleen afhankelijk van de test, maar ook hoe de test gebruikt wordt en waarvoor

de test gebruikt wordt

"Validity refers to the degree to which evidence and theory support the interpretations of test

scores entailed by proposed uses of the test"

(Standards for Educational and Psychological Testing, 1999, p. 9)

gemeenschappelijk doel van alle tests = via testgedrag iets kunnen zeggen over niet-testgedrag

- gedragingen die ook representatief zijn voor de gemeten eigenschap, maar die niet

door de specifieke verzameling van items in de test werden opgeroepen (bv.

intelligentie test) = psychologisch begrip meten, begripsvaliditeit

- gedragingen die representatief zijn voor de eigenschappen of prestaties, die men

met behulp van de testscore zou willen voorspellen (bv. ingangsexamen

geneeskunde) = voorspellen, predicatieve validiteit

via de test een uitspraak doen over iets buiten de test. We kiezen hiervoor gedragingen

we willen een bepaalde eigenschap meten of iets meten met een ander doen (bv. Toelating tot

studie)

validiteit gaat over de vraag of de sprong van het testgedrag naar het niet-testgedrag

verantwoord is

twee grote soorten doelstellingen en daaraan gelinkt twee hoofdtypes validiteit:

- doel = ander gedrag voorspellen

(→predictieve validiteit)

- doel = psychologisch begrip operationaliseren

(→begripsvaliditeit)

elk gebruik van een psychologische test is onder te brengen bij een van deze twee doelstellingen

predictieve validiteitprimair doel = bepaald gedrag of bepaalde prestatie buiten de testsituatie voorspellen (=

criterium)

predictie in methodologische zin, los van het tijdsaspect

- criterium in toekomst (predictie in enge zin) (hoe iemand in de toekomst zal

presteren)

= predictieve validiteit in enge zin

- criterium in heden (paradictie)(de maten van een bepaald eigenschap tijdens de

meting)

= gelijktijdige/concurrente validiteit

- criterium in verleden (postdictie)

om een goede voorspelling mogelijk te maken moet aan volgende voorwaarden voldaan zijn:

- zowel voor de predictor als voor het criterium moeten goede meetinstrumenten

voorhanden zijn

- zowel de test als het te voorspellen gedrag moeten uitingen zijn van eigenschappen

waartussen een aantoonbare relatie bestaat

goed meet instrument voor zowel criterium als predictor

gebaseerd op theorie vorming

er zijn diverse mogelijkheden om predictieve validiteit na te gaan

- associaties tussen test en criterium

- onderscheidend vermogen van de test ten aanzien van het criterium

voorbeeld: verschillen in scores op de Gezinsklimaatschaal tussen gezinnen met en zonder

problemen

Significatnet verschillen tussen een gewoon gezinsklimaat en een problematisch gezinsklimaat

voorbeeld: verschillen in WAIS-IV-scores tussen verschillende beroepsgroepen

begripsvaliditeitprimair doel = een capaciteit, persoonlijkheidstrek of attitude operationaliseren

begripsvaliditeit = de mate waarin een test het begrip meet dat hij beoogt te meten

deelvragen:

- komt de interne structuur van de test overeen met de verwachte structuur?

= interne begripsvaliditeit

- vertoont de test de verwachte mate van samenhang met andere tests die

operationaliseringen zijn van ofwel een zelfde begrip ofwel een verschillend begrip?

= externe begripsvaliditeit

• samenhang met tests die hetzelfde meten : convergente/congruente validiteit

• samenhang met tests die iets anders meten : divergente/ discriminante

validiteit

bv. Angst vragenlijst correleert hoog met andere angst vragenlijsten, maar

mag niet hoog correleren met depressie vragenlijsten

andere validiteitstermeninhoudsvaliditeit• hoe goed representeert de inhoud van de test een geheel van situaties, kennisinhouden of

vaardigheden waarover conclusies getrokken moeten worden?

• = indicatie van de mate waarin de test het domein van mogelijke items representeert

o vaak nagegaan door bevraging van deskundigen

o gevaar van cirkelredenering: vergelijking met andere test

• vooral relevant binnen onderwijskundige diagnostiek

• vaak aan de hand van een testpanel beoordeeld

indrukvaliditeit• mate waarin de persoon die de test aflegt de test relevant, zinvol acht voor datgene

waarvoor hij/zij getest wordt

o relatie tussen test en criterium is duidelijk

o betekenis van test is duidelijk

o is niet echt een vorm van validiteit, maar hoe de proefpersoon het ervaart

• staat los van of de test daadwerkelijk samenhangt met criterium of daadwerkelijk bedoelde

eigenschap meet (cf. ‘faith validity’)

• verwant met ‘transparantheid’

• is wenselijke maar niet noodzakelijke eigenschap van een goede test

incrementele validiteit

• betere voorspelling door het toevoegen van een of meerdere tests aan reeds aanwezige

informatie

• situeert zich op het domein van predictieve validiteit

• voegt de test iets extra toe aan een al bestaande test. Wat voegt het toe aan de al bestaande

test of al gevonden informatie. Is de test op deze manier relevant, nuttig

niet bij alle coëfficiënten ‘hoe hoger hoe beter’ (cf. discriminante validiteit)

tentatieve vuistregel:

• >.50 hoog

• >.30 medium

• >.10 laag

COTAN (niet vanbuiten kennen) • 1959 oprichting Commissie Test Aangelegenheden Nederland (COTAN), naar model van

Educational Test Services in VS

Evalueren van test

- overzicht/beoordeling van in Nederland bestaande en in gebruik zijnde tests:

Documentatie van Tests en Testresearch in Nederland

- vroeger twee boekdelen:

• Testbeschrijvingen

• Testresearch

(eerste editie 1961, nadien aanvullingen/updates)

- nu volledig electronisch systeem

te gebruiken in PPWBIB (paswoord vragen aan de balie)

www.cotandocumentatie.nl

Test kan voor beoordeling ingestuurd worden als hij aan een aantal voorwaarden voldoet:

- in Nederland verkrijgbaar

- voor het Nederlands taalgebied geconstrueerd, vertaald en/of bewerkt

- afnameprocedure gestandaardiseerd

- onderzoek naar of validiteit of betrouwbaarheid of normen

http://www.cotandocumentatie.nl/

- voor professioneel gebruik ontwikkeld

- maakt direct of indirect uitspraken over personen mogelijk

Tests die niet officieel uitgegeven zijn of die niet genormeerd zijn (waardoor individuele

toepassing af te raden is), kunnen in COTAN opgenomen worden als researchinstrument.

richtlijnen van de COTAN versie mei 2010

1. uitgangspunten van testconstructie

2. kwaliteit van het testmateriaal

3. kwaliteit van de handleiding

4. normen

5. betrouwbaarheid

6. begripsvaliditeit

7. criteriumvaliditeit

Uitgangspunten (cat.1)

1.1. "is het gebruiksdoel van de test aangegeven?"

1.2. "is de herkomst van het constructie-idee beschreven en/of worden de te meten

constructen gedefinieerd?"

1.3. "wordt de relevantie van de testinhoud van de te meten constructen aannemelijk

gemaakt?"

Testmateriaal (cat. 2)

vragen voor papier- en potloodversie

2.1. "zijn de testopgaven gestandaardiseerd?"

2.2. "is er een objectief scoringssysteem?"

2.3. "zijn de vragen vrij van racistische, etnocentrische, seksistische of voor bepaalde

bevolkingsgroepen kwetsende inhoud?

2.4. "zijn items, testboekje, antwoordschalen en/of antwoordformulier zo ontworpen dat

fouten bij invulling vermeden kunnen worden?"

2.5. "is de instructie voor de geteste volledig en duidelijk?”

2.6. “zijn de items correct geformuleerd?”

2.7. “hoe is de kwaliteit van het testmateriaal?”

2.8. “is het scoringssysteem zodanig ontworpen en beschreven dat fouten bij de scoring

vermeden kunnen worden?”

Testmateriaal (cat. 2)

vragen voor afname via computer

2.9. “is de test gestandaardiseerd of worden bij adaptieve tests beslissingsregels

geëxpliciteerd?”

2.10. "is er sprake van een geautomatiseerd of objectief scoringssysteem?"

2.11. "zijn de items vrij van racistische, etnocentrische, seksistische of voor bepaalde

bevolkingsgroepen kwetsende inhoud?

2.12. “is de software zodanig ontworpen dat fouten door onjuist gebruik vermeden

kunnen worden?"

2.13. "is de instructie voor de geteste volledig en duidelijk?”

2.14. “zijn de items correct geformuleerd?”

2.15. “hoe is de kwaliteit van de vormgeving van de gebruikersinterface?”

2.16. “is de test voldoende beveiligd?”

Handleiding (cat. 3)

3.1. "is er een handleiding beschikbaar?"

3.2. "zijn de aanwijzingen voor de testleider volledig en duidelijk?"

3.3. "wordt informatie gegeven over de gebruiksmogelijkheden en beperkingen van de

test?"

3.4. "wordt er een samenvatting van de onderzoeksresultaten gegeven?"

3.5. "wordt met voorbeelden aangegeven hoe de testscores geïnterpreteerd kunnen

worden?"

3.6. "wordt gewezen op soorten informatie die bij de interpretatie van belang kunnen

zijn?"

3.7. "wordt de mate van deskundigheid vereist voor bij afname en interpretatie

vermeld?"

extra vragen bij computerafname

3.8. “wordt er informatie gegeven over de installatie van de computersoftware?”

3.9. “wordt er informatie gegeven over de bediening en mogelijkheden van de

software?”

3.10. “zijn er voldoende mogelijkheden voor technische ondersteuning?”

Normen (cat. 4)

4.1. “worden er normen verstrekt?”

4.2. “zijn de normen actueel?”

normgerichte interpretatie

4.3. “wat is de kwaliteit van de verstrekte normgroepen?”

a. groot genoeg?

b. representatief?

4.4. "worden betekenis en beperkingen van de normschaal duidelijk gemaakt voor de

gebruiker en is het type normschaal in overeenstemming met doel van de test?“

4.5. "worden gemiddelden, standaarddeviaties en gegevens over scoreverdeling

gemeld?“

4.6. "worden gegevens verstrekt over mogelijke verschillen tussen subgroepen?“

4.7. "worden er gegevens verstrekt over de nauwkeurigheid van de meting en de daarbij

behorende intervallen?”

domeingerichte interpretatie

4.8. “is er voldoende overeenstemming tussen beoordelaars?”

4.9. “zijn de procedures op grond waarvan de grensscores zijn bepaald correct?”

4.10. “zijn de beoordelaars naar behoren geselecteerd en getraind?”

criteriumgerichte interpretatie

4.11. “rechtvaardigen de onderzoeksresultaten het gebruik van grensscores?”

4.12. “is de onderzoeksgroep in overeenstemming met het bedoelde gebruik?”

4.13. “is de onderzoeksgroep groot genoeg?”

Betrouwbaarheid (cat. 5)

5.1. "worden er gegevens over de betrouwbaarheid verstrekt?"

5.2. "is betrouwbaarheid voldoende gelet op het beoogde type beslissingen?"

a) paralleltestbetrouwbaarheid

b) betrouwbaarheid op basis van inter-itemrelaties

c) test-hertestbetrouwbaarheid

d) interbeoordelaarsbetrouwbaarheid

e) methoden op basis van item-responstheorie

f) methoden op basis van generaliseerbaarheidstheorie of structurele

vergelijkingsmodellen

5.3. “wat is de kwaliteit van het onderzoek naar de betrouwbaarheid?”

g) "zijn de procedures om betrouwbaarheidsgegevens te berekenen correct?"

h) "zijn de steekproeven in overeenstemming met het beoogde gebruik?"

i) "maken de verstrekte gegevens een gefundeerd oordeel mogelijk?"

Begripsvaliditeit (cat. 6)

6.1. "worden gegevens over begripsvaliditeit vermeld?"

6.2. "maken de resultaten voldoende aannemelijk dat het begrip zoals bedoeld wordt

gemeten?”

a. dimensionaliteit van de scores

b. psychometrische kwaliteit van de items

c. invariantie van factorstructuur/mog. itembias bij verschillende groepen?

d. convergente en discriminante validiteit

e. verschillen tussen relevante groepen?

f. overige gegevens

6.3a. "zijn de procedures om begripsvaliditeitsgegevens te berekenen correct?“

6.3b. "zijn de steekproeven in overeenstemming met het beoogde gebruik?“

6.3c. "wat is de kwaliteit van de andere maten die in het onderzoek gebruikt zijn?“

6.3d. “is de kwaliteit van het onderzoek zodanig dat de beoordeling van de begripsvaliditeit

kan worden bevestigd?”

Criteriumvaliditeit (cat. 7)

7.1. "worden gegevens verstrekt over het verband test-criterium?”

7.2. “zijn de resultaten voldoende gelet op het beoogde type beslissingen?“

7.3a. "zijn de procedures om criteriumvaliditeitsgegevens te berekenen correct?“

7.3b. "zijn de steekproeven in overeenstemming met het beoogde gebruik?“

7.3c. ”wat is de kwaliteit van de criteriummaten?”

7.3d. "is de kwaliteit van het onderzoek zodanig dat de beoordeling van de

begripsvaliditeit kan worden bevestigd?”

werkwijze COTAN

elk van de zeven criteria wordt beoordeeld als 'onvoldoende', 'voldoende' of 'goed'

kwotering is soms argument voor al/niet gebruiken van een test, maar...

relativerende kanttekeningen

- 'goed' alleen voor gebruik bij geteste populatie

- sommige criteria belangrijker dan andere

- gebruik van testen die (nog) niet voldoende scoren moet beargumenteerd worden

COTAN-beoordeling WISC-III KAIT

1. uitgangspunten testconstructie goed goed

2. kwaliteit van het testmateriaal goed goed

3. kwaliteit van de handleiding goed goed

4. normen voldoende voldoende

5. betrouwbaarheid voldoende goed

6. begripsvaliditeit voldoende goed

7. criteriumvaliditeit onvoldoende1 onvoldoende1

1te weinig onderzoek

voorbeeldvragen

• Welke van onderstaande termen kan niet gebruikt worden om P25 aan te duiden?

- percentiel

- kwartiel

- bewerkte score

- deciel

intelligentietesten voor de diagnostische praktijk welke testen er op dit moment in de praktijk gebruikt worden om intelligentie te meten

ontwikkelingstests om ontwikkelingsniveau van jonge kinderen te bepalen

afname vereist training en inzicht in de vroegkinderlijke ontwikkeling

(ontwikkelingspsychologische kennis)

bv. Bayley-III-NL

Bayley Scales of Infant and Toddler Development –III-NLdoor het gebruik van spelmateriaal of door het gedrag van testleider/ouder worden bij het kind

op een gestructureerde manier gedragingen uitgelokt

gericht op het vaststellen van de algemene mentale en motorische ontwikkeling met het oog

op het opsporen van kinderen met risico op ontwikkelingsachterstand

geschikt voor leeftijdsbereik van 16 dagen t.e.m. 42 maanden en 15 dagen

afnameduur: anderhalf uur

interactieve situatie waarop ingespeeld wordt op het gedrag van het kind: er is geen vaste

vollegorde in het aanbieden van de prikkels, maar de onderzoeker die de test af neemt wordt

geacht in te spelen op de situatie en het gedrag van het kind. Zoekt op dat moment wat hij kan

voorleggen. Er moet ook aandacht zijn voor spontaan gedrag.

uitgangspunten:

bij baby’s zijn verschillende ontwikkelingsgebieden sterk verweven met elkaar

tijdens de eerste levensjaren leren kinderen vaardigheden steeds meer onafhankelijk van

elkaar uitvoeren, waardoor gedifferentieerde vaardigheidsgebieden ontstaan

de belangrijkste ontwikkelingsdomeinen tussen geboorte en drie jaar zijn:

cognitieve ontwikkeling

taalontwikkeling

motorische ontwikkeling

sociale en emotionele ontwikkeling

adaptieve ontwikkeling

Structuur:

Cognitie

- exploreren en manipuleren van voorwerpen

- aandacht voor nieuwe stimuli

- constructiespel

- symbolisch spel

- matchen van materiaal of plaatjes

- tellen

- …

Taal

Taalbegrip

- herkennen van bekende geluiden

- identificeren van voorwerpen en

personen

- woordbegrip

- meervoud

- instructies begrijpen

- ….

Taalproductie

- brabbelen

- gebaren

- deelname aan communicatie

- woorden zinsgebruik

- ….

Motoriek

Fijne motoriek

oog-hand coördinatie

materiaal

manipuleren

fijne handmotoriek

Grove motoriek

hoofdbalans

voortbewegen

voorafgaand aan

lopen

staan

lopen en rennen

balanceren

Sociaal-emotionele ontwikkeling

emotionele en sociale uitingen begrijpen

emotieregulatie

interesse in personen en omgeving

aangaan en onderhouden van relaties

(vragenlijst voor ouders)

Adaptief gedrag

conceptuele vaardigheden, o.a. voorschoolse competenties

sociale vaardigheden, o.a sociaal contact

praktische vaardigheden, o.a. huishoudelijke activiteiten

(vragenlijst voor ouders)

Ook aangepaste versie beschikbaar voor kinderen met lichamelijke of communicatieve

beperkingen

= Bayley- 3- nl special needs addition

klassiekers uit de wechslertraditie Wechsler omschrijft intelligentie als “het vermogen van een individu om doelgericht te

handelen, rationeel te denken en effectief met de omgeving te kunnen omgaan.”

intelligentie is zowel globaal als complex

– globaal: conglomeraat van vaardigheden, algemene intelligentie

– complex: diverse vaardigheden, die inhoudelijk van elkaar te onderscheiden zijn

maar niet onafhankelijk zijn

WPPSI, WISC, WAIS

wechsler preschool en rimary scole of intelligence (WPPSI)

geschikt voor leeftijdsbereik van 2.5 tot 8 jaar

gedeeltelijk verschillende batterij voor jongere kinderen (<4 jaar) en oudere kinderen (>= 4 jaar)

14 subtests, verdeeld over twee vormen voor twee leeftijdscategorieën:

Jongere kinderen (2.5 tot 4 jaar)

Oudere kinderen (4 tot 8 jaar)

drie types subtests:

kernsubtests (nodig voor verbaal IQ, performaal IQ, totaal IQ)

aanvullende subtests (voor aanvullende info en onder bepaalde voorwaarden ter

vervanging van kernsubtests en/of om aparte indexscores te berekenen)

optionele subtests (om aparte indexscores te berekenen, maar nooit ter

vervanging van kernsubtests)

Jonge kinderen:

5 subtests, resulterend in 3 IQ-scores en een Algemene Taalindex

afnameduur 35-42 minuten (kernsubtests 30-35 minuten)

Oudere kinderen:

14 subtests, resulterend in 3 IQ-scores, een Verwerkingssnelheidsquotiënt en een

Algemene Taalindex

afnameduur 70-90 minuten (kernsubtests 40-50 minuten)

sommige subtests zijn vereenvoudigde versies van subtests uit de andere Wechslertests (WISC

en/of WAIS)

andere subtests zijn specifiek voor deze jongere leeftijdsgroep

binnen de wechsler traditie zijn de verschillende subtest parallel vormen van elkaar

Stimulus materiaal wppsi:

receptieve woordenschat

- 4 afbeeldingen van wolken

- Waar regent het?

Informatie

- 4 afbeeldingen

- Wat kan je opeten

Maatrix redeneren

- Wat hoort er op de plaats van het vraagteken

Plaatjes concepten

- 4 afbeeldingen in 2 groepen

- 2 afbeeldingen kiezen die samen horen (bv, 2 dieren)

Onvolledige tekeningen

wechsler intelligence scale (wisc)

geschikt voor leeftijdsbereik van 6 tot 17 jaar

13 subtests, resulterend in drie IQ-scores:

– Totaal IQ

– Verbaal IQ (IN, OV, RE, WO, BG, CRaanv)

– Performaal IQ (OT, SU, PO, BP, FL, Svopt, DHaanv)

en drie factorscores:

– Verbaal Begrip (IN, OV, WO, BG)

– Perceptuele Organisatie (OT, PO, BP, FL)

– Verwerkingssnelheid (SU, SV)

afnameduur: 50 tot 85 minuten

in 2014 is in de VS de WISC-V verschenen

momenteel wordt gewerkt aan vertaling, bewerking en normering voor het Nederlandse

taalgebied (verwacht in 2018)

totaal IQ en vier factorscores (Verbaal Begrip, Perceptueel Redeneren, Werkgeheugen,

Verwerkingssnelheid)

verbaal IQ en perforaal IQ geschrapt

wechsler adult intelligence scale (wais) geschikt voor leeftijdsbereik van 16 tot 85 jaar

15 subtests

10 corresponderend met subtests van WISC-III-NL

(IN, OV, RE, WO, BE, CR, OT, BP, SS-C, SZ)

noot: SS-C (Symbool Substitutie-Coderen) correspondeert met SU

2 niet-corresponderend met WISC-III-NL maar overgenomen uit WAIS-III-NL

- Cijfers en Letters Nazeggen (CLN)

Reeksen die zowel cijfers als letters bevatten

- Matrix Redeneren (MR)

3 volledig nieuwe subtests

- Figuur Samenstellen (FS)

Een figuur is opgedeeld in verschillende delen

De delen zoeken uit een aangeboden groep afbeeldingen

- Gewichten (GW)

Weegschaal in balans brengen

- Figuur Zoeken (FZ)

Al dezelfde figuren zoeken en doorstrepen

15 subtests, resulterend in

één IQ-score en

vier indexscores:

- Verbaal Begrip = VBI (IN, OV, WO, BGaanv)

- Perceptueel Redeneren = PRI (BP, MR, FS, GWaanv, OTaanv)

- Werkgeheugen = WgI (CR, RE, CLNaanv)

- Verwerkingssnelheid = VsI (SZ, SSC, FZaanv)

afnameduur 90 tot 120 minuten

Merk op dat in deze ‘vierde generatie’ VIQ en PIQ weggevallen zijn. In plaats daarvan moeten

nu de indexscores VBI en PRI gebruikt worden.

Overlap in leeftijdsbereik tussen WPPSI-III-NL en WISC-III-NL en tussen WISC-III-NL en WAIS-IV-

NL

Wat met proefpersonen die in dat overlappend leeftijdsbereik vallen? Keuze mee laten bepalen

door

- verwachte intelligentieniveau (bv. Lager leeftijdsbereik nemen als we verwachten dat de

persoon laag gaat scoren)

- bekendheid met een van de tests

- verwachte aandacht spannen (bij een hogere test gaat het kind ook meer items moeten

afleggen)

Bij bepaalde segmenten kan men kiezen welke intelligentie test men gebruikt

- Afhankelijk van het verwachte niveau

- Bij hertesting

- Aandachtspannen van het kind

niet verbale intelligenties wechsler non verbal scole of ability (wnv) explicatie niet verbale, wanneer taal voor een barrière zorgt

- gebaseerd op gedachtengoed van Wechsler, maar ontwikkeld door Naglieri

- aanwijzingen hoofdzakelijk visueel

- specifiek geschikt voor doven, slechthorenden, kinderen met spraak-en taalproblemen,

kinderen met een allochtone achtergrond en kinderen met autismespectrumstoornis

- geschikt voor leeftijdsbereik van 4 tot 22 jaar

Expliciet niet verbaal

Voor groepen waarbij er problemen zijn met de taalbeheersing/ taalontwikkeling

zes subtests in totaal, maar slechts vier per leeftijdscategorie

4 tot 8 jaar: jongste leeftijdscategorie

8 tot 22 jaar: oudste leeftijdscategorie

- voor elke leeftijdscategorie korte (2 subtests) en lange (4 subtests) versie

- resulteert in totaal IQ

- afnameduur: 20 tot 45 minuten

- subtests voor de jongste leeftijdscategorie

Matrix Redeneren (MR)

Substitutie (SU)

Figuur Leggen (FL)

Herkennen (HE)

- subtests voor de oudste leeftijdscategorie

Matrix Redeneren (MR)

Substitutie (SU)

Plaatjes Ordenen (PO)

Ruimtelijke Oriëntatie (RO)

Proefleider tikt een aantal blokken aan in een bepaalde volgorde. Geteste persoon moet deze

handeling herhalen. Varianten voorwaarts en achterwaarts.

pantomimische instructie WNV

Gebaren, wijzen, …

snijders-Oomen Niet-verbale intelligentietest (son-r 2.5-7) meet een breed gamma van intelligentieaspecten zonder van taal afhankelijk te zijn

doelgroep: gehoorgestoorde en dove kinderen, allochtone kinderen die de taal van de

testleider niet of beperkt beheersen, moeilijk testbare kinderen

geschikt voor leeftijdsbereik van 2.5 tot 7 jaar

handleiding bevat zowel verbale als niet-verbale instructie

- V: “Jij mag deze net zo maken”

- NV: Wijs naar het kind, dan naar het plaatje in het boek, vervolgens naar de kader

en maak een vragend gebaar.


twee schalen

- Performale schaal (SON-PS)

Mozaïeken, Puzzels, Patronen

- Redeneerschaal (SON-RS)

Categorieën, Analogieën, Situaties

snijders-oomen niet verbale intelligentieteste (son-r 6-40)uitgangspunten en doelgroep vergelijkbaar met SON-R 2.5-7

geschikt voor leeftijdsbereik van 6 tot 40 jaar

vier subtests, resulterend in één IQ-score:

- Analogieën

- Mozaïeken

- Categorieën

- Patronen

afnameduur: 40 tot 70 min

theoretishe en factoriële inteligentietests Tests uit de Stanford-Binet en Wechsler tradities zijn weinig theoretisch en doorgaans niet sterk

gebaseerd op factoranalyse. De theorie en de factoranalyse zijn opgebouwd na het maken van

de test

Er bestaan intelligentietests waarbij dat wel veel explicieter het geval is (KAIT en RAKIT)

kaufman adolescent and adult intelligence test (Kait)gebaseerd op een integratie van drie modellen over intelligentie

- Horn en Cattell: Fluid/Chrystallized Intelligence

- Luria: vermogen tot planning

- Piaget: stadium van logische operaties


doelgroep: adolescenten en volwassenen van 14

tot 85+ jaar

bestaat uit 10 subtests, resulterend in 3 IQ-scores :

- Totaal IQ

- Fluid IQ

- Chrystallized IQ

Definities:

Een woord vervolledigen

Aanwijzing met een definitie van het woord

Dubbele betekenisen

Een ander woord vinden dat voor 4 andere woorden overeen komt

Idool, maan, film, hemel ster

Symbolen leren

Een betekenis toekennen aan picotgrammen

Deze vormen een zin die de cliënt moet kunnen lezen

Geheime codes

Code aanleren die daarna gebruikt wordt in andere context

revisie amsterdamse kinder intelligentei test (rakit-2)- bedoeld om het niveau van zowel de algemene intelligentie als van specifieke

intelligentiefactoren te onderzoeken

- specifiek geschikt voor leerlingen met een lichte tot matige verstandelijke beperking

(IQ-range 40 tot 145)

- geschikt voor leeftijdsbereik van 4 tot 12;6 jaar

- sluit aan bij de opvattingen van Thurstone

- 12 subtests, resulterend in 1 IQ-score :

- Totaal IQ

vier factorscores :

- Verbaal Leren (o.a. Woordbetekenis, Namen Leren)

- Perceptueel Redeneren (o.a. Figuur Herkennen)

- Ruimtelijke Oriëntatie en Tempo (o.a. Doolhoven, Schijven)

- Verbale Vlotheid (o.a. Ideeënproductie)

afnameduur: 1,5 tot 2 uur

verkorte vorm met 6 subtests (45 min tot 1 uur), bedoeld om een globale indruk van het

cognitief functioneren te krijgen

Namen leren:

Aan de hand van plaatjes concepten leren

Figuren leren

Stukken van de figuur worden weg gelaten

De figuur moet herkend worden

Doolhoven

Schijven

Schijven met gaten passen op een bord met nagels

Ideeënproductie

Wat kan je optillen

Wat kan je allemaal doen op straat

Wat kan je allemaal zien in een winkel

Meet niet het convergent denken (een juist antwoord, ons denken zoekt dit ene

antwoord)

Divergent denken: er is niet een juist antwoord, maar veel verschillende goede

antwoorden

covat-chc basisversie - pen en papiertest geschikt voor afname bij kinderen tussen 9j6m en 13j11m

- opgesteld volgens het Catell-Horn-Caroll (CHC) model

- kan zowel individueel als in groep afgenomen worden

- bevat 9 subtests die vijf brede cognitieve vaardigheden meten:

- Puntreeksen (Gf)

- Figuurreeksen (Gf)

- Schiftingen (Gc)

- Tegenstellingen (Gc)

- Geheugen A (Gsm)

- Geheugen B (Gsm)

- Gedraaide Figuren (Gv)

- Dozen Plooien (Gv)

- Geheime code (Gs)

overzicht per leeftijd bruikbaar vanaf zuigelingenleeftijd

- Bayley-III-NL 16 dagen– 42 maanden 15 dagen

bruikbaar vanaf kleuterleeftijd

- WPPSI-III-NL 2.5 – 8 jaar

- SON2.5-7 2.5 – 7 jaar

- RAKIT-2 4 – 12.5 jaar

- WNV 4 – 22 jaar

bruikbaar vanaf lagereschoolleeftijd

- WISC-III-NL 6 – 17 jaar

- SON-R 6-40 6 – 40 jaar

- CoVaT CHC-basisversie 9;6 – 13;11 jaar

bruikbaar vanaf adolescentie

- KAIT 14 - 85 jaar

- WAIS-IV-NL 16- 85 jaar

persoonlijkheidsvragenlijsen voor de diagnostische praktijk constructiemethode

persoonlijkheidsvragenlijsten bestaan uit een set van items, die doorgaans verder

onderverdeeld worden in subschalen

afhankelijk van de constructiemethode worden items op verschillende manieren aan

subschalen toegekend

bekendste methoden:

- Empirisch

- Factoranalytisch

- theoretisch

empirisch/criteriumgericht

- betekenis van items/structuur van het instrument wordt bepaald op basis van de

samenhang met een specifiek criterium

- bijv. item komt in de schaal ‘depressie’ als het discrimineert tussen depressieven

en niet-depressieven

factoranalytisch/inductief

- betekenis van items/structuur van het instrument gebaseerd op factoranalytische

bevindingen

- items komen in de schaal corresponderend met de factor waarop ze hun hoogste

lading hebben

- clusters van items die samen gezet worden in een subschaal

theoretisch/apriori/deductief

– betekenis van items/structuur van het instrument a priori gedefinieerd op basis

van psychologische theorie

– bijv. als depressie geconceptualiseerd wordt als een multidimensioneel construct

bestaande uit drie deelcomponenten (affectief, cognitief, fysiologisch), dan wordt

een vragenlijst geconstrueerd bestaande uit drie schalen corresponderend met

de deelcomponenten

In de praktijk vaak combinatie van methoden (bijv. eerst a priori formulering, maar nadien toch

factoranalyse)

empirische vragenlijsten MMPI-2 MMPI-A MMPI-2 RF

minnesota multiphasic personality inverntory 2 (mmpi-2) MMPI is een van de oudste persoonlijkheidsvragenlijsten (eerste versie handleiding in

1943)

eerste versie ontwikkeld door McKinley en Hathaway om persoonlijkheidsaspecten van

patienten in kaart te brengen

sterk klinische inslag

huidige versie (MMPI-2):

- 567 items

- geschikt voor afname vanaf 18 jaar

- antwoordschaal ‘akkoord’ / ‘niet akkoord’

- afnameduur 60 tot 90 minuten

- ruwe scores omgezet in t-scores

Constructie van 10 ‘klinische schalen’:

- lijst van 1000 mogelijke items uit bestaande vragenlijsten, beoordelingsschalen,

psychiatrische interviews, handboeken psychiatrie, eigen klinische ervaring,...

- na eliminatie van redundante en weinig relevante items restten er 504 items, die

voorgelegd werden aan normalen en diverse klinische groepen

- schaalconstructie volgens de empirische methode, met als gevolg:

• sommige items weinig face valid

• schalen heterogeen van inhoud (want zijn allemaal op hetzelfde criterium

gebaseerd)

• items kunnen tot meerdere schalen behoren (items behoren niet

noodzakelijk tot 1 subschaal, maar kunnen meerdere meten)

Validiteitsschalen- ontwikkeld als controlemiddel omdat mensen door de grote hoeveelheid vragen

vaak niet meer helemaal correct antwoorden

- om na te gaan in welke mate de testresultaten beïnvloed zijn door

antwoordtendenzen (bijv. faking good/bad)

- diverse types:

• Vraagtekenschaal

• L-schaal

• F-schaal

• K-schaal

• Fb-schaal

• VRIN-schaal

• TRIN-schaal

Vraagtekenschaal (alle items)

• som van alle opengelaten of dubbel beantwoorde items

• cut-off=15 hoger dan 15 = vermelden in verslag

L-Schaal of Leugenschaal

• meet algemene tendens tot liegen

• items die doorgaans positief beantwoord worden

• “Niet akkoord” antwoorden = liegen

- Item 29: Zo nu en dan heb ik zin om te vloeken

- Item 77: Af en toe stel ik uit tot morgen wat ik vandaag had moeten doen

K-schaal

• meet neiging om defensief te antwoorden (men wil dit niet van zichzelf toegeven)

• 30 items, waarvan meeste doorgaans positief beantwoord worden (niet

akkoord=defensief)

- Item 37 (niet akkoord): soms heb ik zin om iets kapot te slaan

- Item 127 (niet akkoord): kritiek of uitbranders kwetsen mij

F-Schaal

- Meet deviante en atypische manieren van antwoorden (afwijkende antwoorden)

Kan erge afwijking aantonen, of een niet valide antwoord patroon

- 60 items die zelden (<10%) positief beantwoord worden

• Item 24 (akkoord): Af en toe ben ik bezeten door boze geesten

• Item 126 (niet akkoord): Ik vind dat de wet gehandhaafd moet worden

Fb-Schaal

• Meet deviante en atypische manieren van antwoorden

• zitten op het einde van de test, om effecten van vermoeidheid na te gaan

VRIN schaal (Variable Response Inconsistency)

• 67 itemparen - meet tendens om op een inconsistente manier te antwoorden, waarbij de

configuraties ‘ja/nee’ en ‘nee/ja’ teken zijn van inconsistentie

- Item 28A en Item 59NA

• Item 28 (Akkoord): Mijn maag is meerdere keren per week van streek

• Item 59 (Niet akkoord): Om de paar dagen of vaker heb ik last van een

onaangenaam gevoel in mijn maag

TRIN schaal (True Response Inconsistency)

• 23 itemparen - meet tendens om op een inconsistente manier te antwoorden, waarbij de

configuraties ja/ja en nee/nee teken zijn van inconsistentie

• Item 3A – Item 39A

- Item 3 (A): ‘s Morgens word ik meestal fris en uitgerust wakker

- Item 39 (A): Mijn slaap is onregelmatig en gestoord.

• Item 262NA– Item 275NA

- Item 262 (NA): Ik zou het niet vervelend vinden als ze mij in een groep mensen

zouden vragen een gesprek te beginnen

- Item 275 (NA): Op school vond ik het erg moeilijk om voor de klas te spreken

• Ja of nee zeg tendens: mensen zijn geneigd om op testen sneller ja of nee te antwoorden

Inhoudsschalen

• klassieke klinische schalen zijn door de empirische constructiewijze erg heterogeen van

inhoud, waardoor twee personen een zelfde score kunnen behalen vanuit een zeer

uiteenlopend antwoordpatroon

klinische schalen verder ingedeeld in subschalen door te kijken naar inhoudelijke

kenmerken inhoudsschalen

• Harris en Lingoes ontwikkelden subschalen voor zes van de tien klinische schalen met

items die een gelijkaardige inhoud hebben

- bijv voor Depressie: Subjectieve depressie (D1), Psychomotorische retardatie

(D2), Lichamelijk slecht functioneren (D3), Mentale vervlakking (D4) en Piekeren

(D5)

• Wiggins construeerde over de klinische schalen heen inhoudsschalen vertrekkend van

de hele pool van MMPI-items

- bijv ANX (angst), FAM (gezins- en sociale problemen), OBS (obsessiviteit), CYN

(cynisme), LSE (lage zelfwaardering)

- kunnen geclusterd worden in vier inhoudsgebieden: Inwendige symptomen (bijv

ANX), naar buiten gerichte agressie (bijv. CYN), negatief zelfbeeld (LSE), algemene

probleemgebieden (bijv. FAM)

• Ook vele anderen construeerden doorheen de tijd nieuwe subschalen; voor veel van

deze schalen is er tot op heden te evenwel weinig empirische onderbouw

MMPI AMMPI-2 ook interessant voor adolescenten

- puberteit is een periode van verhoogde kwetsbaarheid: belangrijk om een goed

diagnostisch instrument te hebben

maar afname ervan bij deze doelgroep valt tegen

- te lang en te moeilijk

- normen volwassenen niet bruikbaar: ‘normale’ adolescenten scoren op sommige

schalen hoger dan volwassenen vanwege de ‘sturm und drang’-fase

- sommige specifiek voor adolescentie relevante topics (bijv. schoolproblemen)

komen niet aan bod

constructie van een specifieke variant voor adolescenten (MMPI-A)

- bestaat uit 478 items

- geschikt voor leeftijdsbereik van 13 tot 18 jaar

- afnameduur 90 minuten

- bevat heel wat items en schalen die identiek zijn aan MMPI-2 items, maar

daarnaast ook specifiek op adolescentie betrekking hebbende items en

(inhouds)schalen

MMPI-2 RF (restructured form)• korte versie van de MMPI-2

• bestaat uit 338 items

• herziening klinische schalen (‘restructured clinical scales’):

- itemoverlap verwijderen (per paar van klinische schalen gemiddeld 6 items

overlap)

- items die naar ‘demoralisatie’ (=algemene distress) verwijzen in een aparte schaal

zetten

- daardoor sterk verminderde subschaal intercorrelaties in vergelijking met MMPI-

2

9 subschalen

• RCd Demoralisatie

- algemeen emotioneel ongenoegen, onzeker, pessimistisch, laag gevoel van

eigenwaarde, gevoel te hebben gefaald.

- Staat los van de andere

• RC1 Somatische klachten

- somatische klachten, excessieve preoccupatie met lichamelijke zorgen en

gezondheidsproblemen, moeheid, zwakte en chronische pijn.

- Vroeger hypochondrie

• RC2 Lage positieve emoties

- anhedonie, depressief, pessimistisch, neiging zich terug te trekken, verveling,

isolatie, gebrek aan energie, moeite met het nemen van beslissingen.

- Vroeger depressie

• RC3 Cynisme

- aangeven dat anderen niet vertrouwen zijn, oneerlijk, alleen voor zichzelf zorgen

en anderen uitbuiten.

- Vroeger hysterie

• RC4 Antisociaal gedrag

- antisociaal en oppositioneel gedrag, agressiviteit en boosheid, liegen en

bedriegen, moeite met zich te conformeren aan maatschappelijke normen,

problemen met justitie, familieconflicten, middelenmisbruik.

- Vroeger psychopathische deviatie

• RC6 Betrekkingsideeën

- persoon als schietschijf, slachtoffer van krachten van buiten, omringd met

boosaardige mensen.

- Vroeger wanen

• RC7 Dysfunctionele negatieve emoties

- angst, geïrriteerdheid, ongelukkig, hopeloos, piekeren, overgevoelig,

schuldgevoelens, instructieve gedachten.

• RC8 Afwijkende ervaringen

- hallucinaties, bizarre perceptuele ervaringen, waanachtige ideeën, gebrekkige

realiteitstoetsing.

- Vroeger schizofrenie

• RC9 Hypomanische activatie

- grandioos zelfbeeld, algehele opwinding, sensation seeking, risicovol gedrag,

slechte impulscontrole, euforie, verminderde behoefte aan nachtrust, ‘racing

thoughts’ en agressie

MMPI-2 RF heeft in totaal 51 schalen:

- 9 herziene klinische schalen

- 3 hogereordeschalen (cluster klinische schalen)

• emotionele dysfunctie / internaliseren

• dysfunctie in het denken

• gedragsmatige dysfunctie / externaliseren

- 9 validiteitsschalen

• VRIN-r

• TRIN-r

• F-r

• Fp-r (vergelijking met psychopathologiegroep)

• Fs (zeldzame somatische symptomen)

• FBS-r (“fake bad”)

• L-r

• K-r

- 23 specifieke probleemschalen

• somatisch/cognitieve schalen

• internaliserende schalen

• externaliserende schalen

• interpersoonlijke schalen

- 2 interesseschalen

• esthetisch-literair

• mechanisch-fysisch

- 5 schalen die peilen naar persoonlijkheidspathologie

• agressiviteit

• psychoticisme

• ontremming

• negatieve emotionaliteit

• introversie/lage positieve emotionaliteit

Klinische schalen worden geclusterd in hogereordeschalen

MMPI-2 RF heeft een betere constructvaliditeit en sluit beter aan bij recente theorieën en

bevindingen mbt persoonlijkheid en psychopathologie dan MMPI-2

MMPI-A RF in voorbereiding (aangekondigd voor 2016) (voor adolescenten gaat binnenkort ook

herwerkt worden)

factoranalytische vragenlijsten NEO-PI-R, NEO-FFi en HiPiC

neo-pi-3 en neo-ffi-3

• geworteld in de lexicale traditie:

- assumptie dat voor gedrag dat binnen een cultuur belangrijk geacht wordt één of

meer termen in de taal opgenomen zijn, meestal in de vorm van

persoonsbeschrijvende adjectieven

- om de 5 belangrijkste individuele verschillen in persoonlijkheid in kaart te

brengen kan men best vertrekken van in de taal aanwezige

persoonsbeschrijvende adjectieven

• oorsprong van het instrument ligt in factoranalytisch onderzoek van McCrae en Costa

• Amerikaanse traditie: geroteerde factoren (i.t.t. Engelse traditie: orthogonale factoren)

• oorspronkelijk slechts drie factoren/domeinen:

- Neuroticisme (N)

- Extraversie (E)

- Openheid (O) – vandaar ‘NEO’

• later twee toegevoegd:

- Altruisme

- Conscientieusheid

NEO-PI-3 bestaat uit 240 items

• geschikt voor afname vanaf 16 jaar

• afnameduur 40 tot 50 minute

• ruwe scores omgezet in stanines

• algemene bevolkingsnormen, afzonderlijk voor geslacht, leeftijd, opleidingsniveau

• voor elk domein verdere differentiatie in zes facetten:

– meten deelaspecten van het bredere domein

– binnen deze 6 facetten zitten nog onderverdelingen in gedragingen

– dit zorgt er voor dat we heel gedifferentieerde persoonlijkheidsdiagnostiek

kunnen doen

– garandeert dat voor elk domein een brede range aan ervaringen, gevoelens en

gedragingen gerepresenteerd is

– biedt mogelijkheid om individuele verschillen binnen een domein te detecteren

(=verfijning van de diagnostiek)

rapport van neo: patroon + uitleg

per schaal

per faccet

NEO-FFI-3 is verkorte versie, bestaande uit 60 items


• afnameduur 10 tot 20 minuten

• geen verdere differentiatie in facetten

Enkel domein scores, geen facettten

• domeinscores kunnen uitgezet worden in ‘stijlgrafieken’

• verschillende aspecten van ‘stijl’ gedefinieerd aan de hand van paren van

persoonlijkheidsdomeinen

- emoties N+E

- afweermechanismen N+O

- omgang met boosheid N+A

- beheersing impulsiviteit N+C

- interesses E+O

- sociale interacties E+A

- manier van doen E+C

- attitudes O+A

- leren O+C

- maatschappelijke houding A+C

Combinaties van domeinen om tot een unieke situatie te komen

hipic (hierarchische persoonlijkheidsvragenlijsten voor kindern)• in Vlaanderen ontwikkelde ‘Big Five’- vragenlijst voor kinderen van 6 tot 12/13 jaar

(Ned/Vlaanderen)


• primair bedoeld voor beoordeling door derden

(ouders, gezinsleden>16j, leerkrachten)

• multi-informant methode aanbevolen

• afnameduur 30 minuten

• ruwe scores omgezet in stanines

• 5 domeinen, op factoranalytische wijze verkregen

• Emotionele Stabiliteit

• Extraversie

• Vindingrijkheid

• Welwillendheid

• Consciëntieusheid

• verder onderverdeeld in 18 facetten

Emotionele Stabiliteit

Angst “maakt zich vlug zorgen over iets”

Zelfvertrouwen “neemt gemakkelijk beslissingen”(R)

Extraversie

Energie “heeft energie te koop”

Expressiviteit “houdt gevoelens en gedachten voor zichzelf” (R)

Optimisme “ziet de zonnige kant van de dingen”

Verlegenheid “zoekt contact met nieuwe klasgenoten” (R)

Vindingrijkheid

Creativiteit “heeft plezier in het creëren van iets”

Intellect “heeft vlug inzicht in iets”

Nieuwsgierigheid “leert graag iets bij”

Welwillendheid

Altruïsme “verdedigt de zwakkeren”

Dominantie “speelt de baas”

Egocentrisme “kan moeilijk met anderen iets delen”

Gehoorzaamheid “gehoorzaamt zonder protest”

Irriteerbaarheid “is vlug op de tenen getrapt”

Consciëntieusheid

Concentratie “werkt met volgehouden aandacht”

Doorzettingsvermogen “houdt vol tot het doel bereikt is”

Ordelijkheid “laat alles rondslingeren” (R)

Prestatiemotivatie “wil in alles uitblinken”

theoretische vragenlijsten temperament en karakter vragenlijst (TCI en VTCI)

• gebaseerd op de psychobiologische theorie van Cloninger

• personlijkheidstheorie die sterk klinisch georiënteerd is

• onderscheid tussen temperament en karakter

- temperament : erfelijk beïnvloed, vroeg observeerbaar, beïnvloedt leerprocessen

automatisch en onbewust

- karakter : komt pas op volwassen leeftijd tot volledige ontwikkeling, beinvloedt

persoonlijke en sociale effectiviteit en zelfwaardegevoel

• vier temperamentschalen met subschalen (lijkt gebaseerd op het 5 factoren model)

- Prikkelzoekend (lijkt op extraversie)

• ontdekkingsdrang (“ik verken graag nieuwe manieren om dingen te

doen”)

• impulsief (“ik lees graag alles wanneer me gevraagd wordt iets te

ondertekenen” (R))

• extravagant (“ik geef liever geld uit dan dat ik spaar”)

• wanordelijk (“ik ben graag goed georganiseerd en stel, wanneer ik maar

kan, regels op voor andere mensen” (R))

- Leedvermijdend

• dwangmatig-piekerend (“meestal ben ik bezorgder dan de meeste

mensen dat er in de toekomst iets mis zal gaan”)

• onzekerheidsangst (“ik voel me gewoonlijk gespannen en bezorgd als ik

iets nieuws en onbekends moet doen”)

• verlegen (“ik ben helemaal niet verlegen onder vreemden” (R))

• kwetsbaar (“ik herstel sneller dan de meeste mensen van kleine kwaaltjes

of stress” (R))

- Sociaalgericht

• sentimenteel (“ik ben vaak diep ontroerd door een mooie toespraak of

poëzie”)

• intimiteit (“ik hou mijn problemen het liefst voor mezelf (R))

• afhankelijk (“ik doe dingen gewoonlijk op mijn manier, liever dan toe te

geven aan de wensen van anderen” (R))

- Volhardend (geen subschalen)

“ik ben perfectionistischer dan de meeste mensen”

• drie karakterschalen, met subschalen (compmlexere combinaties van facetten van

persoonlijkheid)

- Zelfsturend

• verantwoordelijk (“mijn daden worden hoofdzakelijk bepaald door

invloeden waar ik geen controle over heb” (R))

• doelbewust (“mijn gedrag wordt sterk geleid door bepaalde doelen die ik

mezelf in het leven heb gesteld”)

• vindingrijk (“ik beschouw een moeilijke situatie meestal als een uitdaging

of een nieuwe kans”)

• positief zelfbeeld (“ik zou vaak willen dat ik slimmer was dan wie ook” (R))

• goede gewoontes (“mijn wilskracht is te zwak om erg grote verleidingen

te weerstaan, zelfs als ik weet dat ik onder de gevolgen zal lijden” (R))

- Coöperatief

• tolerant (“gewoonlijk respecteer ik de meningen van anderen”)

• empathisch (“ik schijn de meeste mensen niet zo goed te begrijpen” (R))

• behulpzaam (“ik help graag een oplossing voor problemen te vinden waar

iedereen beter van wordt”)

• vergevingsgezind (“ik vind het prettig anderen te helpen, zelfs als ze me

slecht behandeld hebben”)

• gewetensvol (“je hoeft niet oneerlijk te zijn om in bepaalde zaken te

slagen”)

- Zelftranscendent

• zelfverliezend (“ik heb wel eens het gevoel gehad dat ik onderdeel was

van iets zonder limieten of grenzen in tijd en ruimte”)

• natuurgericht (“ik heb vaak een sterk gevoel van eenheid met alle dingen

om me heen”)

• magisch denken (“ik geloof dat wonderen gebeuren”)

TCI


• geschikt voor afname bij jongeren en volwassenen vanaf 15 jaar (in de praktijk nog erg

moeilijk voor jongeren)


VTCI

• is verkorte versie, bestaande uit 105 items

• bevat alleen de hoofdschalen


• afnameduur 15 tot 20 minute

• ruwe scores in beide versies omgezet in zevenpuntsnormscores

combinatie van methodes NPV-2-(r) en NPV-J-2

nederlandse persoonlijkheidsvragenlijst-2 (npv-2)• oorspronkelijk Nederlandstalig instrument, ontworpen om aspecten van

persoonlijkheid te meten die relevant zijn in verschillende praktijkgebieden

(gezondheidszorg, onderwijs, beroepskeuze, selectie...)

• tot stand gekomen via combinatie van constructiemethodes (empirisch,

factoranalytisch, apriori)

• geschikt voor afname bij jongeren en volwassenen vanaf 15 jaar

• 140 items, verdeeld over zeven subschalen:

- Inadequatie/Neuroticisme (IN)

- Sociale Inadequatie (SI)

- Rigiditeit (RG)

- Verongelijktheid (VE)

- Zelfgenoegzaamheid (ZE)

- Dominantie (DO)

- Zelfwaardering (ZW)

• Voorbeelditems

- IN “ik ben vaak zenuwachtig”

- SI “ik vind het vervelend met onbekenden te praten”

- RG “een regelmatig levenspatroon bevalt me het best”

- VE “er zijn maar weinig mensen die mij begrijpen”

- ZE “mensen vinden mij vaak egoïstisch”

- DO “in een gesprek ben ik meestal degene die aan het woord is”

- ZW “ik vind dat ik veel goede eigenschappen bezit”

• normgroepen uit diverse contexten (selectie, psychiatrische patiënten, somatische

patiënten, eerstelijnscliënten)


• in 2013 verscheen de NPV-2, een herziene versie van de NPV, waarin een aantal items

taalkundig gewijzigd zijn en een aantal andere items vervangen door nieuwe items

• in 2014 verscheen de NPV-2-r, met mogelijkheid een aantal subschaalscores te

berekenen:

• Depressiviteit en Angst bij Inadequatie/Neuroticisme

• Verlegenheid en Sociale Vermijding bij Sociale Inadequatie

• Ordelijkheid en Inflexibiliteit bij Rigiditeit

• Leidinggeven en Autonomie bij Dominantie

junior nederlandse persoonlijkheidsvragenlijst-2 npv-j-2• geschikt voor leeftijdsbereik van 9 tot 16 jaar

• aanpassing voor kinderen van de NPV

• zelfrapportering

• 100 items, verdeeld over vijf subschalen:

- Inadequatie/Neuroticisme (IN)

- Volharding (VO)

- Sociale Inadequatie (SI)

- Recalcitrantie (RE)

- Dominantie (DO)


• voorbeelditems

IN: “ik ben vaak bang in het donker”

VO: “voordat ik iets leuks ga doen, wil ik eerst mijn werk af hebben”

SI: “als mensen naar mij kijken word ik verlegen”

RE: “ik geloof dat veel mensen je proberen te bedriegen”

DO: “ik hou ervan tegen anderen te zeggen wat ze moeten doen”

gericht op een specifieke context NKPV en BIP

nederlandse klinische persoonlijkheidsvrgenlijst (nkpv)• ontwikkeld om klinisch relevante persoonlijkheidskenmerken in kaart te brengen bij

volwassenen in de geestelijke gezondheidszorg

• omdat gewone persoonlijkheidsvragenlijsten vaak niet goed differentiëren in het uiterste

van het persoonlijkheidsspectrum, de pathologie

• hoe situeert iemand zich ten aanzien van de gewone bevolking en van de klinische

doelgroep

• bruikbaar vanaf 17 jaar


• 120 items, verdeeld over zes subschalen:

- Negativisme

- Somatisering

- Verlegenheid

- Ernstige Psychopathologie

- Extraversie

- Narcisme

• afnameduur 20 à 30 minuten

• genormeerd op zowel algemene bevolking als psychiatrische patiënten

• Het kan interessant zijn om bij een persoon met de twee normgroepen te werken

bip • ontwikkeld om persoonlijkheidskenmerken in kaart te brengen die relevant zijn voor het

functioneren in een werkomgeving, specifiek bedoeld voor de werkcontext

• bruikbaar vanaf 20 jaar


• 196 items, verdeeld over veertien subschalen in vier domeinen


overzicht per leeftijd bruikbaar vanaf kleuterleeftijd

– HiPIC 6-12/13 jaar

bruikbaar vanaf lagereschoolleeftijd of vroege adolescentie

– NPV-J2 9 – 16 jaar

– VTCI 12 jaar – hoogbejaard

– MMPI-A 13-18 jaar

bruikbaar vanaf adolescentie of volwassenheid

– TCI vanaf 15 jaar

– NPV-2 (r) vanaf 15 jaar

– NKPV vanaf 17 jaar

– MMPI-2 (RF) vanaf 18 jaar

– NEO-PI-R en NEO-FFI vanaf 18 jaar

– BIP vanaf 20 jaar

het diagnostisch proces het ongewapend oordeel een diagnostische vraag is geen eenvoudig gegeven

• diagnostiek = complex proces van verzamelen, interpreteren en afwegen van informatie met

het oog op het nemen van de beslissing of er iets, en zo ja wat, gedaan kan worden t.a.v.

vraag/klacht

• meestal geen pasklaar antwoord, diagnosticus moet oordelen en beslissen in onzekerheid

• dit vergt een heel beslissingsproces, in het nemen van deze beslissingen speelt de persoon

van de diagnosticus een belangrijke beïnvloedende rol. Het denken van mensen is

onderheven aan bepaalde denkfouten, aan vertekeningen. Hier moeten we ons als

diagnosticus tegen wapenen

• we kunnen ons tegen deze denkfouten wapenen door systematisch te werk te gaan

• als de diagnosticus niet op een systematische manier te werk gaat (="ongewapend

oordeel"), is er een groot risico op fouten en vertekeningen

• diagnostiekopleiding in het verleden voornamelijk gericht op kennis/vaardigheden in het

afnemen, scoren en interpreteren van tests. Nu wordt er ook meer aandacht gegeven aan

het proces en het denken, de systematische procedures

definitie van vroeger: cf. psychodiagnostiek = "het onderscheiden van personen naar hun

individuele psychische kenmerken, zoals die zich manifesteren in hun typische gedrags- en

uitingsvormen, en wel met behulp van tests" (De Zeeuw, 1983, p. 3)

Systematische procedures van besluitvorming zijn meer naar voren gekomen

• nu meer aandacht voor het aanleren van systematische procedures van diagnostische

besluitvorming en minder klemtoon op afnemen van tests

definitie van nu: cf. psychodiagnostiek = "het onderscheidend vaststellen van kenmerkende

psychische eigenschappen om te komen tot een goed omschreven beeld van een persoon of

groep personen" (De Zeeuw, Dekker, & Resing, 2004, p. 14)

kennis over hoe oordelen en beslissingen tot stand komen (cf. besliskunde) kan benut

worden om de diagnostische praktijk te optimaliseren

denkfouten • pioniers in het veld: Kahneman, Tversky, Ross & Nisbett

- Judgment under uncertainty: Heuristics and biases (1982)

- Human inference: Strategies and shortcomings of social judgment (1980)

• inspireerden hele generatie onderzoekers die tot onthutsende bevindingen kwamen over

hoe weinig kritisch en rationeel de modale mens denkt

• welke cognitieve mechanismen zijn onderliggend aan dit onkritisch oordelen en

irrationeel beslissen?

• De invloed van de soort informatie die men krijgt, hoe ons oordelen beïnvloed wordt

twee soorten:

• biases

• heuristieken

biases = stereotype neigingen, onbewuste tendensen of verborgen vooroordelen

- vertekenen de conclusies van ons redeneren en beslissen

- zijn er vaak op gericht ons zelfbeeld te beschermen of ons psychisch evenwicht te

herstellen na inbreuken op ons zelfbeeld

- cognitieve technieken waarmee we ons comfortabel voelen

Cognitieve technieken die er voor zorgen dat we ons niet oncomfortabel zouden voelen in

bepaalde omstandigheden

fundamentele attributiefout= neiging om andermans afkeurenswaardig gedrag toe te schrijven aan persoonlijke

kenmerken, maar het eigen afkeurenswaardig gedrag te wijten aan situationele

invloeden (+ omgekeerd voor lovenswaardig gedrag)

in het algemeen de invloed van situatie te weinig in rekening brengen

confirmatiebias= de neiging om informatie te zoeken, interpreteren of creëren die de eigen overtuiging

bevestigt en om ontkrachtende gegevens te negeren of minimaliseren

is er belangrijk in het diagnostisch onderzoek

Risico op vasthouden aan vooroordelen die getrokken worden uit een eerste ontmoeting

vals-consensuseffect= neiging om te denken dat anderen denken zoals wijzelf

kan een vertekend beeld geven van de sociale werkelijkheid omdat we ons vooral zullen

verbinden met mensen die eenzelfde mening of visie hebben als wij

we denken dat de mening die wij hebben door het mederdeel van de maatschappij gevolgd

wordt

dit kan deels voortvloeien uit het feit dat we voornamelijk optrekken met mensen die dezelfde

meningen hebben als wij, dit geeft een vertekend beeld van de sociale werkelijkheid

illusie van controle= perceptie dat toevalsgebeurtenissen controleerbaarder zijn dan ze werkelijk zijn

• ligt aan de basis van de ‘drogreden van de gokker’

bv. De kans dat een combinatie die reeks getrokken is opnieuw getrokken wordt kleiner

inschatten dan een andere specifieke combinatie, terwijl in werkelijkheid deze kans even

groot blijft, omdat er met teruglegging gewerkt wordt

heuristieken = cognitieve shortcuts, vuistregels voor het verwerken van informatie

– laten toe snel en eenvoudig te beslissen, maar leiden vaak ook tot foutief beslissen

– levensreddend in situaties waar beslissen beter is dan dralen

– levensgevaarlijk in contexten waar nauwgezet redeneren en weloverwogen deliberatie

noodzakelijk zijn

– in het dagelijks leven moeten we veel beslissingen maken, we zijn er op getraind om deze

snel te kunnen maken

– binnen de diagnostiek is het belangrijk om over onze keuzes en hun gevolgen na te

denken en een goede overweging te maken

representativiteit= als aan mensen gevraagd wordt de kans te schatten dat iets tot een bepaalde categorie

behoort, hebben ze de neiging hun oordeel steunen op de mate waarin het representatief

is voor die categorie

o rederenen aan de hand van typische voorbeelden is op zich niet verkeerd, zolang we

rekening houden met andere vormen van relevante informatie

o diverse soorten foutieve oordelen binnen deze heuristiek zijn het gevolg van het

onvoldoende in rekening brengen van relevante informatie (statistische verdeling van de

eigenschap in de populatie; steekproefomvang;...)

o heuristiek is wijdverspreid en hardnekkig: studenten die hogere opleiding in de statistiek

en kansrekening volgden, doen het nauwelijk beter dan anderen (85% vs. 90% maakt

oordeelsfout)

geen rekening houden met a priori waarschijnlijkheid van de verschillende categorieën

bijv. "Mijn vriend is professor. Hij schrijft graag gedichten, is nogal verlegen en klein van gestalte.

Op welk terrein is hij werkzaam: Chinese literatuur of psychologie?" De meeste mensen dat het

om een hoogleraar Chinese literatuur gaat.

ten onrechte denken dat een combinatie van eigenschappen waarschijnlijker is dan een van

de afzonderlijke eigenschappen (conjunctiefout)

bijv. "Linda is 31 jaar oud, alleenstaand, openhartig en bijzonder slim. Ze is afgestudeerd in de

filosofie. Als studente was ze zeer begaan met rassendiscriminatie en sociale

onrechtvaardigheid." Rangschik onderstaande beweringen van de meest naar de minst

waarschijnlijke: (a) Linda werkt op een bank; (b) Linda is actief in de vrouwenbeweging; (c) Linda

werkt op een bank en is actief in de vrouwenbeweging. De meeste mensen vinden (c)

waarschijnlijker dan (a).

beperkte omvang van de steekproef (=wet van de kleine getallen)

bijv. "In ziekenhuis A worden gemiddeld 45 baby's per dag geboren, in ziekenhuis B gemiddeld 15

per dag. Het gemiddelde aantal jongetjes dat geboren wordt, is 50%, maar het percentage

varieert van dag tot dag: soms 50%, soms meer, soms minder. Als men nu het aantal dagen zou

tellen waarop 60% jongens geboren worden, waar komt dit vaker voor: (a) in ziekenhuis A, (b) in

ziekenhuis B of (c) in beide ziekenhuizen even vaak? De meeste mensen denken dat (c) het juiste

antwoord is.

misvattingen over regressie

= over het hoofd zien dat variabele die bij eerste meting extreem scoort bij volgende meting

hoogstwaarschijnlijk dichter bij gemiddelde zal scoren (=regressie naar het gemiddelde)

bijv. Een leerkracht geeft na een toets de vijf best scorende leerlingen een beloning en de vijf

slechtst scorende leerlingen een straf. Op de volgende toets stelt ze vast dat de prestaties van de

beloonde leerlingen verslechterd zijn, terwijl die van de bestrafte leerlingen verbeterd zijn. Ze

concludeert dat beloning tot slechtere prestaties leidt en straf tot betere.

Als je een extremen meet, is de kans dat je de volgende keer dezelfde resultaten hebt

klein

De eerste keer een extreem hoge score? De volgende keer waarschijnlijk minder hoog

De eerste keer een extreem lage score? De volgende keer waarschijnlijk hoger

beschikbaarheid= als aan mensen gevraagd wordt de waarschijnlijkheid van iets in te schatten, laten ze zich

leiden door het gemak waarmee ze er voorbeelden van kunnen bedenken

bijv. "Welk type woorden zijn het meest frequent in het Engels? (a) woorden die beginnen met

een 'r' of (b) woorden die 'r' als derde letter hebben?" De meeste mensen vinden (a)

waarschijnlijker dan (b).

als diagnosticus zijn we geneigd om sneller diagnoses in de richting te stellen van in wat wij

gespecialiseerd zijn

voorstelling= neiging om zich te laten beïnvloeden door de manier waarop iets gepresenteerd of gekaderd

wordt

bijv. “slaagkans 80%” versus “faalkans 20%

verankeren= bij het inschatten van de waarschijnlijkheid van iets hebben mensen de neiging te vertrekken

van een initiële waarde (anker), vanwaar de schatting naar boven of onder aangepast

wordt op basis van bijkomende informatie

We baseren ons oordeel op eerdere informatie en passen de latere informatie hier aan aan

bijv. schat uitkomst van “2x3x4x5x6x7x8” versus “8x7x6x5x4x3x2”

in het eerste geval is schatting lager dan in het tweede geval. Dit komt omdat er bij de eerste

een lager getal gegeven wordt en bij de tweede een groter cijfer

als we lang binnen een bepaalde doelgroep gewerkt hebben, binnen een bepaald referentie

kader, zullen we een andere doelgroep hier tegen vergelijken en zo hun problematiek over

of onderschatten

Vasthouden aan een eerste oordeel op basis van de eerste info en de resterende info

interpreteren in functie van dit oordeel

oordeelsfouten kunnen vermeden worden door systematisch te werk te gaan

psychodiagnostiek als vorm van 'toegepast wetenschappelijk onderzoek'

Met de zelfde vereiste als ander wetenschappelijk onderzoek

de empirische cyclus • denkschema's inductie, deductie en toetsing kunnen opgevat worden als fasen in een

'empirische cyclus' (De Groot, 1961)

• logisch-methodologische manier van redeneren

• bij uitstek bruikbaar in de psychologie

• beschermt tegen fouten in besluitvorming

• gebruik van een prescriptief, hypothesetoetsend model, gebaseerd op methodologische

regels:

• toets vermoedens (hypothesen) aan gegevens en stel (voor)oordelen bij als daar

aanleiding toe is

• zoek doelgericht en systematisch naar gegevens die voor én tegen de

hypothesen pleiten en houd rekening met consistentie in die gegevens

• hanteer theoretisch verantwoorde redeneringen en gegevens uit recent

onderzoek

• gebruik voldoende betrouwbare, valide en genormeerde onderzoeksmiddelen

• leg verantwoording af aan collega’s en cliënten door de denken werkwijze

steeds te expliciteren

• stap 1: Observatie: eerste verzameling en groepering van gegevens ten behoeve van de

vraagstelling

• stap 2: Hypothese: formuleren van een vraagstelling op basis van ideeën opgedaan in de

observatie

• stap 3: Voorspelling: omzetten van de hypothese in een toetsbare voorspelling

(=consequentie van de hypothese)

• stap 4: Toetsing: verrichten van waarnemingen om de hypothese te toetsen (afname en

intepretatie van testmateriaal, bijkomende observaties,...)

• stap 5: Evaluatie: met elkaar in verband brengen van de verzamelde gegevens om tot

een conclusie te komen (kan aanleiding geven tot nieuwe hypothesen en start nieuwe

empirische cyclus)

hypothetische toetsende werkwijzen

Deze werkmethode voorkomt dat we onterechte conclusies trekken

• ideaalmodel

- diagnostiek in de praktijk kan hier niet steeds aan voldoen

- wenselijk vs. haalbaar

• spiegel voor reflectie en overleg met collega's/cliënten

- wat doe ik als diagnosticus en waarom?

het psychodiagnostisch procesactoren

• in het psychodiagnostisch onderzoek zijn er vier belangrijke actoren :

- psychodiagnosticus

- opdrachtgever (niet altijd de client bv. Huisarts, werkgever, ouders, verzorgers …)

- cliënt

- wetenschappelijk forum

Verantwoording moeten kunnen afleggen bij het wetenschappelijk forum

vooraf:

• bij dit stuk hoort geen extra tekst

• wat in het hoorcollege aan bod is, is wel ten dele gebaseerd op onderstaand boek, dat in

15 exemplaren (niet-uitleenbaar) beschikbaar is in PPWBIB (+77.10 KOOR 2009)

• wat in de les gezegd is, is de enige leerstof; het boek kan eventueel helpen om

onvolledige notities aan te vullen

actor 1: de psychodiagnosticus

– psychodiagnostiek als specifieke competentie van psychologen/pedagogen (resticties in

wie testmateriaal mag kopen)

– diagnosticus in verschillende rollen

- als expert: gedragswetenschapper (expertrol, zie ook actor 4)

- samenwerkingspartner in dialoog met opdrachtgever en cliënt (zie ook actoren 2

en 3) (cliënt moet gemotiveerd worden om deel te nemen)

actor 2: de opdrachtgever

– heeft een motief om iemand psychologisch te laten onderzoeken

– motief wordt aangegeven bij de aanvraag en dat daar voldoende naar geëxploreerd

wordt zodat al de motieven bekent zijn voor de diagnosticus

– daarnaast vaak nog impliciete doelstellingen

– psychodiagnosticus heeft er baat bij de opdrachtgever goed te kennen of uitgebreid

kennis met hem/haar te maken. De diagnosticus kan op basis hiervan een bepaalde

opdracht weigeren

Reden waarom er aan bepaalde zaken aandacht gegeven moet worden

actor 3: de cliënt

- kan uiteenlopende posities hebben

(vrijwillig meewerken vs. met tegenzin ondergaan)

- belang van "dialectische benadering": cliënt is geen willoos object, maar mede-

onderzoeker

- cliënt als samenwerkingspartner: de kwaliteit van het diagnose proces wordt mee

bepaald door de inbreng van de cliënt

- kwaliteit psychodiagnostisch onderzoek wordt mee bepaald door inzet cliënt: onwillige

cliënten kunnen onmogelijk goed onderzocht worden

- in sommige gevallen is cliënt opdrachtgever

- cliënt is niet noodzakelijk een individu (kan ook gezin, team, schoolklas, organisatie,...

zijn)

Belangrijk om cliënt als samenwerkingspartner te zien

Kwaliteit van onderzoek hangt af van samenwerking met cliënt

Cliënt is niet altijd een individu (bv gezin)

actor 4: het wetenschappelijk forum

– psychodiagnostiek is een vorm van wetenschappelijk handelen

– psychodiagnosticus past algemene denkschema's van inductie, deductie en toetsing toe

– ons handelen transparant en falsifieerbaar weer geven

psychodiagnostisch proces speelt zich af tussen

• de 'aanvraag' tot een psychodiagnostisch onderzoek

en

• het door de psychodiagnosticus afgeleverde psychologisch rapport

en is in overeenstemming met de stappen binnen de empirische cyclus

aanvraag/ hulpvraag

• potentiële opdrachtgever heeft geoordeeld dat psychodiagnostisch onderzoek

aangewezen is zich tot de diagnosticus gewend met een aanvraag voor een

psychodiagnostisch onderzoek

- belang van goede profilering diagnosticus (waarvan kan men bij hem/haar

terecht?)

- vaak is de aanvraag niet meer dan een vaag omlijnd idee, dat zonder verdere

toelichting tot misverstanden kan leiden

bijv. “deze man werkt hier al zes jaar, maar is zonder aanleiding gaan

disfunctioneren”

bijv. “is deze kandidaat geschikt voor de functie?”

bijv. “met deze cliënt kom ik geen stap verder, wat is er aan de hand?”

de diagnostische cyclus start op het moment dat er een vraag gesteld wordt. Deze vraag

kan komen van de opdrachtgever (aanvraag) of van de cliënt (hulpvraag).

De diagnosticus moet niet op de aanvraag ingaan, daarvoor is het belangrijk te weten wat

de reden is tot de aanvraag of hulpvraag

Verschillende soorten aanvragen, afhankelijk van uit welke hoek ze komt.

Niet elke vraag is even gemakkelijk te vertalen in een concrete onderzoeksvraag, daarom is

het belangrijk om dit vanaf het begin goed af te bakenen

• twee mogelijke situaties:

- externe opdrachtgever (bijv. huisarts, psychiater,...)

- cliënt (of zijn/haar wettelijke vertegenwoordiger) als aanvrager

• diagnosticus gaat in overleg met de aanvrager om een beeld te krijgen van de

achtergrond en het doel van de aanvraag

- waarom wil opdrachtgever een onderzoek?

- wat verwacht hij/zij ervan? op welke vragen moet er een antwoord gegeven

worden, is dit mogenlijk?

Wat kan de opdrachtgever verwachten, wat kan er nagegaan worden, op welke

vragen wordt er een antwoord gegeven

Belangrijke overwegingen voor eventuele weigeringen

• de aldus verkregen informatie helpt de diagnosticus te beslissen of hij/zij de aanvraag al

dan niet zal aannemen (oa. op basis van inschatting kennis, onderzoeksbaarheid,…)

• psychodiagnosticus kan aanvraag weigeren!

• in arbeids- en organisatiecontext kan deze eerste fase enigszins anders verlopen:

- psychodiagnostici (bijv. selectiebureaus) stappen zelf naar potentiële

opdrachtgevers om hun expertise aan te bieden

- opdrachtgevers vragen vaak offertes bij verschillende psychodiagnostici en kiezen

degene met het beste bod (zowel inhoudelijk als financieel)

- eerste fase resulteert in ‘contracting’

vraagstelling • nadat aanvraag duidelijk is aanvaard en de vraag duidelijk omschreven is

• voor aanvraag zijn er geen eisen in termen van duidelijkheid, zakelijkheid of

wetenschappelijkheid

• aanvraag moet vertaald worden in een onderzoekbare vraagstelling (haalbaar en

duidelijk)

- geeft het kader voor het psychodiagnostisch onderzoek

• gedetailleerde weergave van wat onderzocht zal worden

• geformuleerd als hypothese(n) (basis voor het onderzoek)

- onderdeel van psychologisch dossier

- kan in rapport opgenomen worden

• vooral als opdrachtgever zelf psycholoog/pedagoog is

Rapport krijgt andere vorm naar gelang de ontvanger van het rapport

Bv. voor iemand die niet uit het werkveld komt zal er meer gewerkt worden met

vertalingen van het vakjargon, zodat het onderzoek duidelijk is

- in de fase van vraagstelling gebeurt er een filtering, verheldering en/of

herformulering van de vragen uit de aanvraag

- dat resulteert in een of meerdere diagnostische vraagstellingen, die onder te

brengen in een van volgende categorieën:

• onderkenning ('wat is het geval?')

• verklaring ('hoe komt dat?')

• predictie (‘hoe zal de cliënt in de toekomst functioneren?’ wat is de kans

op herval)

• indicatie ('wat kunnen we eraan doen?')

- ze worden samengebracht in een zogenaamd ‘diagnostisch scenario’

• alle deelvragen worden ondergebracht in een van de categorieën

• de types worden in een bepaalde volgorde behandeld:

onderkenning → verklaring → predictie/indicatie

• niet alle diagnostische scenario’s bevatten alle subtypes van

vraagstellingen

toetsbare voorspellingen • diagnostisch scenario is opgebouwd uit hypothesen die aan evidentie getoetst moeten

worden

toetsbaar: we kunnen dit meten via een bepaald instrument

voorspelling: proberen op voorhand een voorspelling te doen over wat we moeten

vinden om een bepaalde hypothese te bevestigen

• hiertoe worden instrumenten gekozen, op basis waarvan toetsbare voorspellingen

geformuleerd kunnen worden

• bij de keuze van instrumenten gelden de kwaliteitscriteria besproken in thema 4

afname en verwerking per test • de gekozen tests worden op deskundige wijze afgenomen en verwerkt (standaardisatie,

objectiviteit,...)

• test per test verwerken zoals aangegeven in de handleiding en test voor test de

resultaten interpreteren

evaluatie van resultaten • de resultaten worden test per test verwerkt, gebruik makend van de toetsingscriteria

• de resultaten worden over tests heen geïntegreerd en teruggekoppeld naar de

hypothesen

• er wordt bekeken of alle vragen uit de aanvraag beantwoord zijn en of er al dan niet

bijkomend onderzoek nodig is

• soms geeft een onderzoek aanleiding tot nieuwe informatie, vanwaaruit nieuwe vragen

rijzen en een nieuwe cyclus kan ontstaan

Nieuwe informatie kan gevonden worden hieruit kunnen nieuwe vragen komen die

een nieuwe cyclus starten, vervolgonderzoek

het psychodiagnostisch rapport • waarom rapporteren?

• wat rapporteren?

• hoe rapporteren?

waarom rapporteren • vier redenen om te rapporteren:

- verantwoording

- verkoopbaar product

- effectieve communicatie

- betrokkenheid opdrachtgever

verantwoording- opdrachtgever wil begrijpen hoe conclusie tot stand gekomen is

- noodzaak van wetenschappelijke verantwoording en mogelijkheid tot verificatie

Begrijpen hoe de conclusie tot stand is gekomen

Welke overwegingen zijn er genomen

Welk proces is er gebruikt

Vergelijkbaar met andere onderzoeken

Mogelijkheid tot verificatie

verkoopbaar product- opdrachtgever wil 'waar voor zijn geld'

- rapport is vaak enige tastbare product dat uit het psychodiagnostisch onderzoek resulteert

- spanningsveld tussen 'nastreven van aantrekkelijkheid' en 'voldoen aan wetenschappelijke

en ethische standaarden'

kwaliteit van verslag

tastbaar product

effectieve communicatie- mondeling rapporteren is snel maar niet doelmatig

- rapport als naslagwerk, waarop beslissingen gebaseerd kunnen worden

Mogelijkheid tot verdere behandeling

In een mondeling verslag kan men nooit alles wat van invloed is geweest tijdens het

onderzoek weergeven

Men moet zich er van bewust zijn dat er veel valkuilen zijn aan mondelinge rapportage,

zoals het verkeerd overkomen of interpreteren van informatie

betrokkenheid opdrachtgever- Opdrachtgever betrekken bij het onderzoek

- opdrachtgever kan zich de gedachtengang van de psychodiagnosticus eigen maken

- advies valt niet uit de lucht

wat rapporteren • rapporteren maakt deel uit van het diagnostisch proces

- in elke stap van het proces is informatie verzameld die wel of niet in het rapport

terecht zal komen

- alleen informatie opnemen die relevant is en aan cliënt geen schade berokkent,

komt in het rapport

- informatie over het verloop van het onderzoek

• twee vereisten

- vraagstelling wordt, voor zover mogelijk, beantwoord

- antwoord wordt beargumenteerd

• diverse indelingen mogelijk

- in functie van voorkeuren aanvrager

- wel aantal vaste onderdelen

herkomst van de vraagstelling- geschiedenis van de aanvraag

- situering in tijd

beschrijving van de vraagstelling en het diagnostisch scenario- wat was de vraagstelling en hoe is deze tot stand gekomen

verloop onderzoek- omstandigheden van het onderzoek

- onderwerpen, bv.

• datum / tijdstip / duur

• stemming

• bijzondere voorvallen

• volgorde onderdelen

• observaties

• …

anamnese- achtergronden van cliënt voor zover relevant voor vraagstelling

- te uitvoerige anamnese kan schadelijk zijn voor de cliënt

- type anamnese afhankelijk van vraagstelling

- bevindingen van derden

resultaten onderzoek- alle verzamelde informatie

of

- selectie o.g.v. relevantie voor conclusie/advies (deze benadering geniet voorkeur,

want niet-relevante informatie kan een eigen leven gaan leiden)

samenvatting- korte herhaling vraagstelling

- weergave belangrijkste bevindingen

- antwoord op vraagstelling

conclusie/advies- verband tussen de vraagstelling en de bevindingen van het onderzoek

- eventueel (afhankelijk van vraagstelling) uitgebreider advies

hoe rapporteren het is belangrijk om op een correcte manier te rapporteren zodat de informatie juist overkomt bij de opdracht gever

stoorzenders: dingend ie fout lopen in de communicatie

• bij de opdrachtbevestiging

- schept verwachtingen over reikwijdte en doel van onderzoek en bereidt

opdrachtgever voor op rapportage

- bij nieuwe opdrachtgevers best persoonlijk contact (extra toelichting,

foldermateriaal)

- afspraken worden best ook schriftelijk bevestigd

• bij de overdracht van het rapport

- soms eerst mondelinge overdracht van resultaten (bijv. telefonisch)

- aandacht besteden aan deze communicatie want zal latere interpretatie van het

rapport beïnvloeden (belang van woordkeuze, toon, houding,...)

• bij de presentatie van het rapport

- belang van de verpakking (omslag, logo, papiersoort,...) presentatie moet

netjes zijn

- streven naar eenvoud

• bij de administratieve afwikkeling

- vermijden van slordigheden in verzending, spelfouten, vlekken op het papier,

onvoldoende frankering,...

- problemen op dit vlak doen afbreuk aan geloofwaardigheid

- voldoende aandacht geven aan adressering (zeker bij e-mail) en tijdigheid

taal en schrijfstijl

• vakjargon kan bron van irritatie voor opdrachtgever zijn

• taalgebruik van de ‘zender’ dient afgestemd te worden op dat van de ‘ontvanger’

• voortdurend lezer in gedachten houden bij het schrijven

• taal en schrijfstijl afstellen op ontvanger

• tips

- aandacht voor lengte van de zinnen

- actief taalgebruik

wetenschappelijkheid

• stappen in het schrijven van een rapport

- verzamelen van de gegevens

- ordenen van de gegevens

• welke informatie zal gebruikt worden en in welke volgorde?

• standaardpresentaties van anamnese en testen observatiemateriaal

kunnen handig hulpmiddel zijn

- uitschrijven van de gegevens

• onderscheid maken tussen feiten, interpretaties en conclusies

• transparantie (helderheid van de redenering)

• toetsbaarheid (falsifieerbaarheid van de conclusie)

voorbeeld:

“Cliënt geeft af en toe blijk van dwangneurotische neigingen. Het zal hem moeilijk vallen zich in

groepstherapie te handhaven; daarom raden we groepstherapie af.”

niet transparant: waarom wordt hier groepstherapie afgeraden?

Er wordt niet duidelijk gemaakt op basis waarvan deze beslissing gemaakt wordt

Wat zijn de dwangneurotische neigingen

Waarom vormt dit een probleem

niet toetsbaar: wat zal er gebeuren als cliënt wel groepstherapie volgt?

Wat zou er gebeuren als de cliënt dit wel doen

Wat is het gevaar

Cliënt geeft af en toe blijk van dwangneurotische neigingen. Hij geeft aan bepaalde gedachten

niet van zich af te kunnen zetten en deze frequent met anderen te willen bespreken. Hij ziet

zelf in dat dit voor anderen hinderlijk kan zijn. Dit gedrag zal des te sterker de neiging

hebben zich te manifesteren in situaties die niet sterk gestructureerd zijn, zoals de in onze

setting gegeven groepstherapie. Het zal hem moeilijk vallen zich in groepstherapie te

handhaven; daarom raden we groepstherapie af.”

transparant: er is verduidelijkt waarom gedacht wordt dat groepstherapie niet aangewezen is

niet toetsbaar: wat zal er gebeuren als cliënt wel groepstherapie volgt?

“Cliënt geeft af en toe blijk van dwangneurotische neigingen. Hij geeft aan bepaalde gedachten

niet van zich af te kunnen zetten en deze frequent met anderen te willen bespreken. Hij ziet

zelf in dat dit voor anderen hinderlijk kan zijn. Dit gedrag zal des te sterker de neiging

hebben zich te manifesteren in situaties die niet sterk gestructureerd zijn, zoals de in onze

setting gegeven groepstherapie. Het zal hem moeilijk vallen zich in groepstherapie te

handhaven. We verwachten dat zijn gedrag al na enkele sessies (2 à 4) hinderlijk zal

worden voor de overige cliënten in de groep, doordat hij te vasthoudend zal zijn in het

uiten van zijn steeds terugkomende opinies. Daarom raden we groepstherapie af.”

transparant: er is verduidelijkt waarom gedacht wordt dat groepstherapie niet aangewezen is

toetsbaar: er wordt aangegeven welk risico er gelopen wordt als cliënt wel groepstherapie volgt

verwijzing naar normen

• ‘soortgelijken’ met elkaar vergelijken

• principe:

- relevante normgroep zoeken (soms kan vergelijking met meerdere groepen

interessant zijn)

- positie vaststellen

- verantwoorde uitspraak doen

Omschrijven met welke groep er vergeleken wordt

Valkuilen (problemen in het verslag)

• inhoudsproblemen

- ruwe data in het rapport (verkeerde conclusies trekken

- nadruk op verkeerde elementen

- ontbreken van essentiële informatie (bv leeftijd of geslacht)

- ontbreken van essentiële onderdelen van het rapport

• interpretatieproblemen

- stokpaardjes: te veel focus op een bepaald element, waardoor de andere

elementen op de achtergrond komen

bv, door specialisatie voor dit element

- beperkt referentiekader (bv. Enkel het dsm)

- systematische fouten in interpretatie van ruwe data

• attitude van de diagnosticus

- zich niet verplaatsen in de belevingswereld van de cliënt en/of externe

opdrachtgever

- onpraktische oplossingen

• communicatieproblemen

- zie ‘stoorzenders’

- slechte toegankelijkheid Slechte communicatie tussen onderzoeker en cliënt.

• professionele problemen

- fouten in de testopzet

- onwetendheid, optelfouten, nonchalance…

voorbeeld examenvraag

• Welke heuristiek gebruikt een diagnosticus die aan een cliënt een bepaalde therapie

adviseert louter omwille van het feit dat de cliënt in kwestie lijkt op een vroegere cliënt

bij wie deze therapie succesvol was?

– representativiteit

– beschikbaarheid

– verankeren

– voorstelling

intelligentie volgens het CHC-model intelligentiediagnostiek vandaag Bevraging Vlaams Forum Diagnostiek

(Studiedag 25/11/2011)

Intelligentie = één van de meest onderzochte domeinen in psychologische &pedagogische

hulpverlening

Vooral schalen van Wechsler: WPPSI-III, WISC-III, WAIS-IV

Definitie Wechsler basis voor intelligentie test

schalen van wechsler Schatting algemene intelligentie (g) a.d.h.v. brede variëteit aan taken: verbaal+ performaal

Indeling verwijst naar verschillende manieren om g te meten, niet naar 2 soorten intellectuele

vaardigheden

“different ‘languages’ … which may be easier or harder for different subjects” (Wechsler,

1974, p. 5)

“there is no such thing as “nonverbal” ability – only abilities that are expressed

nonverbally” (McGrew & Flanagan, 1998, p. 25)

Brede variatie aan taken

- Verbale taken (waarbij je een antwoord moet geven)

- Perforale taken (intelligentie tonen door iets te doen, bv, een puzzle maken)

Verbale en performale intelligentie

Verworpen

Non-verbale intelligentie bestaat niet, enkel intelligentie die zich op een non verbale

manier uit

gebruik van wechslerschalen doorheen de tijd

Profiel analyse:

- In verband brengen met klinische beelden

- Patronen onderzoeken

- Verschil tussen verbaal en performale intelligentie

- Profiel analyse via visuele inspectie, intuïtief

Geen wetenschappelijk onderbouwde empirie

Psychometrische profielanalyse

- Factor analyse op bepaalde scoren

- Intelligentie individueel bespreken afhankelijk van de verschillende factoren

- Niet gebaseerd op een theoretisch model

- Analyse is gebonden aan één specifieke test

Theorie gebaseerd werken

- Bruikbaar voor verschillende testen

NIET: stop met afnemen Wechsler tests want valide & betrouwbare schatting algemene

intelligentie!

WEL: pleidooi voor ‘intelligent’ gebruik

- Wees bewust van wat je meet en niet meet

- Kijk naar resultaten in termen van cognitieve sterktes & zwaktes

- Vul aan met andere cognitieve (sub)tests om vollediger profiel van cognitieve

vaardigheden te krijgen

- Gebruik daarbij een wetenschappelijk gefundeerd kader

chc model van cognitieve vaardigheden nieuw?1989: eerste kiem

1999: ontstaan benaming CHC model

Sindsdien vele publicaties in toonaangevende tijdschriften (Intelligence, Psychology in the

schools, Journal of School Psychology…)

(Newton & McGrew, 2010)

Maar… pas relatief recent toegepast in Vlaanderen

“De principes van Flanagan et al. zijn voor Vlaanderen uitgewerkt in de CAP-publicatie van 2007,

aangevuld in 2010 (CHC-platform) en binnen CAP-overleg van 2013.” (Bron: website CHC-

platform)

Recent in gebruik binnen Vlaanderen

In de vs al veel langer in gebruik

special issue in 2010

wetenschappelijke basis Combinatie van Cattell en Horns “extended Gf-Gc” theorie en Carrolls 3-stratum theorie

Carroll (1993): exploratorische factoranalyse op 460 datasets

- Carroll heeft een belangrijke invloed gehad op intelligentie testen

- Heranalyse op basis van factoranalyse

chc model: integratie van modellen cattell- horn en carroll

Verschillend aantal factoren die zijn onderscheiden

G factor algemene intelligentie: positieve samenhang tussen cognitieve vaardigheden

chc model van cognitieve vaardigheden

Groen: cognitieve factoren

Gele: achievement factoren

Meer afhankelijk van de instructie die je al hebt gehad, de dingen die je geleerd hebt

Pijlen geven de lading tot g aan

3-niveau hiërarchisch model

3 strata die worden onderscheiden

Smalle cognitieve vaardigheden

Subdimenties van de brede cognitieve vaardigheden

Brede cognitieve vaardigheden

Subdimenties van de algemene intelligentie

conclusies Confirmatorische factoranalyse binnen en tussen testbatterijen steun voor kernassumpties

- 3 niveaus

- differentiatie tussen verschillende cognitieve vaardigheden zoals vooropgesteld door CHC

theorie

- positieve, onderlinge samenhang g

- structuur equivalent over geslacht, etniciteit en leeftijd

Structuur van intelligentie wordt onderzocht aan de hand van factoranalyse

chc: brede cognitieve vaardigheden Covaar-II: Oefenboekje

fluid intelligence (GF°- Redeneren (e.g., inductief, deductief)

- Mentale operaties bij confrontatie met relatief nieuwe taak die men niet automatisch

kan oplossen (bv. concepten herkennen, verbanden ontdekken, extrapoleren)

- Hoge lading op ‘g’; voorspellend voor rekenen en begrijpend lezen (bij oudere kinderen)

(meta-analyse McGrew & Wendling, 2010)

- Geen (zuivere) meting in WISC-III

- 2, abstracte en alledaagse problemen

cristallized intelligence (Gc)comprehension-knowledge - De breedte en diepte van iemands verworven

kennis binnen een cultuur en de toepassing van die kennis

“Gc is primarily a store of verbal or language-based declarative (knowing what) and procedural (knowing how) knowledge acquired through the investment of other abilities during formal and informal educational and general life experiences” (Newton & McGrew, 2010, p. 623)

- Hoge lading op ‘g’; voorspellend voor technisch en begrijpend lezen en rekenen + toenemend belang doorheen ontwikkeling

- Goed vertegenwoordigd in WISC-III: Informatie, Overeenkomsten, Woordkennis, Begrijpen (Verbaal Begrip)

Verbaal verworven kennis binnen een bepaalde cultuur

Ligt nou samen met de prestaties op school

Veel van de verbalen testen meten gc

short-term memory (gsm)Vaardigheid om gedurende enkele seconden informatie vast te houden en te bewerken

bv. telefoonnummer lang genoeg onthouden om het te vormen, instructie lang genoeg

onthouden om ze uit te kunnen voeren

Voorspellend voor (technisch) lezen en rekenen (m.n. werkgeheugen) (+ gedrag/werkhouding!)

WISC III: slechts 1 subtest te weinig om betrouwbare, valide uitspraak te doen over cognitieve

vaardigheid; bijkomend bv. Reeksen opnoemen CELF-4-NL

Kort termijn geheugen en werk geheugen

Goed functioneren hiervan is af te leiden uit het gedrag van het kind

long-term storage and retrieval (glr)Vaardigheid om informatie in het lange termijn geheugen te bewaren en terug op te halen (de

efficiëntie waarmee de informatie opgeslagen wordt en terug opgehaald wordt)

Bv. Namen leren (RAKIT-2), Ideeënproductie (RAKIT-2), Woordassociaties (CELF-4-NL), …

Voorspellend voor lezen (technisch en begrijpend); minder consistente verbanden met rekenen

The ability to store and consolidate new information in long-term memory and later fluently

retrieve the stored information (e.g., concepts, ideas, items, names) through association.

Memory consolidation and retrieval can be measured in terms of information stored for

minutes, hours, weeks, or longer. Some Glr narrow abilities have been prominent in creativity

research (e.g., production, ideational fluency, or associative fluency)” (Newton & McGrew, 2010,

p. 626)

visual processing (gv)Vaardigheid om visuele patronen en stimuli te genereren, waar te nemen, te analyseren, te

synthetiseren, te manipuleren, te transformeren en ermee te denken; visueel-ruimtelijke

vaardigheden

Sterk vertegenwoordigd in WISC III: Onvolledige tekeningen, Blokpatronen, Figuur leggen,

Plaatjes ordenen (Perceptuele Organisatie)

Geen significant verband met taal en rekenen (“the Gv mystery”, McGrew & Wendling, 2010),

verklaringen: aard wiskundetests, …

Individuele verschillen hebben weinig invloed op de schoolse perstaties

Er moet een minimum aanwezig zijn, na dit minimum maakt het nog weinig uit

auditory processing (ga)Vaardigheid om informatie in geluid te detecteren en te verwerken, bv. fonologisch coderen

Voorspellend voor (technisch en begrijpend) lezen

(vooral fonologisch bewustzijn)

processing speed (gs)Vaardigheid om eenvoudige, repetitieve cognitieve taken snel en vlot uit te voeren. Het gaat

om betrekkelijk eenvoudige taken die snel moeten uitgevoerd worden, en die bijna iedereen

juist zou hebben wanneer er voldoende tijd zou gegeven worden

WISC III: Substitutie, Symbolen vergelijken (Verwerkingssnelheid)

Voorspellend voor technisch lezen en rekenen

het chc model in de praktijk chc in de praktijk: cross-battery benadering = testbatterij samenstellen op basis van subtests uit verschillende tests

één intelligentietest als kern van de batterij (‘basisbatterij’) bv. WISC-III of WPPSI-III

aanvullen met subtests (uit recente en kwaliteitsvolle tests) met normale scoreverdeling

Waarom? Nodig?

Ja, omwille van beperkingen van huidige intelligentietests in Vlaanderen

Maar wel volgens een gefundeerde,

internationaal aanvaarde werkwijze

Verschueren en Resing (2015, Box 3.1)

+ CHC-platform

principes cross-battery assessment (xba) Vertrek zoveel mogelijk vanuit één test die erkend is als algemene intelligentietest (bv.

Wechsler-schalen)

Vul aan met subtests van andere kwaliteitsvolle tests (recent en in dezelfde periode

genormeerd)

Gebruik niet meer verschillende tests dan nodig

Meting van BCV: meet minstens 2 kwalitatief verschillende smalle cognitieve vaardigheden

Integreer testgegevens met andere informatie over cliënt in functie van ecologische validiteit

(Verschueren & Resing, 2015; Box 3.1.)

Normering in dezelfde periode intelligentie stijgt doorheen de tijd, de scores moeten

vergelijkbaar zijn waardoor ze niet te ver van elkaar genormeerd mogen zijn

categorisatie subtests in bcvs Op basis van factoranalyse: Wechslerschalen (internationaal onderzoek)

Op basis van consensus expertoordelen na inhoudelijke analyse (Cross-battery Flanagan): CELF

4 NL, CELF Preschool 2

Op basis van analogie/inhoudelijke analyse (CAP- PDC Thomas More): SON-R 6 – 40, RAKIT 2

http://www.thomasmore.be/psychodiagnostisch-centrum/chc-platform-0

voorbeeld werkwijze (chc-platform)vertrekkend vanuit wisc iiiwisc-iii chc basisbatterij (chc-platform)

Brede cognitieve vaardigheid Test + Subtests

Gf: Fluïde intelligentie SON-R 6 – 40 Analogieën

SON-R 6 – 40 Categorieën

Gq: Kwantitatieve kennis WISC III Rekenen

Gc: Gekristalliseerde intelligentie WISC III Informatie

WISC III Woordkennis

WISC III Overeenkomsten

Gsm: Kortetermijngeheugen CELF 4 Reeksen Opsommen

CELF 4 Cijfers Herhalen

Gv: Visuele informatieverwerking WISC III Blokpatronen

WISC III Onvolledige Tekeningen

Gs: Verwerkingssnelheid WISC III Substitutie

voorbeeld werkwijze (chc-platform) vertrekkend vanuit wppsi iiiwppsi iii chc basisbatterij (chc-platform)

Brede cognitieve vaardigheid Test + Subtests

Gf: Vloeiende intelligentie WPPSI III Matrix Redeneren

WPPSI III Plaatjesconcepten

Gq: Kwantitatieve kennis WPPSI-R Rekenen

Gc: Gekristalliseerde intelligentie WPPSI III Informatie

WPPSI III Woordenschat

WPPSI III Woordredeneren

Gsm: Kortetermijngeheugen CELF 4 Reeksen Opsommen

CELF 4 Cijfers Herhalen

Gv: Visuele informatieverwerking WPPSI III Blokpatronen

WPPSI III Onvolledige Tekeningen

Ga: Auditieve informatieverwerking CELF 4 Fonologisch Bewustzijn

Glr : Langetermijngeheugen CELF 4 Snel Benoemen Tijd

Gs: Verwerkingssnelheid WPPSI III Substitutie

verder onderzoek brede cognitieve vaardigheden Uitdiepen van sommige brede cognitieve vaardigheden (BCV):

- op basis diagnostische vraagstelling

- omwille van inconsistentie bij berekening van index

voorbeeld uitdiepen gc m.b.v. subtesten celf4-nlTaalontwikkeling:

- Zinnen Formuleren

Luisteren:

- Begrippen en Aanwijzingen Volgen

- Zinnen Begrijpen

- Tekstbegrip

Grammaticale ontwikkeling:

- Woordstructuur

- Zinnen Samenstellen

wat levert het op Voorbeeld-tabel met resultaten volgens methode practica

School-psychologie

profielanalyse Profiel cognietieve sterktes / zwaktes: voordelen voor de praktijk

- Gedifferentieerd beeld; aandacht voor zwaktes maar ook voor sterktes

- Verklaring voor problemen op schools vlak; uiteenlopende visies

- Handvaten voor interventies

Versterken van zwakke cognitieve vaardigheden

Beroep doen op sterke cognitieve vaardigheden

Is een BCV-index significant sterk of zwak t.o.v. het totaal-IQ: wat zijn de sterke of zwakke

kanten van de leerling?

normeringsonderzoek van wisc-v-nlnormeringsonderzoek van wisc-v-nl

1. WISC-III-NL

2. WISC-V-NL

3. Normeringsonderzoek

4. Representatieve steekproef

5. Samenstelling steekproef

6. Extra onderzoeken

7. Statistische verwerking

8. Belang samenstelling steekproef: Voorbeelden

wisc iii nl

PIQ = hoe ga je praktisch om met je kennis, subtesten waarbij je iets moet doen om te

antwoorden, zijn de subtesten met materiaal

VIQ = heeft te maken met taal: taalbegrip, woordenschat, … Verbaal antwoorden

Subtesten schuin gedrukt worden niet gebruikt om één van beide IQ’s te berekenen, kan

gebruikt worden als vervangende subtest (behalve doolhoven)

TIQ = algemene intelligentie, g-factor, hiërarchisch model

Factoren kunnen berekenen, gebaseerd op factoranalytisch onderzoek

PO = perceptuele organisatie, grote overeenkomst PIQ, behalve substitutie

VB = verbaal begrip, grote overeenkomst VIQ, behalve rekenen

VS = verwerkingssnelheid

Problemen WISC-III-NL:

• Veroudering normen (Flynn-effect)

• Tweedeling verbaal/performaal IQ

• Ontbreken vloeiende intelligentie (Gf)

WISC-V-NL

• Normen moeten elke 15 jaar vernieuwd worden, omwille van stijging IQ: elke 10 jaar + 3

à 5 IQ-punten, in Westerse landen lijkt Flynn-effect zich te stabiliseren in Westerse

landen (voeding + onderwijs blijft ook stabiel)

• Onderzoek naar structuur intelligentie geeft geen evidentie voor bestaan VIQ en PIQ

• CHC-model: Gf heeft grootste lading op g (deze zit op dit moment niet in de wiks3,

daarom ontwikkeling wiks5)

wisc-v-nl Engelstalig Franstalig Ndlstalig

WISC-III 1992 1996 2002/2005

WISC-IV 2003 2004 /

WISC-V 2014 2016 Eind 2017

WISC-III-NL is voor Ndl + Vl uitgekomen op moment dat in Amerika WISC_IV uitkwam!

WISC-IV-NL is overgeslagen om aan te sluiten bij de rest van de wereld, anders achterop blijven

zitten

normeringsonderzoek van wisc-v-nl 1. Theoretische achtergrond

2. Subtesten

3. Indexen

4. WISC-V-NL en CHC

5. Verschil WISC-III-NL/WISC-V-NL

theoretische achtergrond Samenstelling subtesten gebaseerd op:

• Modellen van intelligentie, oa CHC

• Neuropsychologisch onderzoek

• Modellen over werkgeheugen

subtesten 1. Blokpatronen

2. Overeenkomsten

3. Matrix Redeneren

4. Cijferreeksen

5. Symbool Substitutie Coderen

6. Woordenschat

7. Gewichten

8. Figuur Samenstellen

9. Plaatjesreeksen

10. Symbool Zoeken

11. Cijfers en Letters Nazeggen

12. Figuur Zoeken

13. Begrijpen

14. Rekenen

indexen • Geen berekening VIQ en PIQ

• Vijf indexen:

- Verbale Begrip index (VBI)

- Visueel Ruimtelijke index (VRI)

- Fluid Reasoning index (FRI)

- Werkgeheugen index (WGI)

- Verwerkingssnelheid index (VSI)

TIQ

wisc-v-nl en chc Vijf indexen:

• Verbale Begrip index (VBI) = Gekristalliseerde intelligentie (Gc)

• Visueel Ruimtelijke index (VRI) = Visuele Infoverwerking (Gv)

• Fluid Reasoning index (FRI) = Vloeiende intelligentie (Gf)

• Werkgeheugen index (WGI) = Korte termijn geheugen (Gsm)

• Verwerkingssnelheid index (VSI) = Verwerkingssnelheid (Gs)

Vijf indexen hebben andere naam dan BCV, maar komen perfect overeen

verschil wisc-iii-nl/ wsc-v-nl Inhoudelijk: Samenstelling test CHC

Praktisch: Vereenvoudiging:

- Materiaal: responsformulieren, stimulusboek, blokjes voor blokpatronen

Afname met iPad mogelijk: http://www.helloq.nl /

- Omkeer- en afbreekregels

Omkeer – en afbreekregels altijd hetzelfde:

• omkeer: geen maximumscore op eerste twee items omkeren

• Afbreek: 4 opeenvolgende (BP 3 opeenvolgende) 0-scores

normeringsonderzoek Unieke samenwerking tussen Pearson en VFD:

Hogescholen: VIVES, Howest, Thomas More Antwerpen

Universiteiten: UGEnt, VUB, KU Leuven

COS Antwerpen: COS = Centrum voor OntwikkelingsStoornissen onderzoek bij doelgroepen:

autisme

VFD = Vlaams Forum Diagnostiek: vzw die alle spelers in het werkveld rond (psycho)diagnostiek

verenigt

Alle instellingen die opleiding toegepaste psychologie of psychologie aanbieden, werken mee

aan normering

timing Ontwikkeling test kost ongeveer 3 jaar

• Pilot: feb – april 2015

• Try-out: sept – dec 2015

• Normering + extra onderzoeken: sept 2016 – juni 2017

• Publicatie WISC-V-NL: eind 2017

http://www.helloq.nl/

http://www.helloq.nl/

pilot • Instructie testen

• Iteminformatie verzamelen

• N = 40 Ndl, N = 20 Vl, kinderen van 6-7 jaar en van 16-17 jaar

• Uitgevoerd door Pearson

• Instructie: zowel voor PL als PP

• Iteminfo: items, materialen en instructies die niet werken er uit halen.

• Functioneert test op alle leeftijden en alle niveaus

try out • Itemselectie

• Itemvolgorde

• Iteminstructie

• N = 220 (20 per jaar, 14 Ndl, 6 Vl)

• Uitgevoerd door studenten HoWest en VIVES

• Gespreid naar opleidingsniveau moeder, opleidingsniveau kind, sekse, etniciteit, regio,

urbanisatie. Waarvan ook N=6 verstandelijk beperkten.

Taalexperts Nederland/Vlaanderen

Cultuurbiais allochtonen

Verschil tussen Ndl en Vl proberen uit te sluiten, vb in woordgebruik

Komt ook terug in instructies, vb item Begrijpen: Waarom is het niet toegelaten om je mobiele

telefoon (VL ev: GSM) te gebruiken tijdens sommige lessen?

Items waarvan uit onderzoek gebleken is dat allochtonen benadeeld worden, eruit laten

normering • Data verzamelen

• Nederland: N = 875

• Vlaanderen: N = 356

Pearson hoopt gegevens samen te kunnen voegen

representatieve steekproef Steekproef moet representatief zijn voor populatie

Om op basis van normgegevens verzameld in steekproef uitspraken te kunnen doen over

populatie (= elk kind dat niet tot de normgroep behoorde en dat getest wordt met WISC-V-NL)

Zoals al eerder aangegeven zal de uitvoering van een TE uiteindelijk resulteren in informatie

over elk element van de steekproef. Men zou kunnen wensen dat, in termen van sommige

aspecten van deze informatie, de steekproef gelijkt op de populatie. Men spreekt in dit geval

van een representatieve steekproef met betrekking tot deze informatie-aspecten.

Definitie statistiek 1

TE = toevalsexperiment

… populatie op basis van beschikbare informatie wordt opgesplitst in homogene

deelpopulaties of strata. Een gestratificeerde steekproef wordt dan bekomen door per stratum

op ZTW een steekproef te trekken en de resulterende steekproeven vervolgen samen te

voegen.

Definitie gestratificeerde steekproef statistiek 1

Dat is wat in bovenstaande gedaan werd: steekproef stratificeren voor kleur: je gaat na hoeveel

subjecten van elke kleur in de populatie zitten, je zorgt dat dezelfde % terugkomen in

steekproef. Per stratum = per eigenschap. Binnen elk stratum ppen op ZTW selecteren, is niet

volledig ZTW, want pp moet voldoen aan die bepaalde eigenschap. Dit zorgt ervoor dat in je

steekproef die bepaalde eigenschap representatief is voor populatie. Doe je dus enkel voor

eigenscshappen waarvan je wilt dat ze in de steekproef representatief zijn voor populatie. Voor

intelligentie is haarkleur bijvoorbeeld niet relevant.

samenstelling steekproef 1. Stratificatie voor:

- Leeftijd

- Regio

- Onderwijsnet

- Schoolniveau

2. Monitoren voor:

- Geslacht

- Opleidingsniveau moeder

- Etniciteit

- Urbanisatie

stratificatie Stratificatie: voor deze eigenschap: zelfde % als in populatie

Wordt verwacht mogelijk een invloed te hebben op IQ

leeftijd Intelligentie stijgt met de leeftijd

Rekening houden met het Flint effect

regio Intelligentie kan verschillend zijn in verschillende regio’s

Verschillend onderwijssysteem

Er moet gestandaardiseerd worden op regio

Zo zijn testen gestandaardiseerd in Nederland niet altijd representatief voor België

onderwijsnet Scholen in te delen naar soort inrichtende macht.

Het gaat dan in eerste plaats om scholen van kleuter-, lager- en secundair onderwijs.

Schoolniveau: secundair onderwijs• 1ste graad:

- A stroom

- B stroom

• 2de en 3de graad:

- Aso

- Bso

- Kso

- Tso

monitoren voor:Andere variabelen die ook belangrijk zijn voor representativiteit, maar waarvoor niet

gestratificeerd wordt, omdat anders de aantallen per cel zo klein zouden worden, dat de

trekking op ZTW in gedrang komt en recruteren van ppen te ingewikkeld

Zal tijdens verzamelen normgegevens nagegaan worden of streef% ongeveer bereikt worden en

indien nodig bijgestuurd

geslacht Even veel vouwen als mannen

opleidingsniveau moeder Laag: max lager SO

Midden: max hoger SO

Hoog: hoger onderwijs of universiteit

6de jaar BSO = getuigschrift, geen diploma, dus laag opgeleid

etniticiteit Moeilijk om hier een vaste definitie voor vast te stellen

Wanneer behoren mensen tot een andere etniciteit?

urbanisatie Dichtbevolkt gebied: 54%

Gemengd gebied: 45,7%

Dunbevolkt gebied: 0,3%

In Vl komen bijna geen dunbevolkte gebieden meer voor.

extra onderzoeken Test-hertestonderzoek

Interbeoordelaarsonderzoek

Validiteitsonderzoek met WPPS-III-NL en WAIS-IV-NL

Klinische groepen

statistische verwerking DIF: afzonderlijke normen Ndl/Vl?

Continue normering + IRT: normen opstellen met kleinere aantallen

belang samenstelling steekproefWat zijn de gevolgen als er iets fout loopt bij de samenstelling?

1. WAIS-IV-NL

2. Bayley-III-NL

3. TEA-Ch

wais-iv-nl • Normen verzameld bij Nederlandse en Vlaamse proefpersonen, 16-85 jaar

• Opleidingsniveau:

- Laag

- Midden

- Hoog: 7de jaar bso

Ndl proefpersonen scoren significant hoger

bayley-iii-nl • Ontwikkeling kinderen 16 d – 42m 15 d

• Schalen:

- Cognitie

- Taal

- Motoriek

- Sociaal emotioneel gedrag

- Adaptief gedrag

• Vlaamse normen: 1192 kinderen, gespreid over 17 leeftijdsgroepen

• Representativiteit?

www.kwaliteitscentrumdiagnostiek.be

Bedenkingen geformuleerd door Kwaliteitscentrum Diagnostiek: overheidsinstantie met als

opdracht diagnostiek in Vl te verbeteren

- Foute streefpercentages opleidingsniveau moeder

• Ondervertegenwoordiging laag opleidingsniveau!

• Uit Vlaams normeringsonderzoek:

http://www.kwaliteitscentrumdiagnostiek.be/

Kinderen laagopgeleide moeders scoren significant lager:

- Voor ‘Cognitie’ en ‘Taal’ dan kinderen midden- en hoogopgeleide moeders

- Voor ‘Motoriek’ dan kinderen hoogopgeleide moeders

Opleidingsniveau moeder blijkt zeer relevantie variabele te zijn moet representatief zijn!

• Ondervertegenwoordiging laag opleidingsniveau!

Transformatie ruwe scores naar:

Gevolg van ondervertegenwoordiging:

Ruwe scores van kinderen uit steekproef worden omgezet naar normscores (normtabellen),

transformatie naar gauss-curve, met gemiddelde 100 en st dev 15

Representatieve steekproef

Steekproef met ondervertegenwoordiging laag

Stel: door oververtegenwoordiging kinderen midden- en hoogopgeleide moeders

verschuiving van curve: ruwe scores steekproef liggen hoger dan wanneer meer kinderen met

laagopgeleide moeders in steekproef. Gemiddelde wordt omgezet op 100, dit wordt al norm

genomen!

Ondervertegenwoordiging laag opleidingsniveau!

Risico:

• Te hoge normscores

• Overdiagnosticering

Overdiagnosticering van kinderen met lage scores hulpvraag

• Vlaamse normen: 1192 kinderen, gespreid over 17 leeftijdsgroepen

• Representativiteit?

– Foute streefpercentages opleidingsniveau moeder

– Ten opzichte van streefpercentages ondervertegenwoordiging van:

• Niet-Vlaamse kinderen

• Kinderen laag- en middenopgeleide moeders

• Kinderen uit regio West

Tweede probleem

Laatste (regio West) is niet zo’n probleem, heeft geen invloed op bekomen resultaat

• Niet-Vlaamse kinderen: 2% (streef%: 7,8%)

• Ndl normeringsonderzoek: kinderen van allochtone ouders scoren significant lager dan

kinderen van autochtone ouders op ‘Cognitie’ en ‘Taal’

Representativiteit?

• Foute streefpercentages opleidingsniveau moeder

• Ten opzichte van streefpercentages ondervertegenwoordiging van:

– Niet-Vlaamse kinderen

– Kinderen laag- en middenopgeleide moeders

– (Kinderen uit regio West)

Te hoge normscores

Voorzichtigheid met interpretatie testscores is nodig!

tea-ch Meet aandachtsproblemen bij kinderen 6-16 jaar

• Meet aandachtsproblemen bij kinderen 6-16 jaar

• Publicatie 2004: 293 Australische kinderen

Problemen:

- Te weining kinderen

- Enkel Australische kinderen

pedagogischekringleuven.files.wordpress.com€¦ · Web view2020. 9. 24. · Sigmund Freud...

Documents

Transcript of pedagogischekringleuven.files.wordpress.com€¦ · Web view2020. 9. 24. · Sigmund Freud...