Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler...

36
119 Hoofdstuk 7 VALIDITEIT 7.1 INLEIDING Het begrip validiteit wordt door Drenth en Sijtsma (1990) omschreven als ‘de mate waarin een test aan zijn doel beantwoordt’. Hiermee willen zij aangeven dat validiteit niet zonder meer gezien kan worden als een eigenschap van een test, maar dat het doel van de test bij de vraag naar de validiteit in ogenschouw moet worden genomen. Drenth en Sijtsma onderscheiden primair twee soorten validiteit, die elk op een ander aspect van het ‘aan zijn doel beantwoorden’ van een test betrekking hebben. De mate waarin met een test gedrag of een prestatie buiten de testsituatie kan worden voorspeld, wordt aangeduid met de term predictieve validiteit. De be- gripsvaliditeit betreft de vraag naar de mate waarin het bedoelde theoretische begrip inderdaad met de test wordt gemeten. Drenth en Sijtsma wijzen er op dat de beide soorten validiteit duidelijke raakvlakken hebben. Andere onderscheidingen in het validiteitsbegrip vallen volgens Drenth en Sijtsma binnen één van de beide soorten. In dit hoofdstuk wordt hoofdzakelijk de begripsvaliditeit van de Reynell Test voor Taalbegrip en de Schlichting Test voor Taalproductie behandeld. Hierbij zijn vooral twee soorten (begrips-) validiteit van belang, namelijk discriminante en convergente validiteit. Discriminante validiteit kan worden omschreven als de mate waarin alternatieve verklaringen voor het testresultaat kunnen worden verworpen (zie: Drenth & Sijtsma, 1990, p.205). Convergente validiteit (Anastasi, 1990) wordt aangetoond door het vinden van een grote samenhang tussen resultaten op tests die hetzelfde of een verwant begrip meten. Discriminante validiteit daar- entegen wordt juist aangetoond door het vinden van géén samenhang tussen resultaten op tests die begrippen meten die geen theoretische samenhang vertonen. In Figuur 7.1 worden de begrippen convergente en discriminante validiteit gezien als de uiterste posities op een continuüm. Er is sprake van een goede validiteit wanneer het patroon van correlaties overeenkomstig het patroon in Figuur 7.1 is. Van convergente validiteit is er sprake wanneer er een zeer hoge correlatie wordt gevonden tussen bijvoorbeeld taaltests onderling. Van discriminante validiteit is sprake wanneer er geen samenhang wordt gevonden tussen taalontwikkeling en een begrip waarmee taalontwikkeling geen enkele

Transcript of Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler...

Page 1: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

119

Hoofdstuk 7

VALIDITEIT

7.1 INLEIDING

Het begrip validiteit wordt door Drenth en Sijtsma (1990) omschreven als ‘de matewaarin een test aan zijn doel beantwoordt’. Hiermee willen zij aangeven datvaliditeit niet zonder meer gezien kan worden als een eigenschap van een test, maardat het doel van de test bij de vraag naar de validiteit in ogenschouw moet wordengenomen.

Drenth en Sijtsma onderscheiden primair twee soorten validiteit, die elk op eenander aspect van het ‘aan zijn doel beantwoorden’ van een test betrekking hebben.De mate waarin met een test gedrag of een prestatie buiten de testsituatie kanworden voorspeld, wordt aangeduid met de term predictieve validiteit. De be-gripsvaliditeit betreft de vraag naar de mate waarin het bedoelde theoretischebegrip inderdaad met de test wordt gemeten. Drenth en Sijtsma wijzen er op dat debeide soorten validiteit duidelijke raakvlakken hebben. Andere onderscheidingen inhet validiteitsbegrip vallen volgens Drenth en Sijtsma binnen één van de beidesoorten.

In dit hoofdstuk wordt hoofdzakelijk de begripsvaliditeit van de Reynell Testvoor Taalbegrip en de Schlichting Test voor Taalproductie behandeld. Hierbij zijnvooral twee soorten (begrips-) validiteit van belang, namelijk discriminante enconvergente validiteit. Discriminante validiteit kan worden omschreven als de matewaarin alternatieve verklaringen voor het testresultaat kunnen worden verworpen(zie: Drenth & Sijtsma, 1990, p.205). Convergente validiteit (Anastasi, 1990)wordt aangetoond door het vinden van een grote samenhang tussen resultaten optests die hetzelfde of een verwant begrip meten. Discriminante validiteit daar-entegen wordt juist aangetoond door het vinden van géén samenhang tussenresultaten op tests die begrippen meten die geen theoretische samenhang vertonen.

In Figuur 7.1 worden de begrippen convergente en discriminante validiteitgezien als de uiterste posities op een continuüm. Er is sprake van een goedevaliditeit wanneer het patroon van correlaties overeenkomstig het patroon inFiguur 7.1 is. Van convergente validiteit is er sprake wanneer er een zeer hogecorrelatie wordt gevonden tussen bijvoorbeeld taaltests onderling. Vandiscriminante validiteit is sprake wanneer er geen samenhang wordt gevondentussen taalontwikkeling en een begrip waarmee taalontwikkeling geen enkele

Page 2: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

120

theoretische verwantschap heeft, zoals bijvoorbeeld haarkleur. De discriminantevaliditeit van de RTB en de STP is in deze zin niet onderzocht. Een geringesamenhang zou kunnen worden verwacht met een begrip waarvan slechts enigeinvloed op de taalontwikkeling kan worden verwacht, zoals de motorischeontwikkeling. Taalontwikkeling is bijvoorbeeld op zich onafhankelijk van demotorische ontwikkeling maar wanneer een kind leert lopen vergroot hij zijnleefwereld, hetgeen een positief effect kan hebben op zijn taalontwikkeling. Van deRTB en de STP zijn vooral de samenhangen met andere taaltests en met tests vooralgemene en niet-verbale cognitieve ontwikkeling onderzocht.

Figuur 7.1 Theoretische samenhang tussen te meten begrippen en verwacht patroonvan correlaties bij convergente en discriminante validiteit.

De indeling van het hoofdstuk is als volgt. Eerst wordt een overzicht gegevenonderzoek betreffende de validiteit van de ‘oude Reynell’, de RDLS. Na een kortebespreking van de relatie van taalontwikkeling met cognitieve ontwikkeling wordtde probleemstelling van het validiteitsonderzoek geformuleerd. Hierna worden deopzet van het validiteitsonderzoek en de gebruikte validatietests beschreven.

Page 3: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

121

Tenslotte worden de resultaten van het validiteitsonderzoek gepresenteerd enbesproken.

7.1.1 Validiteit van de RDLS

Van de RDLS zijn validiteitsgegevens bekend door een artikel van Silva, Brad-shaw en Spears uit 1978, dat van 1981 tot 1985 als supplement in de handleidingvan de RDLS is opgenomen geweest. Het artikel beschrijft een Nieuw-Zeelandsonderzoek waarin 225 kinderen betrokken waren. Bij deze kinderen zijn op ver-schillende momenten in hun ontwikkeling verschillende tests afgenomen, vooraltaal- en intelligentietests.

Rond hun vierde verjaardag is bij de kinderen, naast de RDLS, de PictorialTest of Intelligence (PTI; French, 1964) en de Stanford-Binet Intelligence Scale(Terman & Merrill, 1960) afgenomen, en rond hun vijfde verjaardag de IllinoisTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoolen Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de FrostigDevelopmental Test of Visual Perception (Frostig, 1966), de Predictive Test ofArticulation (Van Riper & Erickson, 1968) en de Goodenough-Harris Draw-a-Man Test (Harris, 1963). Bij 185 kinderen van de oorspronkelijke groep van 225kinderen zijn bovendien rond hun zevende verjaardag de Burt Rearranged WordReading Test (Vernon, 1967) en de Wechsler Intelligence Scale for Children(Wechsler, 1949) afgenomen.

De resultaten ondersteunen de validiteit van de RDLS als instrument voor hetmeten van taalontwikkeling. De correlatie tussen de twee delen van de RDLS, Ver-bal Comprehension (taalbegrip) en Verbal Expression (taalproductie) is hoog,namelijk .76. De correlaties tussen de RDLS subtests en de andere verbale (sub-)-tests zijn eveneens hoog (rond de .60), correlaties tussen de RDLS en niet-verbale(sub-)tests zijn matig hoog (rond de .40). De correlaties van de validatietests metde taalbegripsschaal zijn in de meeste gevallen iets hoger dan de correlaties met detaalproductieschaal.

Op de correlaties tussen de subtests van de tests die rond de vierde en de vijfdeverjaardag werden afgenomen, met uitzondering van de Stanford-Binet, werd eenfactoranalyse uitgevoerd. Er werden twee geroteerde factoren gevonden, diegezamenlijk 52% van de variantie verklaarden en die, gezien de ladingen van desubtests, als ‘verbale’ en ‘niet-verbale’ factor werden aangewezen. De ladingenvan de RDLS-subtests op de verbale factor horen met die van de ITPA-subtests totde hoogsten (respectievelijk .69 en .75 voor de begrips- en de expressieve schaal).De WPPSI-subtests hebben vrij lage ladingen op de verbale factor, evenals deFrostig-subtests en de Prediction Test of Articulation. Op de niet-verbale factorvertonen vooral de WPPSI-subtests en twee subtests van de Frostig hoge ladingen.De RDLS-subtests ( .50 voor de begripsschaal en .37 voor de expressieve schaal)en enkele PTI-subtests en enkele ITPA-subests vertonen matig hoge ladingen op

Page 4: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

122

de niet-verbale factor. De overige subtests van de Frostig, de PTI en de ITPA en dePredictieve Articulatietest tenslotte, laden vrij laag op de niet-verbale factor.Tenslotte worden in het artikel van Silva correlaties gegeven van de RDLS-sub-tests en de Stanford-Binet, afgenomen op vierjarige leeftijd, met de WISC, deWISC-subschalen en de Burt Word Reading Test, afgenomen op zevenjarige leef-tijd. De correlaties lagen tussen .47 en .72, de laagste correlaties waren, niet geheelconform de verwachting, die tussen de RDLS-delen en de Burt Word Reading Test(.47 voor taalbegrip en .49 voor taalproductie). Voor het overige zijn de correlatiesvan zowel de Stanford-Binet als de RDLS-delen met de WISC verbale schaal enmet de totale WISC vrij hoog (tussen .63 en .72) en de correlaties met de perfor-male schaal van de WISC wat lager (tussen .49 en .61). De correlaties van RDLStaalbegrip met de WISC-schalen zijn steeds iets hoger dan die van RDLStaalproductie. Gezien de lange tussentijd van drie jaar zijn de gevonden correlatiesvrij hoog te noemen.

Silva concludeert in zijn artikel dat de gevonden resultaten de validiteit van deRDLS als maat voor verbale vaardigheid ondersteunen, maar dat de RDLS ookonderliggende algemene mentale vaardigheden meet. Het gevonden resultaat pastbij de visie dat de taalontwikkeling niet onafhankelijk van de mentale ontwikkelingverloopt maar dat taalvaardigheid gezien moet worden als een onderdeel van deintelligentie.

Andere gegevens over de validiteit van de RDLS zijn te vinden bij Hagtvet enHagtvet (1990), die de discriminante validiteit van de begrips- en de productie-schaal van de RDLS onderzochten.

Hagtvet en Hagtvet maakten gebruik van de resultaten van het hierbovenbeschreven onderzoek van Silva en onderzochten de samenhang tussen begrips- enproductiesubtests van de ITPA (Kirk et al., 1968) met de receptieve en deproductieve subtests van de RDLS. In feite onderzochten Hagtvet en Hagtvet nietde ‘zuivere’discriminante validiteit, zoals besproken in 7.1, maar een van detussenvormen tussen discriminante en confirmerende validiteit (zie Figuur 7.1). Zijzochten naar een geringere samenhang tussen de RDLS-schalen taalbegrip entaalproductie dan de samenhang tussen begripstests onderling en tussenproductietests onderling. Dergelijke resultaten werden door Hagtvet en Hagtvetinderdaad gevonden

7.1.2 Taalontwikkeling in relatie tot cognitieve ontwikkeling

Omdat in het validiteitsonderzoek wordt nagegaan in hoeverre er sprake is vanconvergente dan wel discriminante validiteit van de RTB en de STP, zal eerst ietsgezegd worden over de wijze waarop twee relevante aspecten van de vroegkinder-lijke ontwikkeling - taalontwikkeling en cognitieve omwikkeling - zich verhouden.

Page 5: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

123

Hoe de samenhang tussen deze begrippen moet worden gezien, valt niet in éénwoord te zeggen en is in ieder geval sterk afhankelijk van de wijze waarop men be-grippen als taalontwikkeling en cognitieve ontwikkeling definieert.

In 2.3 is ‘taal’ gedefinieerd als een code waarmee ideeën over de wereldworden uitgedrukt door middel van een conventioneel systeem van communicatie-signalen. ‘Taalontwikkeling’ is dan het verwerven of leren van deze linguïstischecode of dit linguïstische systeem. Het gaat hierbij zowel om het leren kennen engebruiken van de gebruikte symbolen als om het leren van regels van het systeem.Zoals gezegd in Hoofdstuk 3 wordt in deze dissertatie niet ingegaan op de achter-liggende mechanismen van dit leren of verwerven.

Een zeer ruime definitie van ‘cognitie’ is te vinden bij Flavell (1985). VolgensFlavell zijn alle psychologische processen waarbij hogere mentale processen zijnbetrokken cognitief. Hij noemt onder andere kennis, intelligentie, denken,voorstellen, strategieën ontwikkelen, redeneren, probleem-oplossen, classificerenen symboliseren, maar ook waarnemen, geheugen, aandacht en leren en tenslotteallerlei vormen van sociale cognitie en communicatie. Hier wordt taalontwikkelinggezien als een onderdeel van de cognitieve ontwikkeling, waarbij kan wordenopgemerkt dat er ook duidelijk niet-talige aspecten zijn te onderscheiden aancognitie. Verwant hieraan is het onderscheid tussen meer verbale en meerperformaal-ruimtelijke cognitieve vaardigheden dat ten grondslag ligt aan veelintelligentietests, die hetzij een verbaal en een niet-verbaal deel hebben (bijvoor-beeld de WISC-R; Wechsler, 1974 ), hetzij specifiek gericht zijn op niet-verbaleintelligentie (bijvoorbeeld de SON-R 5½-17; Snijders, Tellegen & Laros, 1989 ende Progressive Matrices; Raven 1938).

De relatie tussen taal- en cognitieve ontwikkeling kan voorts beschrevenworden in termen van de richting waarin deze ontwikkelingsdomeinen elkaar be-ïnvloeden. Auteurs als Reynell (1980) en Slobin (1973) beschrijven onderliggende(vroege) cognitieve ontwikkelingsstappen die noodzakelijk zijn voor het leren vantaal. Flavell (1985) beschrijft de tegenovergestelde richting: de invloed van detaalontwikkeling op de (latere) cognitieve ontwikkeling. Wanneer de taalontwik-keling als een (meer of minder op zichzelf staand) onderdeel van de cognitieveontwikkeling wordt gezien zijn de hierboven genoemde elkaar beïnvloedendeprocessen alle cognitief te noemen.

Het vermogen om taal te leren (Language Acquisition Device, LAD; Chomsky,1957) wordt door sommige auteurs (bijvoorbeeld Chomsky, 1957) gezien als eenautonoom vermogen. Meer in overeenstemming met Flavell zijn auteurs als Meny-uk (1980) en Slobin (1973); zij zien het vermogen om taal te leren gerelateerd aanhet algemeen leervermogen. Ook opvattingen over taalpathologie (zie bijvoorbeeldGoorhuis-Brouwer, 1979; Schlichting, 1987 en Van Ierland, 1982), waartaalontwikkelingsstoornissen worden gekenmerkt door het achterblijven van detaalontwikkeling gezien de cognitieve ontwikkelingstand van een kind, passen bijdeze visie. Recente literatuur (Fletcher & Hall, 1992) neemt het bestaan aan van

Page 6: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

Wanneer in het volgende wordt gesproken van cognitietests dan wordt be-1

doeld: tests voor cognitieve ontwikkeling. In tegenstelling tot bij oudereproefpersonen, waar intelligentie wordt gemeten door een score op een intelli-gentietest wordt bij jongere kinderen intelligentie afgeleid van de cognitieveontwikkelingsstand die op een bepaald moment is bereikt, vergeleken met hetniveau van leeftijdsgenoten.

124

een aangeboren taalvermogen, ongeacht of dit taalvermogen autonoom is ofingebed in de algemene cognitieve ontwikkeling.

7.1.3 Vraagstelling

De vraag over het al dan niet autonoom zijn van de taalontwikkeling wordt in dezedissertatie niet beantwoord. Het voorafgaande diende om verwachtingen te kunnenformuleren omtrent de samenhang van diverse taal- en cognitieve ontwikke-lingstests of intelligentietests en tests op het gebied van andere1

ontwikkelingsdomeinen. Deze verwachtingen worden hier gepresenteerd.

1 Zonder te willen besluiten voor een strikt autonome taalontwikkeling kanworden verwacht dat er een sterke samenhang bestaat tussen scores opverschillende taaltests onderling. Deze samenhang is sterker dan de samenhangtussen scores op taaltests enerzijds en cognitieve tests anderzijds. Deze ver-wachting geldt ook wanneer taalontwikkeling louter zou worden gezien als eensubdomein van de cognitieve ontwikkeling. Scores uit éénzelfde domein vancognitieve ontwikkeling zullen meer samenhang vertonen dan scores uitverschillende domeinen van cognitieve ontwikkeling.

2 Tussen scores op cognitieve ontwikkelingstest en tests voor taalontwikkelingbestaat een vrij sterke positieve samenhang. De samenhang van taalscores metcognitieve tests met een verbaal karakter wordt verwacht sterker te zijn dan desamenhang van taalscores met niet-verbale cognitieve tests.

3 Tussen scores op taaltests en niet-verbale cognitieve ontwikkelingstestsbestaat een matige positieve samenhang.

4 Tussen scores op taaltests en ontwikkelingstests niet op het terrein van taal- ofcognitieve ontwikkeling bestaat een geringe positieve samenhang. Dezeverwachting wordt slechts aan de hand van enkele motorische subtestsonderzocht.

Dergelijke verwachtingen gelden zowel voor complete tests als voor deverschillende onderdelen of subtests daarvan. Samenhangend met het meer ofminder verbale karakter en met andere kenmerken van subtests kunnen dezeverwachtingen nog worden verfijnd. Het talige karakter van de subtests komt aan

Page 7: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

125

de orde in 7.2.3, na een beschrijving van de in het validatieonderzoek gebruiktetests en subtests.

7.2 OPZET

Zoals in hoofdstuk 3 is vermeld is het normeringsonderzoek van de Reynell Testvoor Taalbegrip en de Schlichting Test voor Taalproductie gecombineerd uitge-voerd met het normeringsonderzoek van de SON-R 2½-7 (Snijders-Oomen niet-verbale intelligentietest voor kinderen van tweeëneenhalf tot zeven jaar; Tellegen,Winkel & Wijnberg, 1996). Door de kostenbesparing die deze samenwerking metzich meebracht was het mogelijk een vrij uitgebreid validatieonderzoek te realise-ren, zowel ten behoeve van de RTB en de STP als ten behoeve van de SON-R 2½-7, door bij een groot deel van de kinderen uit de gemeenschappelijke nor-meringssteekproef verschillende validatietests af te nemen. De SON-R 2½-7 is eentest voor het meten van niet-verbale cognitieve ontwikkeling. Evenals voor de RTBen de STP zijn goede validatietests voor de SON-R 2½-7 taaltests en intelli-gentietests of cognitieve tests met zowel verbale als niet-verbale componenten.Vrijwel alle validatietests voor het leeftijdsbereik van deze tests zijn dan ookgemeenschappelijk gekozen. Voor de Reynell Test voor Taalbegrip en de Schlich-ting Test voor Taalproductie zijn de gekozen validatie-instrumenten:

- taaltests:de TVK: Taaltests voor Kinderen (Van Bon, 1982);de TARSP: Taal Analyse Remediëring en Screening Procedure. (Schlichting,1993);

- algemene cognitieve tests:de mentale schaal van de BOS 2-30: Bayley Ontwikkelingsschalen (Van derMeulen & Smrkovsky, 1983); de GOS: Groningse Ontwikkelingsschalen (Neutel, Van der Meulen & LutjeSpelberg, 1996);de RAKIT: Revisie Amsterdamse Kinder Intelligentie Test (Bleichrodt,Drenth, Zaal & Resing, 1984);

- niet-verbale tests:de SON-R 2½-7: Snijders-Oomen niet-verbale intelligentietests voor kinderenvan tweeëneenhalf tot zeven jaar (Tellegen, Winkel & Wijnberg, 1996);de BOS 2-30: Bayley Ontwikkelingsschalen; hiervan de niet-verbale mentaleschaal (Van der Meulen & Smrkovsky, 1987).

Page 8: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

Het schema van Carroll is een voorloper van het schema in paragraaf 2.2. Bij2

Carrol ontbreekt pragmatiek. Voorts vallen fonologie, morfologie en syntaxisonder ‘vorm’ en semantiek onder ‘inhoud’ in het schema van 2.2.

126

In de volgende paragraaf worden de validatietests beschreven. Per validatietestwordt iets gezegd over herkomst en theoretische achtergrond, en voor zoveraanwezig, over onderzoeksresultaten die verband houden met onderverdelingen inhet door de test gemeten begrip. Vervolgens wordt aangegeven welke onderdelenvan het instrument zijn gebruikt. Voor zover nodig worden deze onderdelen even-eens besproken.

7.2.1 Beschrijving van de validatietests

Taaltests

De Taaltests Voor Kinderen (TVK; Van Bon, 1982) zijn bedoeld voor het metenvan diverse componenten van de mondelinge taalvaardigheid van kinderen van viertot en met negen jaar. De TVK richt zich vooral op de grammaticale competentie,(niet op pragmatiek). Uitgaande van een schema, gebaseerd op Carroll (1968) zijntests voor de verschillende deelcompetenties van taal geconstrueerd. Het gaat omzowel receptie als productie van fonologische, morfologische, syntactische en se-mantische aspecten . Voor elke van deze deelcompetenties, met uitzondering van2

fonologische productie, bevat de TVK een of meer tests. Daarnaast zijn er nog eentweetal Auditieve Synthesetests (voor jongere en oudere kinderen) en eenWoordherkenningstest. Deze tests zijn niet in het schema van Carroll onder tebrengen maar zijn opgenomen in de testbatterij vanwege hun bruikbaarheid voorde predictie van leerprestaties en de diagnostiek van leerproblemen.

Op de normeringssteekproef van de TVK zijn factoranalyses uitgevoerd (Van Bon,1984) over twee delen van het leeftijdsbereik: het deelbereik van vier tot en metzes jaar en het deelbereik van zeven tot en met negen jaar. Daar slechts tweesubtests het gehele leefijdsbereik bestrijken was het niet zinvol de factoranalyseover de gehele steekproef uit te voeren. In tegenstelling tot de verwachting werd bijbeide groepen vooral een algemene factor gevonden. Bij de jongste groep werdenvier factoren gevonden, bij de oudste drie. Bij geen van beide groepen werd eenproductie- of receptiefactor gevonden. Behalve een morfologische factor bij beidegroepen en een vermoedelijk fonologische factor bij de oudste groep zijn er geendeelcomponenten-factoren gevonden. Bij de jongste groep werden afgezien van deal genoemde factoren twee subtestspecifieke factoren gevonden (de AuditieveSynthesetest en de Zinsbouw-Keuzetest).

Page 9: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

127

Voor het validiteitsonderzoek van de RTB en de STP zijn niet alle TVK-subtests bij het onderzochte leeftijdsbereik (viereneenhalf tot en met zeseneenhalfjaar) afgenomen. Omdat de afname van een complete TvK rond twee uur duurt,hetgeen in de totale onderzoeksopzet te lang was, moesten een aantal subtests ver-vallen. Dit betreft: 1) de fonologische subtests; fonologie wordt met de RTB en deSTP niet systematisch gemeten omdat hiervoor vooralsnog geen valideonderzoeksmethode bij jonge kinderen is ontwikkeld, 2) de subtests die voor een tebeperkt deel van het leefijdsbereik in het validiteitsonderzoek geschikt zijn, zoalsde Woordvormen-Beoordelingstest en de Zinsbouw-Beoordelingstest en 3) de Testvoor Verzwegen Betekenis.

Van de subtests die wel zijn afgenomen volgt nu een korte beschrijving. Tenzijanders aangegeven zijn de subtests over het gehele onderzochte leeftijdsbereik(viereneenhalf tot en met zeseneenhalf jaar) afgenomen.

De Woordenschat-Keuzetest is een test die de passieve kennis van woordenmeet in het onderzochte leeftijdsbereik. De taak voor de proefpersoon is om uit eenviertal tekeningen steeds die tekening aan te wijzen die het woord uitbeeldt dat detestleider juist heeft gezegd. In de Zinsbouw-Keuzetest moet de proefpersoon uittwee plaatjes datgene kiezen dat de door de testleider aangeboden zin correctweergeeft. Het gaat hierbij om het verbinden van de nodige conclusies over debetekenis aan de vorm van zinnen. In de Woordenschat-Productietest moeten doorde proefpersoon afbeeldingen worden benoemd door een begeleidend zinnetje aante vullen. Door deze procedure kunnen er meer woordklassen worden benoemd danenkel zelfstandige naamwoorden en werkwoorden. De Woordvormen-Productietestis bedoeld om na te gaan in hoeverre de proefpersoon in staat is van bepaaldewoorden bepaalde afleidingen correct te vormen. De elicitatieprocedure is alsvolgt. Door middel een plaatje dat vergezeld gaat van een enkelvoudige zin die ditplaatje beschrijft, wordt het om te vormen woord gepresenteerd. Vervolgens wordteen tweede afbeelding vertoond die door de testleider wordt beschreven in eenonvolledige zin. Deze zin moet worden voltooid door de proefpersoon, met hetbedoelde woord in de bedoelde vormklasse. In de Zinsbouw-Productietest,tenslotte gaat het om het onderzoeken van de kennis van de regels van zinsvormingbij de proefpersoon. Bij een plaatje wordt steeds een zin aangeboden, waarin hetplaatje op een niet correctie wijze wordt beschreven, bijvoorbeeld: tegengesteldeonderlinge relaties of handelingen dan op het plaatje te zien zijn. De proefpersoonmoet de vorm van de aanbodzin zodanig wijzigen, dat er zin ontstaat die het plaatjewèl goed beschrijft. Het begin van deze zin wordt door de testleider gegeven,hetgeen de taak eenvoudiger maakt.

De Taal Analyse Remediëring en Screenings Procedure (TARSP; Schlichting,1993) is geen test, maar een grammaticale analysemethode voor spontane taal. Hetinstrument is ontwikkeld naar het model van de LARSP (Language Assessment,Remediation en Screening Procedure; Crystal, Fletcher & Garman, 1976). De

Page 10: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

128

TARSP geeft een overzicht van de ontwikkeling van de syntaxis en de morfologiebij Nederlandse kinderen van één tot vier jaar. Met behulp van de TARSP wordtbepaald welke grammaticale ontwikkelingsfase - er worden voor het leeftijdsbereikvan de TARSP zeven fases onderscheiden - een kind heeft bereikt.

De gang van zaken is als volgt. Allereerst wordt een audio- of video-opnamegemaakt van de spontane taal van een kind, in een spelsituatie waarbij de (voor hetkind bekende) onderzoeker gericht is op communicatie met het kind. Dit ‘taalsam-ple’ wordt hierna uitgeschreven. Alle uitingen van het kind, behalve die waar hetkind zichzelf verbeterd heeft, valse starts, herhalingen, onverstaanbare uitingen en‘vaste uitdrukkingen’ worden vervolgens geanalyseerd. ‘Vaste uitdrukkingen’ zijnuitingen die géén of een vaste grammaticale structuur hebben en veel wordengebruikt, zoals bijvoorbeeld: ‘ja’, ’goede morgen’, ‘kijk eens’ en ‘tis-dat?’. Ermoeten tenminste veertig analyseerbare uitingen zijn verzameld om te bepalenwelke grammaticale fase een kind heeft bereikt. Elke te analyseren uiting wordtvervolgens geclassificeerd als behorende tot één van de zeven grammaticaleniveau’s, of fasen, op grond van in het analyse-systeem omschreven kenmerken. Inveel gevallen is het aantal gebruikte zinsdelen hiervoor bepalend. Daarna wordtberekend hoeveel van de uitingen in elke fase voorkomen. De hoogst voorkomendefase waarbij tenminste vijf procent van de uitingen bij die fase behoren, is degrammaticale fase van het kind.

Intelligentietests met verbale componenten

De Revisie Amsterdamse Kinder Intelligentietest (RAKIT; Bleichrodt, Drenth,Zaal & Resing, 1984) is een test voor het meten van intellectuele ontwikkeling vankinderen tussen viereneenhalf en zeveneneenhalf jaar, waarbij de test zowelbedoeld is voor het vaststellen van een algemeen intelligentieniveau als voor meerdifferentiele diagnostische doeleinden. Bij de constructie van de RAKIT hebben deauteurs nauw aangesloten bij de primaire factortheorie van Thurstone (PMA;Thurstone, 1938) als opvatting van intelligentie. De door hem geïdentificeerdefactoren Verbaal, Numeriek, Ruimtelijk, Perceptueel, Woordenrijkdom, Geheugen,en Abstract redeneren komen in veel testbatterijen (deels) voor.

Bij de RAKIT zijn factoranalyses op de leeftijdsgroepen van de ijkingssteek-proef uitgevoerd (Bleichrodt, Resing, Drenth & Zaal 1987). Er bleken tweeenigszins verschillende patronen te ontstaan bij de groep van 4;2 jaar tot en met5;2 jaar en de groep van 5;2 tot en met 11;2 jaar. Bij beide groepen werden vierfactoren gevonden. Bij de jongste groep zijn dit: 1) een verbale leer- en vlotheids-factor (de subtests Woordbetekenis, Namen leren, Ideeënproductie en Vertelplaat),2) een ruimtelijk-perceptuele redeneerfactor (Figuur herkennen, Exclusie,Doolhoven, Schijven en Verborgen Figuren), 3) een sequentiële geheugenfactor(Geheugenspan) en 4) een kwantiteitsfactor (Kwantiteit). Bij de oudere kinderenworden 1) een perceptuele redeneerfactor (de subtests van de tweede factor bij de

Page 11: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

129

jongste groep plus Analogieën), 3) een verbale factor (Woordbetekenis en Namenleren), 3) een ruimtelijke oriëntatie- en tempofactor (Doolhoven, Schijven enIdeeënproductie) en 4) een verbale vlotheidsfactor gevonden (Ideeënproductie enVertelplaat).

Ten behoeve van het validiteitsonderzoek van de RTB en de STP is, daar deafname van de totale RAKIT te lang zou duren in het bestek van de totaleonderzoeksopzet, niet de gehele RAKIT afgenomen, maar de verkorte vormhiervan (de RAKIT-V), aangevuld met enige subtests die verwantschap vertoondenmet subtests van de SON-R 2½-7. Er zijn twee versies van de RAKIT-V: één voorde jongste groep, de vierjarigen, en één voor de oudere groep, de vijf- tot en metelfjarigen. Bij het onderzochte leeftijdsbereik (viereneenhalf tot zeseneenhalf jaar)zijn beide versies gebruikt. De betrouwbaarheid van beide versies van de RAKIT-V is nauwelijks lager dan die van de volledige RAKIT. De subtests in de RAKIT-Vzijn die met de hoogste ladingen op de hierboven beschreven factoren. Deafgenomen subtests worden hier kort beschreven. Tevens wordt aangegeven bijwelke leeftijdsgroepen de subtests zijn afgenomen. Wanneer geen leeftijdsbereik isaangegeven is een subtest over het gehele onderzochte leeftijdsbereik (viereneen-half tot en met zeseneenhalf jaar) afgenomen.

Bij ‘Figuur herkennen’ (4;6 tot en met 5;0) moeten onvolledige tekeningen vanconcrete, alledaagse voorwerpen worden benoemd. De auteurs hebben ernaargestreefd de plaatjes hierbij zodanig te kiezen dat de woordkennis een minimale rolspeelt. Bij ‘Exclusie’ moet uit vier abstracte figuren datgene worden gekozen datniet voldoet aan een regel waar de andere drie figuren wel aan voldoen. Bij‘Woordbetekenis’ moet uit vier figuren één gekozen worden dat overeenkomt meteen door de testleider genoemd woord. Bij ‘Analogieën’ (6;0 en 6;6) moet viaanalogie-redeneren een woordpaar worden gevonden dat een vergelijkbare se-mantische relatie heeft als een gegeven woordpaar. Het woord dat het tweede paarcompleteert moet gevonden worden uit vier alternatieven. Bij ‘Kwantiteit’ (4;6 toten met 6;0) moet het kind vergelijking maken in aantal, volume, lengte, gewichtenzovoorts, aan de hand van afbeeldingen. Deze subtest is gebaseerd op de theorievan Piaget over de ontwikkeling van het conservatiebegrip. De subtest ‘Schijven’bestaat uit een pennenbord waarop drie lagen van negen schijven - met daarintwee, drie of vier gaatjes - over de pennen moeten worden geplaatst. Soms moetende schijven worden gedraaid. De score bestaat uit de tijd die het kind nodig heeftom alle schijven over de pennen te leggen. Bij ‘Namen leren’ (5;0 en ouder) wordteen reeks van twaalf plaatjes van dieren getoond, bij elk dier wordt een naamgenoemd, in sommige gevallen aangevuld met een korte uitleg. Hierna wordt dereeks dieren tweemaal aan het kind getoond, waarbij het kind dan gevraagd wordtde naam bij elk dier te noemen. Bij ‘Verborgen figuren’ (6;6 en ouder) moet hetkind steeds uit een complexe tekening een figuur terugvinden, uit zes bij detekening gegeven figuren. Bij ‘Ideeënproductie’ tenslotte, krijgt het kind op-drachten om binnen een bepaalde tijd zoveel mogelijk woorden, namen of situaties

Page 12: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

130

te noemen die behoren tot een vrij ruim omschreven categorie, bijvoorbeeld: ‘watkun je allemaal opeten?’

De Bayley Ontwikkelingsschalen (BOS 2-30; Van der Meulen & Smrkovsky,1983) vormen een test waarmee onder andere de mentale en motorische ontwik-keling van kinderen in de leeftijd van twee tot dertig maanden wordt gemeten. DeBOS 2-30 is een bewerking van de Bayley Scales of Infant Development (BSID;Bayley, 1969). De test bevat items voor zowel de mentale als de motorischeontwikkeling, voorts een gedragsobservatielijst en een achtergrondvariabelenlijst.

De Mentale Schaal dekt zowel de perceptuele als de cognitieve ontwikkeling ende taalontwikkeling en bestaat uit 163 items; de Motorische Schaal bestaat uit 81items. De items zijn gegroepeerd rond verschillende soorten testmateriaal. De afna-mevolgorde van de items ligt niet strikt vast; de testleider moet trachten de bestmogelijke testresultaten voor het kind te verkrijgen door de volgorde van de aan tepassen items aan te passen aan het reageren van het kind. Evenmin worden alleitems afgenomen, items die gezien het ontwikkelingsniveau van een kind duidelijkte gemakkelijk of te moeilijk zijn worden niet afgenomen. Hierbij zoekt detestleider per materiaalgroep van items de zogenaamde ‘ondergrens’ en boveng-rens’. De ondergrens is het hoogste itemniveau waarop het kind alle voorafgaande,makkelijker items uit de groep goed scoort of verondersteld wordt goed te scoren,de ondergrens is hoogste van een vast aantal opeenvolgende positieve items datonmiddellijk wordt gevolgd door een negatief gescoord item. De bovengrens is hetmoeilijkste item waarop het kind wordt geacht nog positief te scoren. Dit is hetmoeilijkste positief gescoorde item dat vooraf gaat aan een vast aantalopeenvolgende negatief gescoorde items. Gewoonlijk wordt de Mentale Schaalafgenomen voor de Motorische schaal, maar zonodig kunnen Mentale itemsworden afgewisseld met bepaalde Motorische items.

Bij het onderhavige onderzoek zijn niet alle items van de Motorische schaalafgenomen. De reden hiervoor was een praktische: de testleidsters voor ditonderdeel moesten op veel verschillende locaties steeds enkele kinderen testen (zie7.2.2), terwijl bepaald materiaal van de Motorische Schaal (de trap en de even-wichtsbalk) lastig te vervoeren is. Voor het overige is de gehele BOS 2-30afgenomen.

De Groningse Ontwikkelingsschalen (GOS, Neutel, Van der Meulen & LutjeSpelberg, 1996) vormen een test voor de cognitieve ontwikkelingsstand vankinderen in het leeftijdsbereik van tweeëneenhalf tot viereneenhalf jaar. De test iseen bewerking van de Kaufmann Assessment Battery for Children, (K-ABC; Kauf-mann & Kaufmann, 1983, 1983a), aangevuld met een tweetal subtests, die meergericht zijn op de motorische en perceptuele ontwikkelingsstand.

Het begrip ‘cognitie’ is bij dit instrument synoniem met intelligentie en wordtbeschreven in termen van de wijze waarop een kind informatie verwerkt en proble-

Page 13: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

131

men oplost. De GOS is gebaseerd op modellen voor informatieverwerking die zijnontleend aan de neuropsychologische en cognitiepsychologische modellen waarbijeen tweedeling in de wijze van informatieverwerking wordt voorgesteld. Bij deGOS wordt hierbij de terminologie van Luria (1966) gebruikt en wordt er gespro-ken van sequentiële en simultane informatieverwerking. De subtests in de GOSzijn georganiseerd rond deze twee manieren van informatieverwerking. De scoresop de simultane subtests worden gecombineerd tot een Simultane schaalscore, descores op de sequentiële subtests tot een Sequentiële schaalscore.

Simultane verwerking is die werkwijze die vraagt om een gestalt-achtige, dik-wijls ruimtelijke integratie van informatie om het gestelde probleem zo goed moge-lijk op te kunnen lossen. Sequentiële verwerking is vereist wanneer voor een zoeffectief mogelijke oplossing de informatie in een seriële of temporele volgordegeplaatst moet worden. Uit een onderzoek van Levy en Trevarthen (1976) komtnaar voren dat bij volwassenen de beide hersenhelften gespecialiseerde functieshebben wat betreft de verwerking: de linkerhemisfeer lijkt zich bezig te houden metsequentiële, seriële en tijdsafhankelijke verwerking en de rechterhemisfeer metholistische, ruimtelijke, tijdsonafhankelijke verwerking. De linkerhemisfeer is ookde hemisfeer waar zich bij de meeste mensen de taalcentra bevinden. In de handlei-ding van de K-ABC worden validiteitsgegevens met de WISC-R gepresenteerd. Desimultane schaal correleert iets hoger met de Performale schaal van de WISC-R,terwijl de sequentiële schaal iets hoger met de Verbale schaal correleert.

Zoals gezegd bestaat de GOS uit twee subschalen voor de beide wijzen vaninformatieverwerking: een Sequentiële en een Simultane schaal. De scores van eenkind op deze schalen kunnen worden gecombineerd tot een totale score: deCognitieve schaal. Deze indeling wijkt af van die van de K-ABC die naast de ge-noemde subschalen nog een Verworven Vaardigheden-schaal bevat, waarinfeitelijke kennis en verworven vaardigheden van een kind gemeten worden. Dezekennis is zowel afhankelijk van het cognitieve vermogen van het kind als van demogelijkheden die het kind heeft om leerervaringen op te doen. De VerworvenVaardigheden-subtests van de K-ABC correleren hoog met de Verbale schaal vande WISC-R. De auteurs van de GOS hebben de indeling van de subtests in driesubschalen niet gevolgd omdat, in tegenstelling tot bij de K-ABC, geenfactorstructuur werd gevonden die een dergelijke indeling rechtvaardigde. Slechtstwee factoren, een simultane en een sequentiële, werden gevonden bij de GOS, dieten opzichte van de K-ABC een beperkt leeftijdsbereik heeft (alleen de jongstekinderen). De Verworven Vaardigheden-subtests (Woordenschat, Gezichten &Plaatsen, Rekenen en Raadseltjes), die alle sterk verbaal van karakter zijn (zie ookFiguur 7.2). laadden alle hoog op de simultane factor, terwijl één verworvenheden-subtest (Rekenen) ook hoog laadde op de sequentiële schaal. Deze resultaten zijnniet in overeenstemming met het eerder genoemde patroon van correlaties van deK-ABC met de WISC-R, waar juist hogere samenhangen werden gevonden tussen

Page 14: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

132

verbale subtests en de sequentiële schaal. De toegevoegde motorische subtests vande GOS tenslotte, laadden met name hoog op de sequentiële factor.

Alle subtests van de GOS zijn in het validatieonderzoek afgenomen bij hetgehele onderzochte leeftijdsbereik van de GOS (van tweeëneenhalf tot en met vier-eneenhalf jaar), behalve de subtests Rekenen en Raadseltjes die vanaf drie jaar enDriehoeken en Woordvolgorde die vanaf vier jaar afgenomen worden. Van desubtests volgt nu, in volgorde van afname, een korte beschrijving. Achter de naamvan elke subtests wordt door middel van de afkortingen ‘SIM’ (Simultaan) en‘SEQ’ (Sequentieel) aangegeven tot welke verwerkingsschaal de subtest behoort.

Bij de Magische Schijf (SIM) moet het kind kijken naar een smalle spleet ineen schijf waar langzaam een plaatje achterlangs wordt geschoven. Het kind moethet plaatje herkennen en benoemen. Bij Gezichtsherkenning (SEQ) moet het kinduit een groep op een foto één of twee gezichten aanwijzen die hem voorafgaand opeen andere foto zijn getoond. Bij Handbewegingen (SEQ) moet het kind een seriebewegingen met de hand - met palm, vuist of zijkant van de hand op de tafel tikken- in de gegeven volgorde nadoen. De subtest Gestaltwaarneming (SIM) geeft hetkind de taak om de voorstelling op een onvolledige tekening herkennen en benoe-men. Bij Cijfers nazeggen (SEQ) moeten cijfferreeksen in de gegeven volgordeworden nagezegd. In de subtest Motorische Vaardigheden (SEQ) moet het kindonder andere vangen, springen, hinkelen en achteruit lopen. In de subtestDriehoeken (SIM) moet een voorbeeldfiguur met behulp van driehoeken met eenblauwe en een gele zijde worden nagelegd. Het kind moet bij Woordvolgorde(SEQ) een reeks plaatjes aanwijzen in de volgorde waarin deze door de testleiderzijn benoemd. Bij de subtest Woordenschat (SIM) moeten door het kind alledaagsevoorwerpen op foto’s worden benoemd. Bij Gezichten & Plaatsen (SIM) moetenbekende personen, begrippen of typetjes worden benoemd (bijvoorbeeld DonaldDuck en Ernie van Sesamstraat). Bij Figuren Natekenen (SEQ) moeten figuren intoenemende complexiteit (bijvoorbeeld streep, cirkel, rechthoek, driehoek) wordennagetekend. Bij Rekenen (SEQ) stelt de testleider over verschillende plaatjesvragen die betrekking hebben op rekenkundige vaardigheiden. Het kind moet dezevragen beantwoorden. Bij Raadseltjes (SIM), tenslotte, moet het kind een voor-werp of begrip noemen dat weergegeven wordt aan de hand van een aantal eigen-schappen van dit voorwerp of begrip, die door de testleider worden genoemd. Niet-verbale intelligentietests

De Snijders-Oomen niet-verbale intelligentietest voor kinderen van tweeëneenhalftot zeven jaar (SON-R 2½-7, Tellegen, Winkel en Wijnberg,1996) is een niet-verbale testreeks voor het meten van algemene intelligente. Het predikaat ‘niet-ver-baal’ houdt in dat er geen taken met een ‘talig’ karakter zijn, voorts bestaat er eennaast de normale, gesproken instructie een instructie door middel van gebaren, diedezelfde betekenis en een vergelijkbaar moeilijkheidsniveau heeft als de verbaleinstructie.

Page 15: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

133

De SON-R 2½-7 is een herziening van de Kleuter-SON (Snijders & Snijders-Oomen, 1975) en bestaat uit zes subtests. Inhoudelijk worden drie verschillendesoorten subtests onderscheiden: abstracte redeneertests (Categorieën enAnalogieën), concrete redeneertests (Puzzels en Situaties) en ruimtelijke tests(Mozaïeken en Patronen). Op grond van empirische bevindingen echter (principalecomponentenanalyse bij een groot aantal onderzoeksgroepen; Tellegen, Winkel,Wijnberg-Williams en Laros, 1998) is een indeling in twee soorten subtestsgemaakt. Er is sprake van performale subtests (Mozaïeken, Puzzels en Patronen)en van redeneer-subtests (Categorieën, Analogieën en Situaties). Bij de performalesubtests moet de oplossing al doende geconstrueerd worden, terwijl bij deredeneertests steeds een keuze moet worden gemaakt welke oplossing de juiste is.De subtestscores kunnen worden gecombineerd tot schaalscores (de Performale -en de Redeneerschaal). Validiteitsgegevens van de SON-R 2½-7 laten zien dat dePerformale Schaal duidelijk hoger correleert met performale onderdelen van andereintelligentietests, terwijl de Redeneerschaal duidelijk hoger correleert met verbaleonderdelen van intelligentietests en met taaltests. De auteurs van de SON-R 2½-7wijzen er echter op dat het hier gaat om een accentverschil, daar er een groteovereenkomst tussen de taken is; bij alle zes de subtests spelen zowel perceptueleen ruimtelijke aspecten als het redeneervermogen een rol.

Alle subtests bestrijken het totale leeftijdsbereik van de SON-R 2½-7. Behalvede subtest Patronen bestaan de subtests uit twee gedeelten die in materiaal eninstructie van elkaar verschillen. Het tweede deel bestaat uit moeilijker items enwordt steeds voorafgegaan door een voorbeeld. Nu wordt overgegaan tot een kortebeschrijving van de subtests.

Bij het eerste deel van de subtest Mozaïeken moeten met drie tot vijf rodevierkantjes eenvoudige mozaïekpatronen worden nagelegd in een kader. Bij hettweede deel zijn het gele, rode en rood-gele vierkantjes die in een kader moetenworden nagelegd. Bij het eerste deel van Categorieën moeten vier tot zes kaartjes,plaatjes van voorwerpen, worden gesorteerd op grond van het behoren van eenzelfde categorie. Bij het tweede deel moet het kind uit een kolom van vijf plaatjeser twee kiezen die het zelfde kenmerk vertonen als drie daaraan vooraf getoondeplaatjes. Deel één van de subtest Puzzels bestaat uit puzzels van drie stukjes diemoeten worden nagemaakt van een voorbeeldplaat, in een vierkant kader. Bij hettweede deel zijn er geen voorbeeldplaat en kader meer; drie tot zes puzzelstukjesmoeten tot een geheel worden gevormd. Bij Analogieën, deel één, moet het kinddrie tot vijf steentjes op vorm en/of kleur en/of grootte in twee bakjes sorteren,waarbij het kind zelf het sorteerprincipe moet vinden. Bij het tweede deel gaat hetom transformaties van geometrische figuren, waarbij het kind eenzelfde verande-ringsprincipe moet toepassen als de testleider zojuist heeft toegepast. Bij deel éénvan de subtests Situaties moet het kind steeds bij vier halve tekeningen de ontbre-kende helften leggen. Bij het tweede deel moeten ontbrekende stukjes bij incom-plete tekeningen worden gekozen, zodanig dat de getekende situatie logisch wordt

Page 16: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

134

gemaakt. Bij Patronen moet het kind voorgedrukte patronen natekenen, uit de lossehand of, bij de moeilijker items door het verbinden van stippen.

De niet-verbale versie van de BOS 2-30 (Van der Meulen & Smrkovsky, 1987) iseen aanpassing van de Mentale schaal (de standaardversie) van de in deze para-graaf reeds beschreven BOS 2-30 en is bedoeld om de niet taalgebonden cogni-tieve vaardigheden van kinderen in de leeftijd van twee tot dertig maanden temeten. De aanpassing bestond uit het verwijderen van elk item dat gekenmerktwordt door het horen of produceren van taal maar ook van geluiden. Het verwij-deren van items waarin geluiden moeten worden gehoord of geproduceerd had alsreden dat men door middel van deze aanpassing de test geschikt wilde maken voorafname bij dove kinderen. Voorts is bij de items met een verbale instructie dezegewijzigd in een pantomime instructie. Items waarbij de verbale instructie niet konworden omgezet in gebaren zijn verwijderd. De niet-verbale Mentale Schaalbestaat uit 113 items.

Ten behoeve van het validiteitsonderzoek van de RTB en de STP is de niet-verbale versie niet apart afgenomen, maar als onderdeel van de normale afnamevan de BOS 2-30. Bijgevolg zijn enkele items wellicht met verbale instructieafgenomen. Verwacht wordt dat dit geen invloed heeft op de testscore, om devolgende reden: wanneer een testleider namelijk het vermoeden heeft dat een kindde opdracht niet heeft begrepen, wordt deze herhaald, zonodig ondersteund metgebaren.

7.2.2 Mate van ‘taligheid’ van de verschillende subtests

Om de discriminante en convergente validiteit van de RTB en de STP te kunnenbepalen is het van belang om de subtests van de diverse validatiesubtests, los vangegeven indelingen of factorstructuren, te rangschikken naar de mate waarin taaleen rol speelt bij verschillende aspecten van de opdracht voor het kind.

Verbale vermogens kunnen benodigd zijn bij verschillende aspecten van eentestitem: bij de instructie, bij de aanbieding van de taak (stimulus), bij het uitvoe-ren van de taak en bij het geven van de gevraagde respons. Vooral de mate waarinde taak in de subtest een beroep doet op verbale vermogens lijkt op voorhand vanbelang bij het bepalen van het ‘talige’ karakter van een subtest. Voorzover stimu-lus en respons een beroep doen op verbale vaardigheden bestaat de mogelijkheiddat verbale vaardigheid de testscore ten dele bepaalt, ook wanneer de bedoeldevaardigheid niet verbaal van karakter is. De instructie lijkt in dit verband het minstvan invloed en wordt daarom verder niet onderzocht.

In Figuur 7.2 wordt het verbale karakter van de verschillende subtests van devalidatietests, en ter vergelijking ook van de RTB en de onderdelen van de STP,

Page 17: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

135

globaal aangegeven. Een plus in het schema wil zeggen dat de subtest of hetonderdeel voor een bepaald aspect een belangrijk beroep doet op verbale vermo-gens en een min geeft aan dat er niet of nauwelijks een beroep wordt gedaan opverbale vermogens. Voor de verschillende aspecten zijn de volgende beslisregelsgehanteerd:

1 Bij de stimulus wordt een plus gegeven wanneer de teststimulus enkel de vormheeft van iets dat wordt gezegd, door de testleider of met behulp van eencassettebandje of iets dergelijks, een plusmin wordt gegeven wanneer er visu-eel materiaal wordt gecombineerd met iets wat wordt gezegd en een min wordtgegeven wanneer alleen visueel materiaal wordt gebruikt;

2 Bij de taak wordt een plus gegeven voor duidelijk verbale taken als het doorhandelingen duidelijk maken dat een verbale opdracht is begrepen, het benoe-men van afbeeldingen en het vormen van woorden en zinnen. Een plusminwordt gegeven voor taken die niet primair verbaal zijn, maar waarbij verbaletaken een zodanige rol spelen dat ze medebepalend zijn voor de testprestatie.Dit geldt bijvoorbeeld voor alle taken waarbij benoemen een rol speelt maarook voor rekenvaardigheden waarbij kennis van begrippen noodzakelijk is. Deresterende subtests zijn in twee verschillende soorten te verdelen, namelijk:subtests waarbij, ofschoon benoemen niet noodzakelijk is, het waarschijnlijk isdat het intern verwoorden (c.q. benoemen) een positief effect heeft op detestscore. Deze krijgen een enkele min-score. Subtests waarbij het onwaar-schijnlijk is dat intern verwoorden een belangrijke invloed heeft op de testscorekrijgen een dubbele min-score.

3 Bij de respons wordt een plus gegeven als het kind iets moet zeggen in ant-woord op de testtaak, een min wordt gegeven als het kind dit niet hoeft te doen.

Page 18: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

136

stimulus taak respons

RTB: TaalbegripSTP: ZinsontwikkelingSTP: WoordontwikkelingSTP: Auditief geheugenSTP: Lexilijst

TVK: Woordenschat-productietest 1TVK: Woordvormen-productietestTVK: Zinsbouw-productietestTVK: Woordenschat-keuzetestTVK: Zinsbouw-keuzetest

GOS(SEQ): HandbewegingenGOS(SEQ): Cijfers nazeggenGOS(SEQ): WoordvolgordeGOS(SEQ): Motorische vaardigheidGOS(SEQ): Figuren natekenenGOS(SEQ): Rekenen

GOS(SIM): Magische schijfGOS(SIM): GezichtsherkenningGOS(SIM): GestaltwaarnemingGOS(SIM): DriehoekenGOS(SIM): WoordenschatGOS(SIM): Gezichten & Plaatsen GOS(SIM): Raadseltjes

±±±+±

±+±±±

-+±--±

------+

+++±+

+++++

-- - - -- -- ±

±-±--++±

-++++

+++--

-+---+

+-+-+++

RAKIT: Figuur herkennen RAKIT: ExclusieRAKIT: Woordbetekenis RAKIT: AnalogieënRAKIT: KwantiteitRAKIT: SchijvenRAKIT: Namen lerenRAKIT: Verborgen figurenRAKIT: Ideeënproductie

SON-R 2½-7 Mozaïeken SON-R 2½-7 CategorieënSON-R 2½-7 PuzzelsSON-R 2½-7 AnalogieënSON-R 2½-7 SituatiesSON-R 2½-7 Patronen

--±+±-±-+

------

±-+±±-+-±

--------

+-----+-+

------

Figuur 7.2 Verbaal karakter van stimulus, taak en respons bij de RTB, onderdelenvan de STP en validatiesubtests

Page 19: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

137

Niet opgenomen in Figuur 7.2 zijn de Mentale Schaal en de niet-verbale MentaleSchaal van de BOS 2-30. Deze schalen bestaan uit een groot aantal items, dieverschillen in aanbiedingswijze, inhoud en gevraagde reactie van het kind.

Uit Figuur 7.2 komt naar voren dat de taken van de subtests van de TVK, de RTBen de onderdelen van de STP, met uitzondering van Auditief geheugen primair eenberoep doen op ‘talige’ vermogens. Dit geldt ook voor de GOS-subtests Woor-denschat en Gezichten & Plaatsen en de RAKIT-subtests Woordbetekenis enNamen leren. Dat Auditief Geheugen geen taalontwikkeling meet kwam ook inhoofdstuk 4 al aan de orde. Subtests waarbij verbale, naast andere vermogens eenrol spelen zijn de GOS-subtests Magische schijf, Gestaltwaarneming, Rekenen enRaadseltjes en de RAKIT-subtests Figuur herkennen, Analogieën, Kwantiteit enIdeeënproductie. De resterende subtests doen niet een zodanig beroep op verbalevermogens dat deze noodzakelijk zijn voor het correct reageren door het kind ophet testitem.

De stimulus is louter verbaal van aard bij de subtests Auditief geheugen (STP),Woordvormen-productietest (TVK), Cijfers nazeggen en Raadseltjes (beide GOS)en Analogieën en Ideeënproductie (RAKIT). Een gecombineerde stimulus hebbende testonderdelen Zinsontwikkeling en Woordontwikkeling van de STP, de RTB,de subtests Woordenschat-productietest, Zinsbouw-productietest, Woordenschat-keuzetest en Zinsbouw-keuzetest van de TVK, de subtests Woordvolgorde enRekenen van de GOS en de subtests Woordbetekenis, Kwantiteit en Namen lerenvan de RAKIT. Bij de resterende subtests is de aanbiedingswijze alleen visueel.

De onderdelen van de STP en de productieve subtests van de TVK vereiseneen verbale respons van het kind; bij de receptieve subtests van de TVK en bij deRTB wordt een niet-verbale respons gevraagd. Een verbale respons wordt ge-vraagd bij de GOS-subtests Cijfers nazeggen, Rekenen, Magische schijf,Woordenschat, Gezichten & Plaatsen en Raadseltjes en bij de RAKIT-subtestsFiguur herkennen, Namen leren en Ideeënproductie. Bij de overige subtests in 7.1wordt een niet-verbale respons gevraagd.

Het is niet verwonderlijk dat bij geen van de subtests van de SON-R 2½-7, diein opzet niet-verbaal is, sprake is van een verbale aanbieding of een verbalerespons. Ook in de taken bij de subtests van de SON-R 2½-7 spelen verbalevermogens geen noodzakelijke rol. Er kan echter worden verondersteld dat ‘internverwoorden’ bij bijvoorbeeld de subtests Categorieën, Analogieën en Situaties weleen positief effect zou kunnen hebben op het testresultaat.

Ook ten aanzien van enkele subtests in andere validatietests waar verbalevaardigheid niet noodzakelijk is voor het behalen van een positieve score, kanworden verondersteld dat verbale vaardigheid toch wel een positief effect kan heb-ben op het resultaat. Dit geldt bijvoorbeeld voor Auditief Geheugen van de STP,voor Cijfers Nazeggen en Woordvolgorde van de GOS en voor Verborgen figurenvan de RAKIT.

Page 20: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

138

7.2.3 Steekproeven en werkwijze

Zoals in hoofdstuk 3 en in 7.2. is vermeld is de normeringssteekproef getrokken insamenwerking met het project dat de ontwikkeling en de normering van de SON-R2½-7 (Tellegen, Winkel & Wijnberg, 1996) tot doel had. Bij de kinderen uit hetgemeenschappelijke deel van de steekproef (zie paragraaf 3.3.4) zijn eerst de Rey-nell Test voor Taalbegrip en de Schlichting Test voor Taalproductie en een halfjaar later de SON-R 2½-7 afgenomen. Bij een deel van deze kinderen is, ter valida-tie van zowel de RTB en de STP als de SON-R 2½-7, een ‘derde’ test afgenomen;één van de in 7.2.1 beschreven validatietests. De afnames van de validatietestsvonden plaats rond 3 maanden na de RTB/STP afname. Om de proefpersonen nietmeer dan noodzakelijk te belasten is gekozen voor een maximaal aantal testafna-mes per proefpersoon van drie (de RTB en de STP worden hierbij samen als ééntest gerekend).

De verdeling van de proefpersonen over de validatietests en de aantallen proef-personen per leeftijdsgroep bij de validatietests worden gegeven in Tabel 7.1.Opgemerkt moet worden, dat de leeftijdsgroepen gelden voor de eerste afnamesvan de RTB en de STP; bij de afnames van de BOS 2-30, de GOS, de RAKIT, deTVK en de TARSP zijn de geteste kinderen rond drie maanden ouder geworden,bij de afnames van de SON-R 2½-7 zijn de kinderen rond zes maanden oudergeworden. Omdat niet bij alle leeftijdsgroepen dezelfde (validatie-)subtests zijnafgenomen worden voorts ten behoeve van de interpretatie van de gegevens inBijlage 7 de aantallen proefpersonen per combinatie van de validatie-subtests metRTB en onderdelen van de STP gegeven.

De afnameplaatsen van de validatietests zijn dezelfde locaties als die bij deafname van de RTB en de STP (zie 3.5.1). De TARSP is echter bij voorkeur bijhet kind thuis afgenomen. Met uitzondering van de BOS 2-30 en de TARSP namde testleider die bij een kind de RTB en de STP afgenomen had, ook devalidatietest en de SON-R 2½-7 af bij dit kind. Voor het afnemen van de BOS 2-30 zijn een viertal ‘specialisten’ ingezet. De reden hiervoor is dat het lerenafnemen van de, geccompliceerde, BOS 2-30 een te grote tijdsinvestering zou zijnvoor de testleiders in het bestek van de onderzoeksopzet. Ook voor de TARSP zijnspecialisten ingezet, in ieder geval voor het uitwerken van de grammaticaleanalyse. Dit omdat ook het leren uitwerken van de grammaticale analyse teveelbeslag zou leggen op de beschikbare tijd van de reguliere testleiders. In het middenvan het land is daarbij het benodigde taalsample ook opgenomen door TARSP-specialisten. Omdat voor de TARSP vereist is dat het taalsample wordt opgeno-men door iemand die het kind al kent, bezochten de specialisten, om kennis temaken met hun proefpersonen, dezen een week van tevoren en namen bij diegelegenheid de Reynell Test voor Taalbegrip af. In de noordelijke provincies is

Page 21: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

139

voor de TARSP de volgende procedure gehanteerd: het taalsample werd opgeno-men door de eigen testleider; de analyses werden uitgevoerd door de specialisten.

Tabel 7.1 Aantallen afgenomen validatietests per normgroep

validatietests

norm- SON-R BOS GOS RAKIT TVK TARSPgroep 2½-7 2-30

15 mnd 3 4 - - - -21 mnd 61 31 - - - 427 mnd 59 23 10 - - 1133 mnd 52 - 8 - - 839 mnd 54 - 14 - - 1345 mnd 53 - 13 14 14 851 mnd 52 - 12 15 12 457 mnd 63 - 1 16 17 -63 mnd 63 - - 18 17 -69 mnd 58 - - 15 17 -75 mnd 56 - - 18 14 -

totaal 574 58 58 96 91 47

7.3 RESULTATEN

De resultaten van het onderzoek naar de begripsvaliditeit van de RTB en de STPvallen uiteen in verschillende soorten, die in het navolgende achtereenvolgenszullen worden gepresenteerd en besproken. Het gaat om de samenhang van detestscores met de leeftijd, de samenhang van de onderlinge testscores van de RTBen de STP en de samenhang van de testresultaten met de validatietests en -subtests.Hierna wordt de relatie van de testscores met de diagnose taal-ontwikkelingsstoornis gepresenteerd en besproken. Tenzij anders vermeld zijn bijalle tests de berekeningen op standaardscores gebaseerd, zowel op test- als opsubtestniveau.

Aan het eind van deze paragraaf zullen nog enige opmerkingen worden gewijdaan de predictieve validiteit.

7.3.1 Samenhang met leeftijd, geslacht en sociaal economische status

Page 22: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

140

Voor een ontwikkelingstest is het een eerste vereiste dat de ruwe scores eenpositieve samenhang met leeftijd vertonen. Uit de Tabellen 6.1 tot en met 6.5, waarvan de testonderdelen onder andere de gemiddelde ruwe scores per leeftijdsgroepworden gegeven (zie ook Figuur 5.1 tot en met 5.4), blijkt dat voor alletestonderdelen aan deze eis is voldaan. Gegeven dat ook in de hoogste normgroepde gemiddelden ruim onder de maximumscores van de onderdelen liggen, kangezegd worden dat de testonderdelen ook in hogere leeftijdsgebieden nog vol-doende discrimineren.

Uit de literatuur is genoegzaam bekend dat op het gebied van taalontwikkelingmeisjes gemiddeld een iets snellere ontwikkeling doormaken en dat ook detaalontwikkeling van kinderen met een verschillende sociaal-economischeachtergrond verschilt (zie bijvoorbeeld McCarthy, 1954; Kohnstamm & Sanavro,1983; Verhulst-Schlichting, Morelli-Kayser & Peddemors-Boon, 1987).

In Tabel 7.2 worden van de RTB en de onderdelen van de STP de gemiddeldestandaardscores per geslacht en per SES-score gegeven. De SES-score van elkeproefpersoon is bepaald op basis van het opleidingsniveau van de ouders, waarbijhet hoogste opleidingsniveau van beide ouders is genomen. Deze opleiding isingedeeld in een drietal klassen ‘laag’, ‘midden’ en ‘hoog’, waarbij de categorieënuit 3.5.2 als volgt zijn samen genomen. De klasse ‘laag’ wordt gevormd door decategorie lager niveau; de klasse ‘midden’ door de categorieën uitgebreid lager enmiddelbaar niveau en de klasse ‘hoog’ door de categorie semi-hoger en hogeropleidingsniveau.

Tabel 7.2 laat zien dat bij alle onderdelen sprake is van een iets hogeregemiddelde score bij de meisjes dan bij de jongens. De verschillen tussen jongensen meisjes bij TB, ZO en de Lexilijst zijn significant (" < .01 bij éénzijdige toet-sing; t-toets voor onafhankelijke steekproeven), die bij WO en AG niet.Verschillen tussen SES-klassen zijn met name te vinden bij TB, ZO en WO. Dezeverschillen zijn alle significant (éénweg variantieanalyse; p<.01). Er zijn geensignificante verschillen tussen SES-klassen gevonden bij Auditief Geheugen en bijde Lexilijst.

7.3.2 Samenhang van de onderdelen onderling

Om na te gaan hoe de scores op de onderdelen van de RTB en de STPsamenhangen, zijn per leeftijdsgroep en over de totale normeringssteekproefproduct-moment correlaties tussen de standaardscores berekend. Deze wordengepresenteerd in Tabel 7.3.Uit Tabel 7.3 komt naar voren dat de correlaties tussen de onderdelen TB, ZO enWO hoog zijn, met een gemiddelde waarde van .62. Een uitzondering vormt dejongste leeftijdsgroep met een correlatie TB-ZO van .25. Hier is vermoedelijksprake van een bodemeffect. De hoogste correlaties bij alle andere leeftijdsgroepen

Page 23: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

141

zijn die tussen Taalbegrip en Woordontwikkeling. Voor de totale groep bedraagtdeze correlatie .67. Iets lager zijn de correlaties tussen de STP-onderdelenZinsontwikkeling en Woordontwikkeling, (.62 voor de totale groep) en decorrelaties tussen Taalbegrip en Zinsontwikkeling (.60 voor de totale groep).

Tabel 7.2 Gemiddelden (en standaarddeviaties) per geslacht en SES-klasse. (N: hetaantal proefpersonen waarvan SES-gegevens bekend zijn).

SES-klasse jongens meisjes totaal N

gem. s.d. gem. s.d. gem. s.d.

TB laag 94.3 15.1 96.0 15.6 95.2 15.3 154midden 97.6 14.2 100.2 13.4 98.9 13.9 486hoog 103.7 14.7 106.7 13.1 105.2 13.9 308

totaal 99.1 14.9 101.6 14.2 100.3 14.6 948

ZO laag 94.0 13.0 98.7 13.7 96.4 13.5 142midden 97.2 14.1 100.8 13.7 99.1 14.0 435hoog 102.4 15.3 105.7 14.7 104.0 15.1 278

totaal 98.3 14.6 102.0 14.2 100.2 14.5 855

WO laag 92,4 13.5 96.4 12.8 94.5 13.2 153midden 98.2 13.6 100.2 12.5 99.2 13.1 478hoog 105.3 14.8 105.2 13.7 105.2 14.2 307

totaal 99.7 14.7 101.1 13.3 100.4 14.0 938

AG laag 96.9 11.3 100.8 12.8 99.1 12.3 66midden 98.8 16.0 100.9 14.8 99.9 15.4 183hoog 101.3 14.9 101.2 14.3 101.3 14.5 116

totaal 99.4 14.9 100.9 14.2 100.2 14.6 365

LL laag 103.0 17.3 99.3 17.7 100.8 16.7 10midden 94.3 14.9 105.5 15.9 100.2 16.3 40hoog 95.3 9.2 109.4 11.8 101.8 12.5 28

totaal 95.6 13.1 105.9 15.0 100.9 14.9 78

Tabel 7.3 Correlaties tussen de onderdelen per normgroep en over het totaal (gebaseerd op standaardscores; n=1049)

Page 24: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

142

combinatie normgroep (leeftijd in maanden)vanonderdelen 15 21 27 33 39 45 51 57 63 69 75 tot.

TB-ZO - .47 .58 .56 .70 .75 .66 .63 .56 .63 .42 .60TB-WO .25 .48 .74 .66 .81 .77 .73 .69 .64 .69 .66 .67TB-AG - - - .37 .47 .47 .40 .44 - - - .44

ZO-TB - .47 .58 .56 .70 .75 .66 .63 .56 .63 .42 .60ZO-WO - .59 .62 .68 .65 .67 .59 .67 .55 .57 .51 .62ZO-AG - - - .35 .48 .55 .38 .50 - - - .47

WO-TB .25 .48 .74 .66 .81 .77 .73 .69 .64 .69 .66 .67WO-ZO - .59 .62 .68 .65 .67 .59 .67 .55 .57 .51 .62WO-AG - - - .26 .41 .53 .38 .39 - - - .41

AG-TB - - - .37 .47 .47 .40 .44 - - - .44AG-ZO - - - .35 .48 .55 .38 .50 - - - .47AG-WO - - - .26 .41 .53 .38 .39 - - - .41

LL-TB - .42 - - - - - - - - - .42LL-ZO - .64 - - - - - - - - - .64LL-WO - .72 - - - - - - - - - .72

De correlaties van TB, ZO en WO met Auditief Geheugen zijn over het algemeenduidelijk lager (respectievelijk over de totale groep .44, .47 en .41, gemiddeld overalle leeftijdsgroepen respectievelijk .43, .45 en .39) dan de correlaties tussen TB,ZO en WO onderling. Aangezien dit onderdeel ook niet is bedoeld omtaalontwikkeling te meten (zie 4.2.5), is dit resultaat conform de verwachting.

De Lexilijst blijkt de hoogste correlaties te vertonen met ZO en WO (respec-tievelijk .64 en .72). De correlatie van de Lexilijst met TB is matig hoog (.42).

Het gevonden patroon van correlaties (de correlaties van de TB, ZO en WOzijn hoog maar niet zeer hoog - de correlaties met AG zijn matig hoog) komt goedovereen met de opzet van de instrumenten. TB, ZO en WO meten taalontwikke-ling, maar er worden verschillende aspecten van de taalontwikkeling gemeten. AGmeet niet direct taalontwikkeling maar auditief geheugen voor losse woordjes. Degevonden resultaten steunen de validiteit van de RTB en de STP.

Page 25: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

143

7.3.3 Relatie met validatietests

Belangrijke informatie omtrent de validiteit van de RTB en de STP wordt geleverddoor de gegevens omtrent de relatie met de afgenomen validatietests. In Bijlage 8worden product-moment correlaties tussen standaardscores op de RTB, deonderdelen van de STP en de validatietests gegeven. In Bijlage 9 wordenvervolgens de correlaties met de validatie-subtests gegeven.

Omdat de betrouwbaarheid van een test invloed heeft op de hoogte van de cor-relatie van de testscore met een andere variabele en de betrouwbaarheden van deafgenomen onderdelen of subtests van elkaar verschillen wordt het interpreterenvan de correlaties bemoeilijkt. Verschillen in correlaties kunnen niet alleenveroorzaakt worden door een verschil in samenhang tussen verschillendecombinaties van variabelen, maar ook door verschillen in betrouwbaarheid van degebruikte instrumenten. Het probleem dat meetfouten de correlatie verlagen wordtdoor Nunnally (1967) ‘attenuatie’ genoemd.

Om dit probleem op te lossen zijn correcties voor onbetrouwbaarheid van debetreffende tests, onderdelen of subtests toegepast op de correlaties uit Bijlage 8en Bijlage 9, volgens de formule voor attenuatiecorrectie van Nunnally (1967, p.204). De gecorrigeerde correlaties tussen de RTB, de onderdelen van de STP en detotaalscores op de validatietests worden gegeven in Tabel 7.4. De gecorrigeerdecorrelaties van de scores op de RTB en de onderdelen van de STP met de scores opde validatie-subtests worden gegeven in Tabel 7.5, evenals de gecorrigeerdecorrelaties tussen de RTB en STP-onderdelen onderling.

Tabel 7.4 Correlaties tussen de onderdelen van de RTB en de STP en de validatietests(gecorrigeerd voor onbetrouwbaarheid)

TB ZO WO AG LL

TaaltestsTVK, gemiddeld

Algemene cognitieve testsBOS 2-30: Mentale SchaalGOS: Cognitieve SchaalGOS: Simultane SchaalGOS: Sequentiële SchaalRAKIT: Totaal IQ

Niet-verbale cognitieve testsSON-R 2½-7: Totaal IQBOS 2-30: MS Nietverbaal

.78 .63 .77 .33 -

.53 .47 .56 - .74

.69 .56 .84 .48 -

.69 .53 .81 .38 -

.47 .39 .61 .53 -

.58 .57 .62 .12 -

.52 .42 .61 .31 .65

.39 .46 .48 - .70

Page 26: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

144

Wanneer de gemiddelde correlaties van TB, ZO en WO met de algemenecognitieve test worden vergeleken met de correlaties van deze onderdelen met degemiddelde TVK-score en onderling, dan kan worden geconcludeerd dat decorrelaties tussen de taaltests hoger zijn dan de correlaties van TB, ZO en WO metde algemene cognitieve tests (verwachting 1 van 7.1.3). Op het niveau van deindividuele tests zijn er een tweetal afwijkingen van deze verwachting. DeCognitieve en de Simultane schaal van de GOS vertonen beide een iets hogerecorrelatie met Woordontwikkeling (respectievelijk .80 en .81) dan de TVK (.77).Bij Taalbegrip en Zinsontwikkeling worden geen afwijkingen gevonden. Degenoemde afwijkingen zijn niet ernstig genoeg om te concluderen dat de validiteitvan de STP hiermee in het geding zou zijn. Opvallend is, dat de correlaties van TB,ZO en WO met de Simultane schaal van de GOS duidelijk hoger zijn dan die metde Sequentiële schaal, terwijl deze laatste juist een hogere correlatie heeft met AG.Deze resultaten komen overeen met de in 7.2.1 genoemde resultaten met de GOSen spreken evenals de laatstgenoemde resultaten het in 7.2.1 genoemde correlatie-patroon van de K-ABC met de WISC-R tegen.

Uit Tabel 7.4 komt verder naar voren dat de (gecorrigeerde) correlaties vanTaalbegrip, Zinsontwikkeling en Woordontwikkeling met de algemene cognitievetests (met uitzondering van de Sequentiële schaal van de GOS) gemiddeld hogerzijn dan de correlaties met de niet-verbale cognitieve tests. Dit geldt in de minstemate voor ZO, waar de gemiddelde correlatie met de algemene tests .49 is en degemiddelde correlatie met de niet-verbale test .44. De gemiddelde correlatie van dealgemene tests met WO is vrij hoog (.69) terwijl de gemiddelde correlatie van deniet-verbale tests met WO matig (.50) is. Een vergelijkbaar patroon met iets lagerecorrelaties wordt gevonden bij TB (met algemene tests gemiddeld .57 en met niet-verbale tests gemiddeld .46). Auditief geheugen vertoont lage correlaties metzowel algemene cognitieve tests als met de SON-R 2½-7. Gemiddeld over alletests bedraagt de correlatie van AG .36. De hoogste correlatie van AG wordtgevonden met de Sequentiële schaal van de GOS. Dit resultaat is niet verassendgezien de overeenkomst in het karakter van de taak (series nazeggen) van demeeste sequentiële subtests met Auditief Geheugen. De Lexilijst vertoont vooralvrij hoge correlaties met de beide BOS 2-30 scores, waarbij de correlatie met detotale BOS 2-30 met .74 iets hoger is dan de correlatie met de niet-verbale score(.70). Met de totaalscore van de SON 2½-7 (IQ) is de correlatie van de Lexilijstook tamelijk hoog (.65).

Samenvattend kan uit Tabel 7.4 zonder bewaar worden geconcludeerd dat detweede verwachting in 7.1.3 uitkomt. De correlaties van de onderdelen van de RTBen de STP die taalontwikkeling meten (TB, ZO, WO en LL) vertonen hogerecorrelaties met algemene dan met niet-verbale cognitieve tests.

Tenslotte kan ten aanzien van Tabel 7.4 worden gesteld dat de correlaties metde niet-verbale tests weliswaar tot de laagste behoren, maar toch hoger zijn dan

Page 27: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

145

werd verwacht in 7.1.3 (verwachting 3). Dit geldt zowel voor de correlaties met deBOS 2-30 als die met de SON 2½-7.

Tabel 7.5 Correlaties tussen validatiesubtests en onderdelen van de RTB en de STP(gecorrigeerd voor onbetrouwbaarheid)

TB ZO WO AG LL

RTB: Taalbegrip - .68 .75 .50 .45STP: Zinsontwikkeling .68 - .72 .55 .70STP: Woordontwikkeling .67 .72 - .47 .78

TVK: Woordenschat-productietest 1 .83 .64 .90 .43 - TVK: Woordvormen-productietest .72 .66 .70 .38 - TVK: Zinsbouw-productietest .62 .58 .51 .12 - TVK: Woordenschat-keuzetest .69 .44 .69 .36 - TVK: Zinsbouw-keuzetest .51 .31 .43 .10 -

GOS(SEQ): Handbewegingen .21 .19 .35 .41 - GOS(SEQ): Cijfers nazeggen .35 .43 . 34 .59 - GOS(SEQ): Woordvolgorde .61 .30 .72 .27 - GOS(SEQ): Motorische vaardigheid .09 .12 .12 .03 - GOS(SEQ): Figuren natekenen .14 .19 .18 .57 - GOS(SEQ): Rekenen .53 .37 .65 .24 -

GOS(SIM): Magische schijf .36 .23 .54 .21 - GOS(SIM): Gezichtsherkenning .16 .13 -.02 .16 - GOS(SIM): Gestaltwaarneming .53 .37 .68 .27 - GOS(SIM): Driehoeken .65 .57 .65 .42 - GOS(SIM): Woordenschat .70 .53 .85 .14 - GOS(SIM): Gezichten & Plaatsen .68 .62 .88 .59 - GOS(SIM): Raadseltjes .76 .56 90 .32 -

RAKIT: Figuur herkennen .10 .10 .21 -.04 - RAKIT: Exclusie .54 .58 .47 .26 - RAKIT: Woordbetekenis .40 .46 .63 .09 - RAKIT: Analogieën .22 .40 .35 - - RAKIT: Kwantiteit .49 .39 .56 .26 - RAKIT: Schijven .52 .48 .40 .11 - RAKIT: Namen leren .66 .50 .62 - - RAKIT: Verborgen figuren .40 .48 .51 - - RAKIT: Ideeënproductie .31 .06 .24 -.12 -

SON-R 2½-7 Mozaïeken (P) .44 .35 .43 .28 .37SON-R 2½-7 Categorieën (R) .44 .39 .44 .22 .67SON-R 2½-7 Puzzels (P) .38 .30 .40 .18 .37SON-R 2½-7 Analogieën (R) .40 .30 .36 .26 .40SON-R 2½-7 Situaties (R) .39 .29 .42 .27 .62SON-R 2½-7 Patronen (P) .39 .31 .33 .25 .51

Page 28: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

146

Ook op het niveau van validatie-subtests (Tabel 7.5) wordt een patroon van(gecorrigeerde) correlaties gevonden dat redelijk overeenkomt met de verwach-tingen. De eerste in 7.3.1 geformuleerde verwachting (hogere correlaties tussentaaltests onderling dan tussen taaltests en algemene cognitietests) komt in grote lij-nen uit. Bepaalde subtests van de TVK en van de Simultane schaal van de GOSgeven echter een van de verwachting afwijkend patroon te zien. Zo geeft vooral deZinsbouw-keuzetest van de TVK matig lage correlaties te zien. Hiervan is decorrelatie met TB (.51) nog tamelijk hoog, maar de correlaties met WO en vooralZO (respectievelijk .43 en .31) zijn aan de lage kant. De correlatie met AG (.10) iszeer laag, maar dit onderdeel van de STP is ook niet bedoeld om er taal mee temeten. Voorts wordt bij de Woordenschat-keuzetest een matig lage correlatie metZO gevonden terwijl de Zinsbouw-productietest een vrij lage correlatie met WOvertoont. Omgekeerd geven bepaalde GOS subtests hoge correlaties (meer dan.60) met één of meer van de onderdelen van de RTB en de STP die taalontwikke-ling meten (TB, ZO, WO). Het gaat hierbij om twee Sequentiële (Woordvolgordeen Rekenen) en vijf Simultane subtests (Gestaltwaarneming, Driehoeken,Woordenschat, Gezichten & Plaatsen en Raadseltjes) van de GOS.

Dat de correlaties met de GOS-subtests Woordenschat, Gezichten & Plaatsen,Rekenen en Raadseltjes hoog zijn wekt geen verbazing. Deze, in de K-ABC tot deVerworven Vaardigheden-schaal behorende subtests hebben alle een sterk verbaalkarakter. Bij al deze subtests is ‘benoemen’ een belangrijk deel of het belangrijkstedeel van de taak van de proefpersoon. De correlaties van deze subtests met WOzijn dan ook steeds het hoogst. Vooral Woordenschat en Gezichten & Plaatsenhebben een dermate verbaal karakter dat het evengoed onderdelen van een taaltestzouden kunnen zijn.

Verrassender zijn de hoge correlaties met Driehoeken en met Woordvolgorde.Vooral de correlaties van de RTB en de STP-taaltests met Driehoeken (respec-tievelijk .65, .57 en .65 met TB, ZO en WO) zijn onverwacht hoog, gezien dekenmerken van de subtest Driehoeken, waar nòch sprake is van een verbale stimu-lus, nòch van een verbale taak (de taak is vooral ruimtelijk van karakter), nòch vaneen verbale respons. Mogelijk is dit resultaat toe te schrijven aan een toevalseffect,gezien het feit dat slechts bij een vrij gering aantal proefpersonen (maximaal 28;zie Bijlage 7) deze subtests zijn afgenomen. De subtest Woordvolgorde vertoontonverwacht hoge correlaties met TB (.61) en WO (.72), terwijl de correlaties metZO (.30) en AG (.27) juist vrij laag zijn. Het in volgorde aanwijzen van door detestleider genoemde woorden hangt kennelijk sterker samen met de ontwikkelingvan de Woordenschat en het begrip van gesproken taal en/of de luistervaardigheiden juist minder met geheugen-aspecten dan op grond van het karakter van de taakvoor de proefpersoon bij Woordvolgorde werd verwacht. Deze conclusie moetechter voorzichtig worden getrokken aangezien ook bij deze subtest sprake is vaneen vrij gering aantal proefpersonen (maximaal 29, zie Bijlage 7).

Page 29: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

147

Wat betreft de subtests van de RAKIT kan het volgende worden opgemerkt. Inhet algemeen zijn de gevonden correlaties overeenkomstig de eerste in 7.1.3.geformuleerde verwachting lager dan de correlaties met de TVK. De hoogstecorrelaties worden gevonden bij de subtests met een sterk verbaal karakter,namelijk Woordbetekenis (correlatie met WO .63) en Namen leren (correlatie metTB .66 en met WO .61). De correlaties met Auditief Geheugen zijn zeer laag.

De tweede verwachting in 7.1.3 is dat de correlaties tussen de Taaltests en alge-mene cognitieve tests hoger zullen zijn dan die tussen taaltests en niet-verbalecognitieve tests. Gemiddeld zijn de correlaties van TB, ZO en WO met de SON-R2½-7 inderdaad lager dan de correlaties met de subtests van de GOS en de RAKIT.De laagste correlaties worden echter niet gevonden bij de SON-R 2½-7, maar bijde subtests Motorische Vaardigheid, Figuren natekenen en Gezichtsherkenningvan de GOS en Figuur herkennen van de RAKIT. Voor dergelijke uitkomsten isnog wel een verklaring te geven met behulp van het niet-verbale karakter van dezesubtests. De tamelijk lage correlaties met de subtest Ideeënproductie van de RA-KIT (gemiddeld .25), waarbij intuïtief gezien verbale vaardigheid toch een groterol moet spelen, zijn moeilijker verklaarbaar. Dit geldt ook voor de vrij hogecorrelaties met Schijven en, hoewel in mindere mate, met Exclusie.

De derde verwachting in 7.1.3 is dat de correlaties van taaltests met niet-verbalesubtests laag zullen zijn. Opvallend is, dat de correlaties met de subtests van deSON-R 2½-7 duidelijk lager zijn dan de correlaties met de totaalscore van dezetest. De correlatie met de totaalscore is mogelijk hoger door het verschijnsel datvan twee tests, die beide laag correleren met een bepaalde test en ook onderlinglaag correleren, de gecombineerde score een hogere correlatie met deze test kanhebben (zie bijvoorbeeld Edwards, 1976, p. 59). Van de subtestcorrelaties van deSON-R 2½-7 zijn die van Categorieën en Situaties met de Lexilijst het hoogst(.respectievelijk .67 en .62). Waarom de correlaties van de betreffende subtests (debeide Abstracte Redeneertests; zie 7.2.1) met de Lexilijst hoog zijn is niet geheelduidelijk. Het gaat weliswaar om redeneertests, waarbij iets grotere samenhangenworden gevonden met verbale (sub-)tests dan bij performale subtests, maar datbiedt een povere verklaring, gezien de mening van de auteurs van de SON-R 2½-7dat het hier om accentverschillen gaat. In het algemeen kan een verklaring voor vrijhoge correlaties met de Lexilijst misschien beter worden gezocht in de positie datjuist de vroege lexicale ontwikkeling in hoge mate mede wordt bepaald doorcognitieve factoren (zie 4.1.2).De correlaties met Taalbegrip en Woordontwikkeling zijn toch nog tamelijk hoog(gemiddeld respectievelijk .41 en .40). De subtestcorrelaties met Auditief Geheu-gen zijn het laagst (gemiddeld .25). Het is niet gezegd dat dit resultaat de validiteitvan de RTB en de STP (of de niet-verbale tests) ernstig schaadt. Hoewel er tochsprake is van een zeker verband tussen de niet-verbale en verbale ontwikkeling bij

Page 30: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

148

jonge kinderen is niet gezegd of dit verband duidelijk sterker is dan verbanden metandere, zich ontwikkelende aspecten bij jonge kinderen, (zoals bijvoorbeeld lengteen gewicht) waarbij geen andere theoretische samenhang wordt gevonden dan datal deze aspecten zich ontwikkelen. Op subtestniveau kan, met enige terughou-dendheid, worden geconcludeerd dat de derde verwachting redelijk is uitgekomen.

De vierde verwachting in 7.1.3 betreft de samenhang met motorische subtests. Detheoretische samenhang tussen motorische - en taalontwikkeling is gering en komt,van de samenhangen die in dit hoofdstuk aan de orde zijn, het dichtst bij het‘zuivere’ begrip discriminante validiteit (zie hetgeen in 7.1 is besproken; zie ookFiguur 7.1). Ten aanzien van de correlaties met de GOS-subtests MotorischeVaardigheid en Figuren Natekenen valt te constateren dat deze inderdaad zeer laagzijn. Op grond van deze resultaten kan worden geconstateerd dat er sprake is vandiscriminante validiteit.

Twee andere subtests vertonen eveneens zeer lage correlaties met de RTB enmet Zinsontwikkeling en Woordontwikkeling. Het gaat hier om Figuur herkennenvan de RAKIT en om Gezichtsherkenning van de GOS. Dit resultaat is niet zogemakkelijk te verklaren. De in deze subtests gemeten vaardigheden hebbenkennelijk even weinig gemeenschappelijk met taalontwikkeling als bepaaldemotorische vaardigheden. Dit doet echter niets af aan de zojuist getrokkenconclusie omtrent de discriminante validiteit.

De in 7.1.3 geformuleerde verwachtingen betreffen vooral correlaties van de taligeonderdelen TB, ZO en WO met andere taaltests en algemene en niet-verbalecognitietests. Omtrent de correlaties met Auditief Geheugen is in het voorgaandereeds gezegd dat omdat dit onderdeel van de STP niet bedoeld is als taaltest geenduidelijke samenhang van de score op dit onderdeel met scores op andere taaltestsmag worden verwacht. Wèl kan op voorhand verwacht worden dat Auditief geheu-gen een positieve samenhang vertoont met subtests waarin het geheugen een be-langrijke rol speelt, zoals sommige sequentiële subtests van de GOS: Hand-bewegingen, Cijfers nazeggen en Woordvolgorde. Uit Tabel 7.5 blijkt dat dezeverwachting met name opgaat voor de subtest Cijfers Nazeggen van de GOS. Dezesubtest vertoont ook de meeste overeenkomst met Auditief Geheugen wat betreftde taak voor de proefpersoon. Bij een tweetal andere subtests van de GOS wordeneveneens hoge correlaties gevonden. Het gaat om Gezichten & Plaatsen en Figurennatekenen van de GOS. Dit resultaat is tamelijk verassend. Kennelijk doen dezesubtests van de GOS een vrij groot beroep op geheugenaspecten. Matig hogecorrelaties worden gevonden met de subtests van de TVK die op woordniveaumeten. Dit resultaat zou een aanwijzing kunnen zijn dat de kennis van woorden eenrol speelt bij Auditief geheugen. Echter de zeer lage correlaties met zowel desubtest Woordenschat van de GOS als met de subtest Woordbetekenis van deRAKIT, evenals de lage correlatie van Figuren natekenen met WO, spreken deze

Page 31: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

149

conclusie tegen. Voor het overige zijn de correlaties van de validatiesubtests metAuditief Geheugen steeds zeer laag.

Samenhang van de correlaties met taligheidskenmerken van de subtests.

In Figuur 7.2 is een overzicht gegeven van de mate waarin per subtest stimulus,taak en respons een beroep doen op ‘talige’ vermogens bij de proefpersoon. Tenaanzien van de taaltests van de RTB en de STP, namelijk TB, ZO, WO en LL, kande verwachting worden geformuleerd dat validatiesubtests die een groot beroepdoen op ‘talige’ vermogens hiermee hoog correleren en dat validatiesubtests diegeen beroep doen op taalvaardigheid laag correleren met TB, ZO, WO en LL. Erkan dus een samenhang van de gevonden correlaties van de validatiesubtests metTB, ZO, WO en LL worden verwacht met de mate waarin de betreffendevalidatiesubtest een beroep doet op taalvaardigheid. Het onderdeel AG van de STPis zoals gezegd niet bedoeld voor het meten van taalontwikkeling, daarom wordteen duidelijke samenhang van de correlaties met AG met taligheidskenmerken vande validatiesubtests niet verwacht.

Van de taligheidskenmerken van de validatiesubtests wordt verwacht dat metname het talige karakter van de taak van belang is wanneer een hoge samenhangwordt verwacht. Een hoge correlatie met de validatiesubtests met TB, ZO, WO enLL wordt dus met name verwacht bij de taakvariabele. Bij AG, waarbij geen hogesamenhang wordt verwacht met de validatiesubtests zijn met stimulus- en res-ponskenmerken van de validatiesubtests mogelijk meer bepalend voor een zekeresamenhang. De (gecorrigeerde) correlaties van de validatiesubtests met de RTB en deonderdelen van de STP worden gegeven in Tabel 7.6. De volgende methode ishierbij gehanteerd. De scores dubbele min, min, plusmin en plus op stimulus, taaken respons werden, voor zover ze werden gebruikt, van laag naar hoog omgezet inrangordecijfers lopend van 1 tot maximaal 4. Zo werd de score voor de stimulus(S) als volgt berekend: de min werd een 1, de plusmin een 2 en de plus een 3. Zievoor de betekenis van de categorieën beschrijving van Figuur 7.2.

De samenhang tussen deze taligheidsscores en de corrigeerde correlaties isberekend door tussen deze variabelen de product-moment correlatiecoëfficiënten teberekenen. Ook werden multipele correlaties over stimulus-, taak- enresponsscores gezamenlijk berekend. De correlaties en de multipele correlatiesworden eveneens gepresenteerd in Tabel 7.6.

Tabel 7.6 Samenhang van correlaties met taligheidskenmerken van testonderdelen.

Page 32: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

150

onderdeel (aantal correlaties in de berekening)

taligheidskenmerk TB (37) ZO (37) WO (37) AG (33) LL (9)

correlaties

multipele correlaties

stimulus (S) .29 .36 .28 .16 .24taak (T) .57 .56 .61 .04 .53respons (R) .41 .30 .42 .09 .73

geforceerd S-T-R .57 .57 .62 .18 .76

Uit Tabel 7.6 komt naar voren dat, overeenkomstig de verwachting, vooral hettalige karakter van de taak positief samenhangt met de correlaties van TB, ZO enWO. Bij de respons is er sprake van een matig positieve samenhang en bij destimulus van een geringe positieve samenhang met deze correlaties. Vooral detaakscore geeft bij deze subtests een vrij hoge correlatie te zien (van .52 tot .61).De correlaties van de Lexilijst zijn afwijkend van het patroon bij TB ZO en WO.De taakvariabele geeft juist een iets lagere samenhang met de hoogte van de corre-laties met de validatietests te zien dan de stimulus- en de reponsvariabele. Aan ditresultaat valt echter niet goed een conclusie verbinden gezien het kleine aantal(negen) correlaties dat betrokken is in de berekening. De correlaties met AG ten-slotte zijn alle vrij laag tot laag. Met name de correlatie met de Taakvariabele is,overeenkomstig de verwachting, zeer laag.

De multipele correlaties zijn als volgt berekend. In eerste instantie werden viaeen stapsgewijze regressieanalyse, met stimulus (S), taak (T) en respons (R) alspredictoren, de correlaties met TB, ZO, WO, AG en LL voorspeld, ondergebruikmaking van de standaardwaarden voor toelating en verwijdering vanvariabelen, zoals die in SPSS-PC worden gehanteerd. Dit leverde bij TB, ZO enWO in alle gevallen een regressieanalyse op waarbij maar van één van depredictorvariabelen werd gebruikt. Dit was steeds de variabele die de hoogste(enkelvoudige) correlatie vertoonde, in deze gevallen dus de taakvariabele in deanalyse. Bij AG en LL werden geen regressieformules gevonden ondergebruikmaking van de standaardwaarden van SPSS. In tweede instantie is peronderdeel een regressieanalyse uitgevoerd waarbij geforceerd de drie voorspellendevariabelen (S, T en R) werden ingevoerd. Dit leidde bij TB, ZO en WO totmultipele correlaties die gelijk of iets hoger waren dan de hoogste gevonden enkel-voudige correlaties. Bij AG en LL werden in tegenstelling tot bij dedefaultmethode wèl multipele correlaties gevonden; bij LL werden hierbij alleen Sen R in de regressieformule opgenomen. De multipele correlaties in Tabel 7.5 zijnde resultaten van de geforceerde methode.

Page 33: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

151

De gezamenlijke resultaten van Tabel 7.6 leiden tot de conclusie dat de gevon-den correlaties van de validatietests met TB, ZO, en WO vooral samenhangen metde mate waarin de taak van de validatietest een beroep doet (of kan doen) op taal-vaardigheid van de proefpersoon. Dit resultaat ondersteunt de validiteit van deRTB en de STP. Voorts schendt de lage samenhang van de correlaties met AG methet talige karakter van de validatietests deze validiteit niet, daar de subtests AGimmers niet bedoeld is om taal te meten.

7.3.4 Samenhang met de diagnose Taalontwikkelingsstoornis

Voor een test die bedoeld is om achterstanden in de kinderlijke taalontwikkeling opte sporen is het een essentiële vereiste dat de resultaten van kinderen waarvanbekend is dat ze taalproblemen hebben op deze test duidelijk achterblijven bij deresultaten van kinderen bij wie de taalontwikkeling normaal verloopt. Van eengroep leerlingen van een school voor kinderen met spraak- en/of taalproblemenzijn resultaten bekend door Lutje Spelberg en Van Berk (1997). Bij 41 van dezeleerlingen zijn de RTB en de STP afgenomen. De onderzochte kinderen waren van4;3 tot en met 7;2 jaar oud, hadden een normaal intelligentieniveau en bij alle kin-deren was de diagnose primaire taalontwikkelingsstoornis gesteld. Over de scoresvan de proefpersonen die binnen het leeftijdsbereik van de testonderdelen vielen(26 proefpersonen), zijn standaardscores berekend. Deze proefpersonen werdengematcht met proefpersonen uit de normeringssteekproef (zie 3.3.4) op de varia-belen leeftijd, geslacht en beroepsniveau van de vader.

De belangrijkste resultaten worden gegeven in Tabel 7.7. De groep kinderenmet een taalontwikkelingsstoornis wordt in deze tabel aangeduid als ‘TOS-groep’.Uit Tabel 7.7 blijkt zowel op het niveau van ruwe scores als op het niveau vanstandaardscores de groep taalgestoorde kinderen significant lager te scoren op alleonderdelen. Op het niveau van standaardscores blijkt het verschil tussen de beidegroepen bij Taalbegrip kleiner te zijn dan bij de twee Taalproductie-onderdelen.Het grootste verschil in scores tussen de groepen is te vinden bij Zinsontwikkeling.Deze resultaten kunnen een aanwijzing vormen dat een specifieke taal-ontwikkelingsstoornis zich duidelijker uit in de taalproductie dan in het taalbegrip.De Test voor Zinsontwikkeling, tenslotte, lijkt het meest gevoelig voor eenspecifieke taalontwikkelingsstoornis.

In het algemeen leiden de resultaten tot de conclusie dat er een duidelijkesamenhang van de testscores met de diagnose ‘specifieke taalontwikkelings-stoornis’ is. De begripsvaliditeit van de RTB en de STP wordt met deze resultatendan ook verder ondersteund.

Page 34: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

152

Tabel 7.7 Testresultaten van kinderen met een primaire taalontwikkelingsstoornis(TOS-groep) vergeleken met een gematchte selectie uit de ijkingssteekproef.

TOS-groep gematchte toetsresultaatlandelijke gematchte groepen

groep

subtest gem. s.d. gem. s.d. T df sign.

Ruwe Scores (n=32)TB 64.6 8.4 71.2 9.0 -3.75 31 .001ZO 12.8 4.9 23.6 5.5 -9.97 31 .000WO 36.4 7.8 44.4 8.1 -6.35 31 .000AG 6.5 2.1 8.7 1.7 -5.09 31 .000

Standaardscores (n=26)TB 86.3 13.5 98.9 14.5 -3.15 25 .004ZO 76.2 8.7 99.2 8.9 -9.56 25 .000WO 80.5 12.1 98.5 13.7 -5.91 25 .000

7.3.5 Predictieve validiteit

Predictieve validiteit wordt door Drenth en Sijtsma (1990) gedefinieerd als de matewaarin gedrag of een prestatie buiten de testssituatie kan worden voorspeld.Wanneer ‘predictieve validiteit’ in op deze, brede, wijze wordt gedefinieerd,kunnen in feite alle gegevens betreffende de begripsvaliditeit die in dit hoofdstukworden gepresenteerd eveneens worden gezien als resultaten op het gebied vanpredictieve validiteit.

Predictieve validiteit in ‘engere zin’ is de mate waarin op basis van detestprestatie voorspellingen, gedaan ten opzichte van een criteriumvariabele,kunnen worden bevestigd. De criteriumprestaties zijn per definitie op een latertijdstip verkregen. In het bestek van het constructie- en normeringsonderzoek vande RTB en de STP kon de predictieve validiteit niet worden onderzocht. Indirecteaanwijzingen betreffende de predictieve validiteit van de RTB kunnen echterworden ontleend aan gegevens omtrent de predictieve validiteit van de RDLS en deRTOS, waarop de RTB gebaseerd is en waarmee grote onvereenkomsten in hetitemmateriaal bestaan.Over de predictieve validiteit van de subtests Taalbegrip van de RDLS zijn vrijveel gegevens beschikbaar, onder andere door het in het begin van dit hoofdstukaangehaalde onderzoek van Silva, Spears en Bradshaw (1978, 1979). Op grondvan correlaties van Taalbegrip, afgenomen op vierjarige leeftijd, met de WISC ende Burt (Rearranged) Word Reading Test, beide afgenomen op zevenjarige leeftijd,

Page 35: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

153

concluderen zij dat RDLS-Taalbegrip een zeer goede predictor is voor latere taal-en cognitieve ontwikkeling.

Gegevens betreffende de predictieve validiteit van de subtest Taalbegrip vande RTOS worden gegeven bij Zink, (1995). Bij een groep van 100 kinderen zijngegevens bekend van afnames van de RTOS op tweeëneenhalfjarige en vier-eneenhalfjarige leeftijd en bij een groep van 114 kinderen gegevens van RTOS-afnames op drie- en op vijfjarige leeftijd. Op de resultaten werden enkelvoudigeregressieanalyses uitgevoerd met de resultaten op de jongere leeftijden alsonafhankelijke variabele en de resultaten op de oudere leeftijden als deafhankelijke variabelen. Voor wat betreft de resultaten op de subtest Taalbegrip bijde beide afnames werd het volgende gevonden. Bij de groep die tweeenneenhalfjaar was bij aanvang van het onderzoek werd een richtingscoëfficiënt van .52 eneen r van .44 gevonden; bij de groep die drie jaar was bij aanvang bedroegen deze2

coëfficiënten respectievelijk .67 en .45. De gevonden waarden kunnen hooggenoemd worden. De subtest Taalbegrip bleek in de meeste gevallen eveneens debeste voorspeller te zijn voor de resultaten na twee jaar op de overige RTOS-subtests. Gegeven deze resultaten mag worden verwacht dat ook de RTB eengoede voorspeller zal zijn voor toekomstige resultaten op het gebied vantaalvaardigheid en zeer zeker dat van taalbegrip.

7.4 BESLUIT

In dit hoofdstuk is de validiteit van de RTB en de STP behandeld, waarbij inhoofdzaak de begripsvaliditeit aan de orde kwam. De begripsvaliditeit van een testkan worden omschreven als de mate waarin het bedoelde theoretische begrip metdeze test inderdaad wordt gemeten. Het bedoelde theoretische begrip van de RTBen de STP is de stand van respectievelijk de ‘receptieve taalontwikkeling’ en de‘productieve taalontwikkeling’ oftewel taalbegrip en taalproductie.

Of taalontwikkeling moet worden gezien als een specifiek domein binnen dealgemene cognitieve ontwikkeling of als een autonoom vermogen wordt in dezedissertatie in het midden gelaten. Wèl wordt er uitgegaan van een zekeresamenhang tussen de taal- en de cognitieve ontwikkeling.

De vraag naar de begripsvaliditeit van de RTB en de STP is beantwoord doorde convergente en discriminante validiteit te onderzoeken. Hiertoe zijn inparagraaf 5.1.3 een viertal vragen gesteld, de antwoorden op deze vragen leiden totde conclusie dat de convergente en discriminante validiteit van de RTB en de STPgoed is. De correlaties tussen de taaltests onderling zijn het hoogst (vraag 1), decorrelaties tussen de taaltests en algmene intelligentietests zijn hiermee vergelekenlager (vraag 2) en correlaties tussen de taaltests en specifiek niet-verbaleintelligentietests zijn nog lager (vraag 3). Dit patroon van samenhangen, zoalsbeschreven in 7.1, wordt niet alleen gevonden op het niveau van de verschillende

Page 36: Hoofdstuk 7 VALIDITEITTest of Psycholinguïstic abilities (ITPA; Kirk et al., 1968), de Wechsler Preschoo l en Primary Scale of Intelligence (WPPSI; Wechsler, 1967), delen van de Frosti

154

onderzochte validatietests maar ook op het niveau van validatiesubtests. Hierbijzijn de correlaties met subtests die vooral motorische ontwikkeling meten, geheelvolgens verwachting, zeer laag (vraag 4).

Het ‘ontwikkelings’-aspect van de RTB en de STP is nagegaan door desamenhang van de ruwe testscores met leeftijd te onderzoeken. Geconcludeerd kanworden dat er een voldoende duidelijke samenhang met leeftijd wordt gevonden.Ook blijkt dat de tests voldoende discrimineren in de extreme leeftijdsbereiken.

De RTB en de STP zijn ontwikkeld voor de diagnostiek van taalproblemen. Devraag naar de begripsvaliditeit van de instrumenten dient daarom ook de vraagnaar de gevoeligheid van de RTB en de STP voor taalproblemen te omvatten. Zijhet op enigszins beperkte schaal is onderzocht of kinderen waarvan bekend is datze taalproblemen hebben inderdaad achterblijven in de taalontwikkeling, zoals diewordt gemeten met de RTB en de STP. Geconcludeerd kon worden dat ditinderdaad het geval is. De resultaten lijken voorts aanwijzingen te geven dat eenspecifieke taalontwikkelingsstoornis zich duidelijker uit in de taalproductie dan inhet taalbegrip. De Test voor Zinsontwikkeling, tenslotte, lijkt het meest gevoeligvoor dit taalprobleem.

Samenvattend kan worden gesteld dat de resultaten van de verschillendeonderzoeken naar de begripsvaliditeit alle tot de conclusie leiden dat de RTB en deSTP een voldoende validiteit bezitten. De predictieve validiteit van de RTB en deSTP zijn nog niet onderzocht. Voor wat betreft de RTB kan op grond van gunstigeresultaten bij de RDLS en de RTOS een goede predictieve validiteit wordenverwacht.