PVN NNLJ BBLTH, DN H - Expertisecentrum TOP · PDF filePVN NNLJ BBLTH, DN H Vn, ., Drr, .,...

68

Transcript of PVN NNLJ BBLTH, DN H - Expertisecentrum TOP · PDF filePVN NNLJ BBLTH, DN H Vn, ., Drr, .,...

CIP-GEGEVENS KONINKLIJKE BIBLIOTHEEK, DEN HAAG

Veen, A., Derriks, M., Roeleveld, J.

Een jaar later.Vervolgonderzoek evaluatie van Kaleidoscoop enPiramide. Veen, A., Derriks, M., Roeleveld, J. Amsterdam: SCO-Kohnstamm Instituut van de Faculteit der Maatschappij- enGedragswetenschappen, Universiteit van Amsterdam (SCO-rapport 652).

ISBN 90-6813-700-X

Alle rechten voorbehouden. Niets uit deze uitgaven magverveelvoudigd en of openbaar gemaakt worden door middel van druk,fotokopie, microfilm of op welke wijze dan ook, zonder voorafgaandeschriftelijke toestemming van de uitgever.

All rights reserved. No part of this publication may be reproduced, stored in aretrieval system, or transmitted, in any form or by any means, electronic,mechanical, photocpying, or otherwise, without the prior written permissionof the publisher.

Uitgave en verspreiding:SCO-Kohnstamm InstituutWibautstraat 4, Postbus 94208, 1090 GE AmsterdamTel.: 020-525 1357http://www.sco-kohnstamminstituut.uva.nl© Copyright SCO-Kohnstamm Instituut, 2002

Een jaar laterVervolgonderzoek evaluatie van

Kaleidoscoop en Piramide

A. VeenM Derriks

Roeleveld

Inhoudsopgave

1 Opzet en uitvoering

In opdracht van het Ministerie van Onderwijs, Cultuur en Wetenschappen heefthet SCO-Kohnstamm Instituut in het schooljaar 1999-2000 een vervolgonderzoekverricht naar de effecten van de programma's Kaleidoscoop en Piramide. Dezefollow-upstudie is een vervolg op het in 2000 gepubliceerde evaluatieonderzoeknaar de effecten van beide programma's (Veen, Roeleveld en Leseman, 2000).Kaleidoscoop en Piramide zijn driejarige educatieve programma's die wordenuitgevoerd in samenwerkingsverbanden van peuterspeelzalen en kleutergroepenvan basisscholen. Doel van het evaluatieonderzoek is om vast te stellen of beideprogramma's een meerwaarde hebben ten opzichte van het reguliere peuterwerken kleuteronderwijs. Daartoe zijn in eerste instantie drie achtereenvolgende jaren(in het voorjaar van 1997, 1998 en 1999) bij peuters en kleuters toetsen afgeno-men en observatielijsten ingevuld (ibid.). In de follow-upstudie is dit in hetvoorjaar van 2000 herhaald. Net als in het evaluatieonderzoek gaat het in het ver-volgonderzoek om de vraag naar de effecten van Kaleidoscoop en Piramide op deprestaties van kinderen op het gebied van rekenen en taal en hun sociaal-emotioneel functioneren in de klas. In de volgende paragrafen wordt de opzet enuitvoering van het vervolgonderzoek beschreven.

101 Onderzoeksopzet

Het vervolgonderzoek is uitgevoerd op de scholen die al eerder deelnamen aanhet evaluatieonderzoek. Het gaat om twee groepen scholen: programmascholen(scholen waar Piramide of Kaleidoscoop wordt uitgevoerd) en controlescholen(scholen met een regulier onderwijsprogramma). Het grootste deel van de kinde-ren die in de periode 1997 t/m 1999 deelnamen aan het evaluatieonderzoek zit inschooljaar 1999-2000 in groep 2, een klein deel in groep 3.Naast de controlegroep bestaande uit kinderen van de controlescholen voorziethet onderzoeksontwerp in een tweede controlegroep. Deze laatste controlegroep

1

Een jaar later. Vervolgonderzoek evaluatie van kaleidoscoop en piramide

wordt achteraf gevormd uit het databestand van het Primacohort-onderzoek t . Uithet Primacohort wordt een naar achtergrondkenmerken (leeftijd, sekse, etniciteit)vergelijkbare groep kinderen geselecteerd. Omdat de metingen in het Primacohortonderzoek in de even groepen plaats vinden, bestaat de tweede controlegroep al-leen uit kinderen uit groep 2; voor de kinderen uit groep 3 is er geen tweedecontrolegroep.Op grond van de resultaten van het vervolgonderzoek kunnen er dus vergelijkin-gen worden gemaakt tussen:e de resultaten van de programma- en de controlekinderen, alsmede® de resultaten van de programmakinderen in groep 2 en de Primacohort-

kinderen in groep 2.Hoewel de opzet van het vervolgonderzoek niet wezenlijk anders is dan die vanhet evaluatieonderzoek, zijn er enkele kleine afwijkingen. In de vervolgstudie zijnalle kinderen uit de groepen 2 en 3 op de programmascholen en de controlescho-len betrokken, en niet alleen de kinderen die in de periode 1997-1999 aan hetevaluatieonderzoek hebben deelgenomen. In het vervolgonderzoek is er dus spra-ke van een grote groep voor het onderzoek 'nieuwe' kinderen. Voor zover het deprogramma's betreft gaat het om kinderen die vanaf het begin deelnamen, maarook om kinderen die tussentijds (in groep 1 of 2) instroomden en daardoor deprogramma's slechts gedeeltelijk hebben gevolgd.Ook de wijze waarop de kinderen getoetst worden, wijkt in het vervolgonderzoekenigszins af. In tegenstelling tot het afgesloten evaluatieonderzoek zijn de kinde-ren niet individueel en (voor een deel) in de eigen taal getoetst, maar heeft detoetsafname groepsgewijs plaats gevonden en zijn de toetsen in de Nederlandsetaal door Nederlandstalige toetsleiders afgenomen.Een laatste verandering in het vervolgonderzoek betreft de uitbreiding van de teverzamelen gegevens naar klas- en schoolkenmerken. In het evaluatieonderzoek

1 Het Primacohort-onderzoek is een landelijk onderzoek, waarbij op een groot aantal Neder-landse basisscholen tweejaarlijks in de groepen 2,4,6 en 8 toetsen worden afgenomen. Eenbelangrijk onderdeel van het onderzoek zijn de taal- en rekentoetsen. De resultaten van dekinderen worden verwerkt tot PRIMA-taalvaardigheids- resp. rekenvaardigheidsscores(Jungbluth, Van Langen, Peetsma, Vierke, 1996; Driessen, Van Langen, Portengen, Vierke,1998). De totale PRIMA-steekproef bevat honderden basisscholen; ongeveer 450 scholenvormen samen de referentiesteekproef: deze groep scholen is zo samengesteld dat ze repre-sentatief is voor alle Nederlandse basisscholen.

2

Opzet en uitvoering

was al naar voren gekomen dat de controlegroep niet in alle opzichten vergelijk-baar is met de beide experimentele groepen. Als we kijken naar(achtergrond)kenmerken van de individuele leerlingen komen de controlegroep ende experimentele groepen weliswaar goed overeen, maar dit is minder het gevalals we naar de leerlingpopulatie van de scholen in zijn geheel kijken. De sociaaleconomische status van de school en de etnische achtergrond van de school wor-den uitgedrukt in een SE-score van de school. Naarmate de school meerallochtone leerlingen heeft en het opleidingsniveau van de ouders lager is, is deSE score van de school hoger. In het evaluatieonderzoek bleek dat de SE-scorevan de Kaleidoscoop- en Piramidescholen aanzienlijk hoger is dan de SE-scorevan de controlescholen. Dit betekent dat de kinderen in de controlegroep mogelij-kerwijs in een gunstiger leeromgeving vertoeven dan de kinderen uit deprogrammascholen. Om hier iets meer over te kunnen zeggen is in het vervolgon-derzoek daarom geprobeerd aanvullende informatie te verkrijgen over enkeleschool- en klaskenmerken van zowel de controle- als de experimentele scholen.Daartoe is bij de leerkrachten van de aan het onderzoek deelnemende groepen ende directeuren van de scholen een vragenlijst afgenomen waarbij gebruik is ge-maakt van onderdelen van instrumenten uit het Primacohort-onderzoek.

1.2 Onderzoeksuitvoering

Evenals in voorgaande jaren vond de toetsafname bij de kinderen plaats vlak voorde zomervakantie, in de maanden april tot en met juli 2000. De dataverzamelingbij docenten en directie gebeurde in dezelfde periode.In december 1999 zijn de scholen (Piramide, Kaleidoscoop en controle) door middelvan een brief op de hoogte gesteld van het vervolgonderzoek en begin 2000 telefo-nisch benaderd voor hun medewerking. De bereidheid tot deelname was groot: allescholen zegden hun medewerking toe, zij het niet voor alle onderdelen van de data-verzameling. Enkele scholen waren bereid tijd uit te trekken voor het toetsen van dekinderen, maar niet voor het invullen van de vragenlijsten door docenten en directie.Op een aantal scholen (4) konden alleen de onderzoekskinderen worden getoetst.In tegenstelling tot de eerdere metingen werden dit keer zoals gezegd, toetsen bij alle

kinderen uit de groepen 2 en 3 afgenomen. In de voorbereidingsfase is met het oogop de planning van de toetsafnamen de contactpersoon van de school gevraagd de

3

Een jaar later. Vervolgonderzoek evaluatie van kaleidoscoop en piramide

volgende gegevens te verstrekken: het aantal groepen 2 (alleen oudste kleuters) engroepen 3, het aantal leerlingen in die groepen en hun namen, de namen van de leer-krachten van deze groepen, welke toetsen al door de school waren afgenomen enwelke nog afgenomen zouden gaan worden. Het aantal leerlingen dat in aanmerkingkwam voor de toetsafnamen bedroeg op grond van de gegevens van de scholen1357. Van een aantal scholen (4) deden alleen de onderzoekskinderen mee, van tweescholen deden alleen de kinderen uit groep 3 mee omdat de school van contro-leschool tot programmaschool geworden was, en één controleschool viel af omdat erzich geen onderzoekskinderen meer bevonden. Omdat de toetsafname dit keergroepsgewijs plaats vond, is in overleg met de scholen geen energie gestoken in hetverkrijgen van toestemming van de ouders. Wel verzochten enkele scholen (5) ominformatie over het onderzoek om de ouders op de hoogte te stellen.De toetsen zijn afgenomen door getrainde en ervaren toetsleiders die gewend zijnaan groepsgewijze toetsafname in kleutergroepen. De toetsen werden afgenomen ingroepjes van ten hoogste tien kinderen, zoals ook in het Primacohort-onderzoek ge-bruikelijk is. Soms was het nodig de groepjes kleiner te maken, met name in groep 2of wanneer er veel anderstalige kinderen meededen. De toetsafnamen vonden plaatsin de maanden april tot en met juli 2000. In groep 2 ging het om drie toetsen waar-van er twee ook deel uitmaken van het Cito-leerlingvolgsysteem, in groep 3 ging hetom twee toetsen die beide deel uitmaken van het Cito-leerlingvolgsysteem. Sommi-ge van de in het vervolgonderzoek gebruikte toetsen waren al standaard afgenomenop de basisscholen of het stond nog te gebeuren. In dat geval is de scholen gevraagdom de toetsboekjes te bewaren zodat de leerling-scores door de toetsleider uit deboekjes konden worden overgenomen.In het vervolgonderzoek zijn ook gegevens verzameld bij docenten en directie. Vooreen deel betrof dat leerlinggegevens voor een deel klas- en schoolkenmerken. Via decontactpersonen van de school zijn de vragenlijsten onder de desbetreffende perso-nen verspreid.

1.3 Meetinstrumenten

In groep 2 zijn drie toetsen afgenomen: de toets Ordenen (Platenboek OudsteKleuters) van het Cito, de Begrippentoets van het Cito en het onderdeel 'Passievewoordenschat' uit de Taaltoets Allochtone Kleuters (TAK; Verhoeven, Vermeer

4

Opzet en uitvoering

en Van de Guchte, 1986). Twee van deze toetsen, de toetsen Ordenen en Begrip-pen uit het Cito-leerlingvolgsysteem worden ook gebruikt in het Primacohort-onderzoek, hetgeen de mogelijkheid biedt om de gegevens van de kinderen in hetvervolgonderzoek te vergelijken met gegevens van vergelijkbare kinderen uitgroep 2 van het basisonderwijs uit deze grote landelijke steekproef.De toets Ordenen meet vooral vaardigheden die betrekking hebben op het voorbe-reidend rekenen bij kleuters. De toets is in zijn geheel (42 items) afgenomen. DeBegrippentoets meet kennis van begrippen die zowel voor het lees- als het reken-onderwijs van belang zijn. De toets bestaat uit twee delen, een deel met plaatjes(40 items) en een deel met woorden (20 items). Beide delen zijn afgenomen. Inhet onderzoek zijn van het begin af aan Woordenschattoetsen (passieve woorden-schat) afgenomen. In groep 2 is in deze follow-up een gedeelte van het onderdeelPassieve Woordenschat uit de TAK afgenomen. De passieve woordenschattoetsvan de TAK bestaat uit 98 items. Voor het evaluatieonderzoek waren de eerste 40items geselecteerd, voor het vervolgonderzoek de daaropvolgende 40 items. Detoets, die eigenlijk bedoeld is voor individuele afname, is voor deze meting ge-schikt gemaakt voor groepsgewijze toetsing. In deze follow-up is uitsluitend depassieve woordenschat in het Nederlands gemeten en niet, zoals in het afgeslotenevaluatieonderzoek, de woordenschat in de eigen taal.In groep 3 zijn eveneens toetsen afgenomen uit het Cito-leerlingvolgsysteem.Voor het onderdeel woordenschat is de specifiek voor dit domein bedoelde toetsuit het leerling-volgsysteem van het Cito gebruikt: de Woordenschattoets I. Dezetoets bevat 50 items en meet de passieve woordenschat Nederlands. Voor het me-ten van de ontwikkeling op het gebied van rekenen is de toets Rekenen-Wiskunde1 E3 afgenomen. De toets bestaat uit twee delen (respectievelijk 24 en 29 items)en meet basale declaratieve en procedurele kennis op het gebied van rekenen. Hetderde leerjaar staat in het teken van het verwerven van de basisvaardigheden vanhet lezen. Leesvaardigheden vormen een belangrijke basis voor latere schoolpres-taties. Daarom ligt het voor de hand om de programma- en de controlekinderenmet elkaar te vergelijken op het bereikte niveau aan het eind van groep 3. Voorhet in kaart brengen van deze vaardigheden is geen toets ingezet, maar is gebruikgemaakt van de kennis en ervaring van de leerkrachten. We mogen ervan uitgaandat leerkrachten in groep 3, omdat ze het leesproces van de kinderen het hele jaarintensief begeleiden en volgen, veel zicht hebben op het bereikte resultaat aan heteind van het schooljaar. We hebben twee uitspraken geformuleerd over het be-

5

Een jaar later. Vervolgonderzoek evaluatie van kaleidoscoop en piramide

grijpend en technisch lezen, die de leerkrachten voor elk kind moest beantwoor-den. Bij de uitspraak over begrijpend lezen werd de leerkracht gevraagd perleerling op een 6-puntsschaaltje het niveau aan te geven. De schaal liep van 1.kind begrijpt niet wat het leest tot 6. kind begrijpt goed wat het leest. Voor hettechnisch lezen werd de vraag geformuleerd: Op het welk AVI-niveau leest hetkind momenteel (eind mei-begin juni 2000)? De leerkracht kon kiezen uit de vol-gende antwoordmogelijkheden: AVI-niveau 1,2,3, etc. t/m 8; hoger dan AVI-8 ofik weet het niet/niet van toepassing. De vragen werden toegevoegd aan het in-strument waarmee in dit onderzoek de sociaal-emotionele ontwikkeling vankinderen gemeten wordt (R-Schobl).Zowel over de kinderen in groep 2 als de kinderen in groep 3 zijn gegevens overde sociaal-emotionele ontwikkeling van de kinderen verkregen met behulp van deR-Schobl. De voor dit onderzoek geselecteerde onderdelen uit deze observatielijstzijn door de leerkrachten van groep 2 en 3 ingevuld voor alle kinderen die mee-deden aan de toetsafname. De R-Schobl maakte ook deel uit van het toetspakketin het evaluatieonderzoek en vanwege de continuïteit is gekozen voor dezelfdeitems en schalen (extraversie, werkhouding, aangenaam sociaal gedrag en emoti-onele stabiliteit) als in de eerdere metingen.In eerdere jaren zijn de achtergrondkenmerken van de onderzoekskinderen ver-zameld. Voor deze follow-up moesten nieuwe gegevens worden verzameld, vande kinderen die nog niet eerder meededen. Hiervoor is een speciaal formulierontwikkeld (Tormulier achtergrondgegevens 2000'), gebaseerd op het achter-grondformulier dat ook in Prima wordt gebruikt. Hierin zijn de volgendevariabelen bevraagd: geslacht; geboortedatum; geboorteland; herkomstland ou-ders; opleiding ouders; leerlinggewicht; thuistaal2, kinderopvang (voor-schoolsevoorziening); deelname aan Kaleidoscoop/Piramide. Dit leerlingformulier konworden ingevuld door de betrokken leerkracht of de administratie van de school.Door in het formulier vragen naar de thuistaal en deelname aan voorschoolsevoorzieningen en Kaleidoscoop of Piramide op te nemen, kon worden afgezienvan een vragenlijstje voor de ouders, zoals aanvankelijk de opzet was.

2 Gevraagd werd in te vullen welke taal volgens de leerkracht over het algemeen gesprokenwordt in het gezin van het kind (de dominante thuistaal), waarbij gekozen kon worden uit devolgende antwoordmogelijkheden: Nederlands, Turks, Marokkaans/Arabisch, Marok-kaans/Berbers, Overig. Wanneer men het niet weet of er geen duidelijke dominante thuistaalwaargenomen wordt, luidt de instructie niets in te vullen.

6

Opzet en uitvoering

Om informatie te verkrijgen over de school- en klaskenmerken van de aan het on-derzoek deelnemende scholen is gebruik gemaakt van onderdelen vaninstrumenten uit het Primacohort-onderzoek. Om de scholen niet onnodig te be-lasten is gewerkt met korte vragenlijsten voor de directie en de leerkrachten vangroep 2. Aangezien groep 3 geen deel uitmaakt van het Primacohort-onderzoek iser voor de docenten van groep 3 geen vragenlijst ontworpen. De vragenlijst leer-krachten groep 2 bevat vragen naar: algemene klaskenmerken (aantal leerjaren inde groep (combinatieklas); aantal leerlingen in de groep; meer dan één groeps-leerkracht, is er sprake van dubbele bezetting); de steun van een remedial teacher;voorschoolse voorzieningen (contacten met voorschoolse voorzieningen; uitspra-ken over voorschoolse voorzieningen); aansluiting groep 2 en groep 3 (werkwijzegroep 2; systematische aandacht voor voorbereidend lezen en rekenen in groep 2;aandacht in groep 3 voor aanvankelijk lees- en rekenonderwijs); vragen over deleerkracht zelf.De vragenlijst voor de directie bevat vragen naar (veranderingen in) de samenstel-ling van de leerlingpopulatie en contacten met voorschoolse voorzieningen. Ineen schema (bijlage 1) zijn alle onderzoeksinstrumenten weergegeven die de af-gelopen jaren in het kader van dit onderzoek zijn afgenomen.

1.4 Data-analyses

In het jaar 2000 (follow-upstudie) en in de jaren daarvoor werden gegevens ver-zameld bij kinderen op de programmascholen (Kaleidoscoop en Piramide) en opde controlescholen. Voor de beantwoording van de onderzoeksvraag naar effectenvan de programma's zijn op deze gegevens drie soorten analyses uitgevoerd. Bijelk van de analyses gaat het steeds om een andere groep kinderen.

Analyses over alle kinderen over wie in 2000 gegevens zijn verzameld,uit de groepen 2 en 3; daarbij kan gecontroleerd worden voor enkele bijde school opgevraagde achtergrondkenmerken van de leerlingen.

II. Analyses over de ontwikkeling van onderzoekskinderen tussen 1999 en2000; hierbij wordt onder meer gebruik gemaakt van de toetsscores zoalsde kinderen die in 1999 hebben behaald. Deze groep is natuurlijk kleineren omvat zowel kinderen die vanaf de peuterspeelzaal meedoen als in1998 nieuw ingestroomde onderzoekskinderen.

7

Een jaar later. Vervolgonderzoek evaluatie van kaleidoscoop en piramide

III. Analyses over de ontwikkeling van alleen de doorstroomgroep: de kinde-ren die vanaf de peuterspeelzaal met het onderzoek mee hebben gedaan.Dit is de kleinste groep, die wel het langst is gevolgd.

In tabel A geven we een overzicht van de aantallen kinderen die per type analysebeschikbaar zijn. Doordat we niet voor alle leerlingen over een complete set ge-gevens beschikken, zullen er in de analyses nog leerlingen gaan uitvallen. Deaantallen in tabel A zijn dus te beschouwen als maximumaantallen.

Tabel A. Aantallen beschikbaar voor de verschillende analyses

1 Analyse I alle leerlingen 2000

deelgenomen in 2000

groep 2

groep 3

2 Analyse II ontwikkeling 1999-

2000

deelgenomen in 1999

uitval

(percentage)

weer deelgenomen 2000

groep 2

groep 3

3 Analyse III ontwikkeling

doorstroomgroep 1997-2000

deelgenomen in 1999

uitval

(percentage)

weer deelgenomen 2000

groep 2

groep 3

8

Opzet en uitvoering

1.5 De samenstelling van de groepen bij de drie typen analyses

De samenstelling van de onderzoeksgroepen, met name de vraag of zij als verge-lijkbaar beschouwd kunnen worden, is een onderzoeksopzet waarbij verschillendecondities met elkaar worden vergeleken, van grote betekenis. In deze paragraafwordt voor elk van de drie typen analyses de samenstelling van de groepen naarrelevante kind- en achtergrondkenmerken (per conditie) in tabellen samengevat.Daarnaast is voor de analyses II en III nagegaan of de uitval van de derde op devierde meting selectief is. Uitval van onderzoekskinderen betekent een reductievan het aantal kinderen die de programma's hebben gevolgd en waarover uitspra-ken gedaan kunnen worden. Wanneer deze uitval selectief is, kan dit totvertekening van de resultaten leiden.

1.5.1 Alle kinderen 2000 (Analyse 1)

In de drie voorafgaande metingen in het evaluatieonderzoek zijn steeds gegevensverzameld bij individuele kinderen (de onderzoekskinderen). In de meting voorhet vervolgonderzoek zijn naast gegevens bij de onderzoekskinderen ook bij alleandere kinderen in de klas gegevens verzameld. In tabel B staan enkele relevanteachtergrondkenmerken voor de hele groep kinderen bij wie in 2000 gegevens ver-zameld zijn, afzonderlijk voor de beide experimentele en de controlescholen.Het algemene beeld als het gaat om alle kinderen uit de groepen 2 en 3, is dat hetaandeel allochtone kinderen in de controlescholen significant lager is dan op deprogrammascholen (zie onderstaande tabel). In samenhang daarmee hebben deleerlingen van de controlescholen het Nederlands wat meer als thuistaal (vooralbij Kaleidoscoop is het percentage kinderen met thuistaal Nederlands laag). Dezegegevens bevestigen eerdere bevindingen waaruit bleek dat de samenstelling vande leerlingpopulatie op de controlescholen niet geheel vergelijkbaar is met die opde experimentele scholen: de condities op de controlescholen wijken in gunstigezin af van de condities op de experimentele scholen. Dit gegeven zal bij de inter-pretatie van de onderzoeksgegevens moeten worden meegewogen.

9

Een jaar later. Vervolgonderzoek evaluatie van kaleidoscoop en piramide

Tabel B. Groepen analyse I (alle deelnemende leerlingen in 2000) (n = 1294)

leeftijd per 1 okt Kaleidoscoop Piramide

Controle eta-kwadraat

1999 groep 2

(in jaren)

5.6 5.7 5.7 .01*

(.43) (.48) (.41)

leeftijd per 1 okt 5.6 5.7 5.7 .01*

1999 groep 2 (.43) (.48) (.41)

(in jaren)

6.7 6.8 6.7 .01

groep 3 (.45) (.48) (.46)

percentage meisjes 54% 48% 49% .00

percentage Turkse 27% 22% 17% .01*

kinderen

percentage Marok- 20% 13% 17% .01*

kaanse kinderen

percentage overige 25% 23% 14% .01**

etnische kinderen

percentage 1.25 15% 17% 26% .01*

leerlingen

percentage 1.90 63% 55% 45% .02**

leerlingen

percentage thuistaal 39% 55% 68% .05**

Nederlands

Opleidingsniveau 2.0 2.2 2.0 .01

Vader (1.0) (.9) (.9)

(1= hooguit lo; tot

4 = hbo/wo)

Opleidingsniveau 1.9 2.1 1.9 .01 #

Moeder (1.0) (0.9) (0.9)

(1= hooguit lo; tot

4 = hbo/wo)

10

Opzet en uitvoering

# p<.10; * p<.05; ** p<.01

Ging het in de eerdere metingen steeds om kinderen in dezelfde groep (allen inkleutergroep), deze keer is dat niet meer het geval. Het merendeel van de leerlin-gen verblijft nog wel in groep 2, maar een deel van de leerlingen zit in groep 3. Inverband hiermee zijn we nagegaan of de scholen misschien een verschillendestrategie hanteren bij de overgang van kleutergroep naar groep 3. Houden sommi-ge scholen de kleuters misschien langer in groep 2? Nadere analyse van degeboortedata van de kinderen in de drie condities levert het volgende beeld (zieonderstaande tabel).In groep 2 lijkt het er op dat de Piramide scholen meer leerlingen kleuterbouwver-lenging geven. Op de Piramidescholen is 24% van de kinderen vóór 1 oktober1993 geboren ("oud"), tegenover ongeveer 15% van de kinderen op de scholenvan de twee andere condities. In groep 3 zijn er geen belangrijke (en significante)leeftijdsverschillen.

Tabel C. Geboortetijdstip leerlingen groep 2 en 3 (alle leerlingen 2000)

groep 2

geboren na 1 okt 1994 (jong)

tussen 1 okt 93 en 1 okt 94 (norm)

geboren voor 1 okt 1993 (oud)

groep 3

geboren na 1 okt 1993 (jong)

tussen 1 okt 92 en 1 okt 93 (norm)

geboren voor 1 okt 1992 (oud)

# p<.10; * p<.05; ** p<.01

1.5.2 De onderzoekskinderen; de ontwikkelingen 1999-2000 (Analyse II)Naast de groep 'alle kinderen' wordt in de analyses de groep 'onderzoekskinde-ren' onderscheiden. Bij de onderzoekskinderen gaat het om de kinderen die sinds1997 aan het onderzoek meedoen én de kinderen die in 1998 nieuw in het onder-zoek zijn ingestroomd.In 1999 omvatte de groep 261 kinderen. De vraag is uit hoeveel kinderen degroep in de meting van 2000 bestaat en of de uitval selectief is.

11

Een jaar later. Vervolgonderzoek evaluatie van kaleidoscoop en piramide

De groep onderzoekskinderen die van de derde op de vierde meting is uitgevallen,bedraagt 53 leerlingen. Deze kinderen verschillen niet systematisch van de groepdie in het onderzoek blijft (208 leerlingen) op de variabelen die in dit onderzoeksteeds als controlevariabelen (covariaten) zijn gebruikt (sekse; etnische herkomst,leeftijd, thuistaal, opleidingsniveau ouders)3.Ook op de in 1999 afgenomen toetsen vinden we geen significante verschillen,behalve op de LDT-blokpatronen: daar scoren de uitvallers gemiddeld een fractiehoger (p = .08).Doordat de uitval niet-selectief is blijft het algemene beeld van de drie "conditie-groepen" in 2000 hetzelfde als bij de metingen in 1999. Het aandeel Turkse leer-lingen is wat hoger bij de leerlingen op Piramide-scholen; (vermoedelijk) insamenhang daarmee is Nederlands wat minder sterk de thuistaal. In de gezinnenvan de controlekinderen is Nederlands wat vaker de belangrijkste spreektaal ver-geleken met de andere condities (zie onderstaande tabel).

Tabel D. Groepen analyse II (ontwikkeling tussen 1999 en 2000) (n=208)

leeftijd in maanden bij de vierde

meetronde

percentage meisjes

percentage Turkse kinderen

percentage Marokkaanse kinderen

3 Met de ouders van de onderzoekskinderen is een interview gehouden, waarvoor een ouder-vragenlijst werd ontwikkeld. Uit deze oudervragenlijsten zijn voor de analyses de volgendevariabelen geconstrueerd. De sociaal-economische status (SES) van het gezin van herkomst iseen index gebaseerd op het opleidingsniveau en het aantal jaren onderwijs van beide ouders.De etnische herkomst is gebaseerd op het geboorteland van het kind, de ouders en grootou-ders aan moederszijde. In het onderzoek worden drie etnische groepen onderscheiden:Nederlanders, Turken en Marokkanen. Surinaamse en Antilliaanse kinderen kwamen in zeergeringe aantallen voor in de onderzoeksgroepen en zijn toegevoegd aan de groep Nederlan-ders. De thuistaal is een index gebaseerd op een viertal vragen naar het taalgebruik in hetgezin. De maximum-score 1 betekent dat door ouders en andere kinderen in gezin altijd Ne-derlands met het onderzoekskind wordt gesproken; de minimumscore 0 betekent dat thuisaltijd een andere taal, de eigen taal, wordt gesproken.

12

Opzet en uitvoering

Tabel D. Groepen analyse II (ontwikkeling tussen 1999 en 2000) (n=208)

# p<.10; * p<.05; ** p<.01

1.5.3 De doorstroomgroep; ontwikkelingen 1997-2000 (Analyse III)De derde groep die in de analyses wordt onderscheiden is de `doorstroomgroep'.Deze groep bestaat uit de kinderen die aan de eerste onderzoeksmeting op de ex-perimentele en controlescholen deelnamen en niét tussentijds uit het onderzoekzijn uitgestroomd.In 1999 bestond de groep uit 161 leerlingen. Van de derde op de vierde metingzijn 29 leerlingen uitgevallen. De uitgevallen groep verschilt niet systematischvan de groep die in het onderzoek blijft (132 leerlingen) op de variabelen, die indit onderzoek steeds als controlevariabelen (covariaten) zijn gebruikt (sekse; etni-sche herkomst, leeftijd, thuistaal, opleidingsniveau ouders). Ook op de in 1999afgenomen toetsen vinden we geen significante verschillen.Doordat de uitval niet-selectief is blijft ook hier het algemene beeld van de drie"conditie-groepen" in 2000 hetzelfde als in het vorige onderzoek. Ook hier is hetaandeel Turkse leerlingen wat hoger bij de leerlingen op Piramidescholen; en ookhier is (vermoedelijk) in samenhang daarmee Nederlands wat minder sterk dethuistaal (zie onderstaande tabel).

13

Een jaar later. Vervolgonderzoek evaluatie van kaleidoscoop en piramide

Tabel E. Groepen analyse III (ontwikkeling tussen 1997 en 2000) (n =132)

leeftijd in maanden bij de

vierde meetronde

percentage meisjes

percentage Turkse kinderen

percentage Marokkaanse kinderen

Index thuistaal Nederlands

Sociaal-economische Status

Opleidingsniveau Vader

# p<.10; *p<.05; ** p<.01

14

2 Resultaten

In dit hoofdstuk komen in de eerste plaats de resultaten van de drie analyses aande orde. Voorts presenteren we de gegevens uit de vragenlijsten die werden toe-gestuurd aan de directies en de leerkrachten uit groep twee, met als doel omnadere gegevens te verkrijgen over de onderzoeksscholen.Als het gaat om de analyses op de leerlinggegevens presenteren we drie typenanalyses. Bij elk van de analyses gaat het om een andere groep leerlingen. Deanalyses I geven een beeld van alle leerlingen bij wie in de 2000-meting gegevensverzameld zijn. De analyses II geven een beeld van de ontwikkelingen tussen1999-2000 bij de onderzoekskinderen; de analyses III schetsen de ontwikkelingtussen de eerste meting in 1997 en de laatste in 2000. In de analyses wordt steedsonderscheid gemaakt naar de groepen 2 en 3. Bij de longitudinale groepen (deanalyses II en III) zit ruwweg tweederde van de leerlingen nog in groep 2. Het ac-cent zal bij deze analyses daarom liggen op de groepen 2, ten eerste omdat hetgrotere aantallen betreft, maar ook omdat bij de groepen 2 de resultaten beter ver-gelijkbaar zijn met eerdere toetsscores. Daarnaast worden de resultaten van groep2 nog geplaatst tegen de achtergrond van het landelijke beeld, zoals dat verkregenkan worden op basis van gegevens uit het Primacohort.In de analyses worden steeds scores en ontwikkelingen van leerlingen in beide ty-pen programmascholen vergeleken met die van leerlingen in de controlescholen.Deze verschillende leerlinggroepen zijn niet gelijk van samenstelling, zodat we inde analyses rekening moeten houden met verschillen in herkomst en achtergron-den. Daartoe worden covariantie-analyses uitgevoerd, waarmee getoetst kanworden of gevonden verschillen in gemiddelden statistisch significant zijn, nadater gecontroleerd is voor verschillen tussen de leerlingen op een aantal covariaten.Deze covariaten betreffen de Turkse of Marokkaanse herkomst van de leerlingen,de thuistaal, de opleiding van de ouders, het leerlinggewicht en het geslacht. Enomdat de controlescholen een lager aandeel allochtone leerlingen kennen dan deprogrammascholen wordt ook de SE-score van de school als covariaat opgeno-men. Om enig inzicht te geven in het effect van controleren voor covariaten staanin de tabellen in dit hoofdstuk zowel de (verschillen in) ruwe scores (totaalscoresop toetsen), als de verschillen na controle voor covariaten. Omdat de leerlingbe-volking op de controlescholen wat "gunstiger" kenmerken heeft (minder

15

Een jaar later. Vervolgonderzoek evaluatie van kaleidoscoop en piramide

leerlingen uit etnische groepen; thuistaal vaker Nederlands) worden daar de sco-res doorgaans wat "omlaag gecorrigeerd".Een tweede kanttekening bij dit hoofdstuk betreft de procedure die wij gehanteerdhebben voor 'ontbrekende gegevens'. Omdat bij een deel van de kinderen op on-derdelen gegevens ontbreken en wij zoveel mogelijk kinderen in de analyseswilden betrekken, gebruiken we in de analyses de gegevens van alle leerlingenwaarvan een toetsscore bekend is (in de tabellen aangegeven met: N). Van onge-veer een kwart van deze leerlingen ontbreekt informatie over één of meer van decovariaten. Omdat we deze uitval te groot achten hebben we extra covariaten(dummyvariabelen) gemaakt die aangeven wanneer er informatie ontbreekt. Bij-voorbeeld bij de covariaat `leerlinggewicht 1.25' (0 = nee; 1 = ja) krijgenleerlingen met ontbrekende gegevens een 0 op deze covariaat, maar een 1 op eennieuwe covariaat 'informatie over leerlinggewicht ontbreekt'. Voor ontbrekendewaarden op de covariaat `(hoogste) opleiding van de ouders' is het gemiddeldegesubstitueerd, met opname van een dummyvariabele 'informatie over opleiding

ouders ontbreekt'. Op deze wijze kunnen toch alle leerlingen met ontbrekende in-formatie in de analyses worden meegenomen:In de tabellen worden verschillen in gemiddelden tussen de programma- en decontrolescholen weergegeven met d-scores. Deze worden berekend door het ver-schil in gemiddelde te delen door de overall standaarddeviatie. De grootte vandeze effectscores laten zich duiden in de termen van Cohen (1988); deze noemtals criteria voor effectgrootte: weak (d=0.20), medium (d=0.50) en strong

(d=0.80).

2.1 Analyse I: Resultaten van de 2000-leerlingen

We presenteren hier de resultaten van alle kinderen bij wie in 2000 gegevens ver-zameld zijn, afzonderlijk voor de leerlingen in groep 2 en in groep 3. Detoetsscores van de kinderen uit groep 2, onderscheiden naar conditie, staan ver-meld in tabel 2.1 de toets- en gedrags-beoordelingsscores van de kinderen ingroep 3 staan in tabel 2.2, eveneens per conditie.

1 De analyses zijn ook uitgevoerd met zogenaamde listwise deletion of missing data. De uit-komsten daarvan geven geen ander beeld dan de hier gerapporteerde uitkomsten.

16

Resultaten

GROEP 2

Tabel 2.1

Resultaten van de 2000-meting in groep 2 (alle kinderen in groep 2);eerst ruw (ongecontro-

leerd); daarna gecontroleerd voor covariaten;aantallen, gemiddelden, SD's en d-scores voor

paarsgewijze vergelijkingen tussen programma's en controlegroep.

17

Een jaar later. Vervolgonderzoek evaluatie van kaleidoscoop en piramide

a Een hoge score op deze schaal betekent negatief sociaal-emotioneel gedrag Co-variaten: Etnische groep (Turks, Marokkaans, overig), thuistaal, opleiding ouders,leerlinggewicht, sekse; schoolscore; dummies voor ontbrekende gegevens #p<.10; * p<.05; ** p<.01

Het beeld bij alle kinderen in groep 2 is dat -- na controle voor de covariaten -- dekinderen uit de controlegroep hoger scoren op de Begrippentoets dan de kinderenvan de programma-scholen. De kinderen van de Piramidescholen scoren op deOrdenentoets hoger dan de controlegroep, de Kaleidoscoopkinderen lager. Op deTAKtoets zijn er nauwelijks verschillen tussen controlegroep en programmascho-len. Hetzelfde geldt voor de scores op de gedragsoordelen (Schobl-R), zij het datde leerlingen uit Kaleidoscoop wat lager worden beoordeeld op aangenaam ge-

drag dan de leerlingen uit de andere groepen.

GROEP 3In tabel 2.2 staan de toetsscores van de kinderen uit groep 3. Naast de resultatenop de toetsen Woordenschat en Rekenen-Wiskunde en de gedragsbeoordelingengeeft deze tabel ook de scores weer op begrijpend en technisch lezen.Op de Woordenschattoets scoren beide programmagroepen hoger, echter alleenbij de Kaleidoscoopkinderen is sprake van een significant verschil met de contro-legroep. Op de toets Rekenen-Wiskunde zien we significant lagere scores voorPiramide in vergelijking met de controlegroep (het gaat maar om een zwak ef-fect). De scores tussen Kaleidoscoop en de controlegroep verschillen op dezetoets niet.

18

Resultaten

Opvallend is dat de programma's op beide leesonderdelen, zowel op begrijpendals op technisch lezen, hoger scoren dan de controlegroep, waarbij vooral Pirami-de eruit springt.Voor Kaleidoscoop doet zich de significantie alleen voor na controle op de cova-riaten.We moeten hier in ogenschouw nemen dat het gaat om een registratie door de ei-gen leerkracht en niet om onafhankelijke, door toetsleiders uitgevoerde toetsing,zoals bij de andere effectmaten. De registratie van het AVI-niveau is een hard ge-geven, de vaststelling van het niveau vindt plaats op basis van een externe maat.Bij begrijpend lezen gaat het om een leerkrachtoordeel. Hetzelfde geldt voor degedragsbeoordelingen. Er zijn op de gedrags-aspecten (`extraversie', 'werkhou-ding', 'aangenaam gedrag' en 'emotionele stabiliteit') geen verschillen tussen deprogrammakinderen en de kinderen uit de controlegroep.

Tabel 2.2 Resultaten van de 2000-meting in groep 3 (alle kinderen in groep 3); eerst ruw (on-

gecontroleerd); daarna gecontroleerd voor covariaten;aantallen, gemiddelden, SD 's en d-

scores voor paarsgewijze vergelijkingen tussen programma's en controlegroep.

19

Een jaar later. Vervolgonderzoek evaluatie van kaleidoscoop en piramide

a Een hoge score op deze schaal betekent negatief sociaal-emotioneel gedrag Co-variaten: Etnische groep (Turks, Marokkaans, overig), thuistaal, opleiding ouders,leerlinggewicht, sekse; schoolscore; dummies voor ontbrekende gegevens #p<.10; * p<.05; ** p<.01

20

Resultaten

2.1.1 Prima-gegevens als landelijke achtergrondAl in een eerdere meting (1999) was bij de onderzoekskinderen een vergelijkingmet een controlegroep uit het Primacohort gepland. Bij nadere analyse bleek toenechter dat teveel onderzoekskinderen jonger waren dan de kinderen die reguliermeedoen aan het Primacohort-onderzoek en mede daardoor lager scoorden. Naaraanleiding hiervan is in overleg met de opdrachtgever besloten de vergelijkingmet de Primacohort-gegevens in 2000 nogmaals uit te voeren.De Begrippen- en Ordenentoetsen uit groep 2 zijn in het schooljaar 1988/99 ookafgenomen in het Primacohort-onderzoek. Dit geeft in principe de mogelijkheidom de scores van de kinderen op de Kaleidoscoop- en Piramidescholen nu ook tevergelijken met een landelijke steekproef. Bovendien kan, door het vergelijkenvan de scores van leerlingen op de controlescholen met de landelijke steekproef,een indicatie worden verkregen of de correctie voor verschillen in achtergrond-kenmerken, zoals die in dit onderzoek via de eerder gehanteerde covariaten wordtuitgevoerd, van voldoende kwaliteit is. Dit is het geval wanneer de scores op decontrolescholen na de correctie overeenkomen met de landelijke scores.Een probleem bij de vergelijking met de landelijke Primagegevens is wel het ver-schil in afnametijdstip. In het Prima-onderzoek zijn de toetsen in groep 2afgenomen in de maanden januari tot maart; in dit onderzoek werd er in de maan-den mei en juni getoetst. Informatie uit het Prima-onderzoek leert dat juist bij dekleutergroepen een afname van drie maanden later tot een significant hogere ge-middelde toetsscore leidt. De vergelijking met de landelijke gegevens zal daarommet enige omzichtigheid moeten gebeuren.

GROEP 2De Prima groep bestaat uit leerlingen uit groep 2 van de referentiesteekproefwaarvan toetsscores op Begrippen en Ordenen bekend zijn. Informatie over dethuistaal van de leerlingen werd verkregen uit de oudervragenlijst2; informatieover de overige covariaten is van de scholen verkregen.

2 Thuistaal wordt in de Oudervragenlij st (groep 2) als volgt bevraagd: gevraagd is naar: spreek-taal met moeder, spreektaal met vader, spreektaal met broers en zusjes, spreektaal oudersonderling. De scoring hiervan is als volgt: Indien bij 0 of hooguit 1 is gezegd: spreektaal isNederlands, dan is Nederlands geen thuistaal. Bij 2 of meer is Nederlands wel thuistaal; in-dien 3 of 4 vragen niet zijn ingevuld: thuistaal is missing.

21

Een jaar later. Vervolgonderzoek evaluatie van kaleidoscoop en piramide

We geven in tabel 2.3 allereerst een overzicht van enkele achtergrondkenmerkenvan leerlingen uit groep 2 op de programmascholen, de controlescholen en in dePrimagroep.

Tabel 2.3 Achtergrondkenmerken leerlingen uit groep 2; inclusief de landelijke PRIMA-groep

indeling naar geboorte-

jaar/kwartaal

jong

normaal

oud

percentage meisjes

percentage etnische kinderen

(Turks/Marokkaans/overig)

percentage 1.25 leerlingen

percentage 1.90 leerlingen

percentage thuistaal Neder-

lands

(hoogste) Opleiding ouders

(1= hooguit lo; tot 4 = hbo/wo)

SE-score

# p<.10; * p<.05; ** p<.01

De leerlingbevolking op de programmascholen onderscheidt zich duidelijk vandie op de landelijke steekproef van scholen. Op de programmascholen zijn onge-veer 2 op de 3 leerlingen van allochtone herkomst, landelijk is dat minder dan 1op de 5. Ook bij de SE-score zien we dat verschil terug, evenals bij het percentageleerlingen met het Nederlands als thuistaal.De leerlingbevolking op de controlescholen neemt een tussenpositie in: bedui-dend meer allochtoon gekleurd dan landelijk, maar wel minder dan deprogrammascholen.

22

Resultaten

In tabel 2.4 staan de resultaten op de Begrippen- en Ordenentoets weergegevenvoor de leerlingen uit de twee typen programmascholen, de controlegroep en delandelijk Prima-referentiegroep.

Tabel 2.4 Resultaten van de 2000-meting in groep 2; PRIMA als landelijke referentie; eerst ruw

(ongecontroleerd); daarna gecontroleerd voor covariaten; aantallen, gemiddelden, SD 's en d-

scores voor paarsgewijze vergelijkingen tussen programma's en controlegroep enerzijds en de

landelijke referentiegroep anderzijds

Covariaten: Etnische groep (Turks, Marokkaans, overig), thuistaal, opleiding ou-ders, leerlinggewicht, sekse; schoolscore; dummies voor ontbrekende gegevens; #p<.10; * p<.05; ** p<.01

Bij de Begrippentoets zien we dat beide programma's duidelijk lager scoren danlandelijk; ook de controleleerlingen hebben een lager gemiddelde, maar het ver-schil is minder groot. Na controle voor de covariaten verschillen de `adjusted'gemiddelden van zowel Kaleidoscoop als Piramide weinig meer van landelijk. Decontrolegroep scoort nu significant hoger dan landelijk, waarschijnlijk doordat detoetsen bij dit onderzoek enkele maanden later zijn afgenomen.Bij Ordenen zijn vooral de ruwe scores bij Kaleidoscoop duidelijk lager dan lan-delijk. De controlegroep verschilt minder en Piramide scoort vrijwel gelijk metlandelijk. Na controle voor de covariaten is het gemiddelde van zowel Piramideals de controlegroep hoger dan landelijk. Kaleidoscoop scoort nog steeds lager.

23

Een jaar later. Vervolgonderzoek evaluatie van kaleidoscoop en piramide

Ook nu zal het tijdstip van afname oorzaak zijn van de hogere gecorrigeerde scorebij de controlegroep.

Hoewel de leerlingbevolking op de scholen uit de controlegroep duidelijk ver-schilt van die in de landelijke Prima referentiegroep en aanzienlijk meer`kansarme' leerlingen telt, blijken de gemiddelde scores op de controlescholen, nacorrectie voor de covariaten, wat hoger te liggen dan landelijk; dit wat hogere ni-veau hadden we verwacht vanwege het latere moment van de toetsafnames. Weconcluderen daarom dat de gehanteerde correctie voor verschillen in kenmerkenvan de leerlingbevolking voldoende is om het beeld van de controlescholen inovereenstemming te brengen met het landelijke beeld. Daarmee vormen de con-trolescholen, na deze correctie voor verschillen in covariaten, ook een goedevergelijkingsmaatstaf voor de beide typen programmascholen.

2.2 Analyse II: Ontwikkeling van leerlingen tussen 1999 en 2000

We komen nu tot de resultaten die de ontwikkeling van de onderzoekskinderenover het jongste onderzoeksjaar betreffen. Het gaat dan dus om alle kinderenwaarvoor we over gegevens van zowel 1999 als van 2000 beschikken. Ongeveertweederde van deze leerlingen zit in 2000 in groep 2 en de rest in groep 3. Deaantallen zijn aanzienlijk lager dan bij de vorige analyses. In deze paragraaf pre-senteren we afzonderlijke analyses voor groep 2 en 3. Per groep laten we tweetabellen zien: eerst de stand van zaken in 2000; vervolgens de ontwikkeling(groeiscores) tussen 1999 en 2000.De ontwikkeling van de leerlingen tussen 1999 en 2000 wordt bepaald door na tegaan in hoeverre leerlingen vooruit zijn gegaan op een bepaald domein. We ma-ken daarvoor gebruik van zogenaamde residuele verschilscores. Deze wordenbepaald door per toets een regressievergelijking op te stellen met de beginmetingen covariaten als predictoren3 . De door deze predictoren verklaarde variantie in descores van de tweede meting wordt vervolgens afgetrokken van de totale varian-tie; er resteert een constante (de intercept) en een residuele variantie. De constante

3 Als covariaten gebruiken we bij deze groep onderzoekskinderen dezelfde als die gebruikt zijnbij Veen et al. (2000). Omdat hier nauwelijks ontbrekende waarden zijn op deze covariatenhoeven daarvoor ook geen dummies worden ingevoerd.

24

Resultaten

staat voor de gemiddelde toename in scores (groei), de resterende residuele vari-antie voor individuele verschillen in toename. Anders dan gewone verschilscoresgelden residuele verschilscores als betrouwbaar. Bovendien zijn gewone verschil-scores lastig te hanteren wanneer bij voor- en nameting op een bepaald domeinverschillende toetsen worden gebruikt. De residuele verschilscores verwijzendaarmee naar verschillen tussen kinderen in ontwikkeling, in dit geval tussen demeting van 1999 en die van 2000.

GROEP 2In de volgende tabel zien we de resultaten van de 2000-meting van groep 2 op detoetsen Begrippen, Ordenen en TAK (passieve woordenschat) voor de drie condi-ties. In het onderste deel van de tabel staan de scores op de gedragsbeoordelingen(Schobl-R).

Tabel 2.8 Resultaten van de 2000-meting in groep 2 voor de onderzoeksindereneerst ruw (on-

gecontroleerd); daarna gecontroleerd voor covariaten; aantallen, gemiddelden, SD's en d-

scores voor paarsgewijze vergelijkingen tussen programma's en controlegroep.

25

Een jaar later. Vervolgonderzoek evaluatie van kaleidoscoop en piramide

a Een hoge score op deze schaal betekent negatief sociaal-emotioneel gedrag Co-variaten: Etnische groep (Turks, Marokkaans, overig), thuistaal, opleiding ouders,leerlinggewicht, sekse; schoolscore; dummies voor ontbrekende gegevens #p<.10; *p<.05; ** p<.01

Voor wat betreft de scores op de toetsen komt het beeld van de verschillen tussenprogrammakinderen en de controlegroep overeen met dat bij alle kinderen ingroep 2 (tabel 2.1). Als we kijken naar de gedragsoordelen zien we, nog duidelij-ker dan bij de hele groep (tabel 2.1), dat de Kaleidoscoopkinderen lagerbeoordeeld worden op aangenaam gedrag. Tevens zien we de tendens dat de Ka-leidoscoopkinderen minder hoger worden beoordeeld op de schaal extraversie.

26

Resultaten

Een hoge score op deze schaal wordt beschouwd als minder gunstig dan een lagescore.Vervolgens willen we bij deze groep de ontwikkeling vaststellen van vaardighe-den die in 2000 gemeten zijn met de toetsen Begrippen, Ordenen en de TAK(passieve woordenschat) en van de ontwikkelingen op het sociaal-emotioneledomein (gedragsoordelen). Tabel 2.9 geeft de resultaten voor de drie condities ingroep 2. Voor wat betreft de toetsen analyseren we de ontwikkeling ten opzichtevan de scores op de in 1999 afgenomen (verkorte) Begrippen- en Ordenentoetsenen op de in 1999 in het Nederlands afgenomen helft van de TAKtoets. De ver-schilscores zijn hierin weergegeven als afwijkingen van de gemiddeldeverschilscore, met de bijbehorende standaardafwijking.

Tabel 2.9 Residuele verschilscores 2000-1999 in groep 2 uitgedrukt als afwijking van de gem.

residuele verschilscore, zowel ruw (ongecontroleerd) als gecontroleerd voor covariaten inclu-

sief de schoolscore; gemiddelden, SD's en d-scores voor paarsgewijze vergelijkingen tussen

programma's en controlegroep

27

Een jaar later. Vervolgonderzoek evaluatie van kaleidoscoop en piramide

a Een hoge score op deze schaal betekent negatief sociaal-emotioneel gedrag Co-variaten: Turks, Marokkaans, thuistaal, SES, sekse; schoolscore # p<.10; * p<.05;** p<.01

Op de toets Begrippen zijn de programmakinderen minder sterk vooruitgegaandan de controlekinderen. Voor Piramide geldt dit sterker dan voor Kaleidoscoop,waar het verschil met de controlegroep na controle op de covariaten niet meersignificant is.Bij Ordenen zijn de ontwikkelingen in de verschillende condities ongeveer gelijk.Hierbij moet worden aangemerkt dat de Piramidekinderen bij de vorige meting(1999) significant hoger scoorden op Ordenen dan de controlekinderen en ook in2000 is dit verschil met de controlegroep nog positief (zie tabel 2.8), maar het ef-

28

Resultaten

fect is iets minder sterk, oftewel: Piramide heeft nog steeds een voorsprong opOrdenen maar het verschil met de controlegroep is iets kleiner geworden dan bijde vorige meting.Op het onderdeel Passieve Woordenschat van de TAK zijn de Kaleidoscoopkin-deren significant minder sterk vooruitgegaan dan de controlekinderen. DeKaleidoscoopkinderen scoorden bij de vorige meting (1999) juist hoger op debeide toen afgenomen woordenschattoetsen (DTT en gedeelte uit de TAK). Hetlijkt er dus op dat de controlekinderen hun achterstand op Kaleidoscoop het afge-lopen jaar wat hebben ingelopen. Bij de gedragsoordelen zien we een negatievetendens bij de score op aangenaam gedrag, vooral bij Kaleidoscoop. Tevens zienwe een zelfde tendens bij emotionele stabiliteit, nu vooral bij de Piramidekinde-ren. De tendens in 1999 was dat de onderzoekskinderen op allebei hogerscoorden. De controlekinderen komen nu op deze domeinen dus dichter bij descores van de kinderen uit de programmagroepen.

GROEP 3Een kleiner deel van de onderzoekskinderen bevond zich tijdens de meting in2000 in groep 3. Eerst presenteren we de tabel met de scores die de stand van za-ken op deze toetsen in 2000 weergeven.

29

Een jaar later. Vervolgonderzoek evaluatie van kaleidoscoop en piramide

Tabel 2.10 Resultaten van de 2000-meting in groep 3 voor de onderzoekskindereneerst ruw

(ongecontroleerd); daarna gecontroleerd voor covariaten; aantallen, gemiddelden, SD 's en d-

scores voor paarsgewijze vergelijkingen tussen programma's en controlegroep.

Covariaten: Etnische groep (Turks, Marokkaans, overig), thuistaal, opleiding ou-ders, leerlinggewicht, sekse; schoolscore; dummies voor ontbrekende gegevens #p<.10; * p<.05; ** p<.01

Alleen bij de leerkrachtoordelen wijkt het beeld af van dat van de hele groep 3(tabel 2.2). Daar scoorden de programmakinderen na controle hoger op beideleerkrachtoordelen (dus zowel op technisch als begrijpend lezen). Hier geldt datalleen nog voor Piramide bij het oordeel begrijpend lezen. Bij Kaleidoscoop is detendens bij het oordeel over het AVI-niveau zelfs negatief.Vervolgens willen we voor deze kinderen de ontwikkeling bepalen op de domei-nen die in 2000 gemeten zijn met de Woordenschattoets en de toets Rekenen-

30

Resultaten

Wiskunde (tabel 2.11). In deze tabel staan ook de resultaten op de oordelen be-grijpend lezen en technisch lezen (AVI-niveau). We analyseren de ontwikkelingten opzichte van de scores op de in 1999 in het Nederlands afgenomen helft vande Woordenschattoets en de (verkorte) Ordenentoets.Verder willen we de ontwikkeling op het gebied van begrijpend lezen nagaandoor het oordeel in 2000 van de docent op dit punt af te zetten tegenover de scoreop de (verkorte) Begrippentoets uit 1999. We veronderstellen dat beide metingenvoldoende hetzelfde domein betreffen (ook gezien de onderlinge correlatie van.61). Voor het oordeel over technisch lezen presenteren we geen residuele ver-schilscores. Het oordeel over het AVI-niveau blijkt laag te correleren met eerdere`talige' toetsen, zodat er niet van een ontwikkeling kan worden gesproken. HetAVI-niveau moet daarom als een nieuw gemeten domein worden beschouwd.

Tabel 2.11 Residuele verschilscores 2000-1999 in groep 3 uitgedrukt als afwijking van de ge-

middelde residuele verschilscore, zowel ruw (ongecontroleerd) als gecontroleerd voor

covariaten; gemiddelden, SD's en d-scores voor paarsgewijze vergelijkingen tussen program-

ma's en controlegroep.

Covariaten: Turks, Marokkaans, thuistaal, SES, sekse; schoolscore # p<.10; *p<.05; ** p<.01

31

Een jaar later. Vervolgonderzoek evaluatie van kaleidoscoop en piramide

Deze tabel over de residuele verschilscores van de kinderen in groep 3 laat geensignificante verschillen zien tussen de programmakinderen en de controlegroep.Voor de Woordenschattoets geldt dat de programmakinderen, met name de Ka-leidoscoopkinderen in 1999 hoger scoorden dan de controlegroep. In 2000 is hetverschil van Kaleidoscoop met de controlegroep nog steeds positief, maar nietmeer significant. Dit duidt erop dat de controlegroep de achterstand ten opzichtevan de Kaleidoscoopkinderen (en overigens ook ten opzichte van Piramide) ietsheeft ingelopen.Bij Rekenen-Wiskunde gaat het om de ontwikkeling ten opzichte van de (verkor-te) Ordenentoets. In 1999 was de tendens dat de programmakinderen hierop hogerscoorden; bij de Piramidekinderen was het verschil met de controlegroep zelfssignificant. Op dit moment constateren we geen verschillen in groei tussen deprogrammakinderen en de controlegroep. Dit duidt erop dat de Piramide- en Ka-leidoscoopkinderen hun voorsprong op dit terrein verliezen.Bij het oordeel Begrijpend lezen zien we een ander beeld. De tendens is dat deprogrammakinderen zich op dit domein van 'taal- en tekstbegrip' iets beter ont-wikkelen dan de controlegroep. Het gaat hier om een vergelijking tussen eentoetsscore in 1999 en een leerkrachtoordeel in 2000, dus de vaardigheid is wel opeen verschillende manier vastgesteld.

2.3 Analyse III: Ontwikkeling van de doorstroomgroep tussen1997 en 2000

In het voorgaande analyseerden we de ontwikkeling van de onderzoekskinderentussen 1999 en 2000. Onder deze leerlingen zitten kinderen die vanaf het beginmeedoen met het onderzoek, maar ook leerlingen die tussentijds zijn ingestroomd.Een laatste manier om de programma's te evalueren is om de ontwikkeling overde gehele onderzoeksperiode na te gaan van alleen die kinderen, die vanaf het be-gin in het onderzoek zijn opgenomen: de zogenaamde doorstroomgroep. Eennadeel is wel dat het dan om een kleinere groep kinderen gaat en omdat een deelin groep 2 en een deel in groep 3 zit, zijn de aantallen soms te klein om hardeconclusies te kunnen trekken. De resultaten van deze paragraaf moeten daarommeer als indicatief gezien worden.

32

Resultaten

GROEP 2Bij deze groep willen we weer de ontwikkeling vaststellen van vaardigheden diein 2000 gemeten zijn met de toetsen Begrippen, Ordenen en de TAK (woorden-schat), alsmede op de gedragsoordelen. Eerst tonen we de stand van zaken in2000.

Tabel 2.12 Resultaten van de 2000-meting in groep 2 voor de doorstroomgroepeerst ruw (on-

gecontroleerd); daarna gecontroleerd voor covariaten; aantallen, gemiddelden, SD's en d-

scores voor paarsgewijze vergelijkingen tussen programma's en controlegroep.

33

Een jaar later. Vervolgonderzoek evaluatie van kaleidoscoop en piramide

a Een hoge score op deze schaal betekent negatief sociaal-emotioneel gedrag Co-variaten: Etnische groep (Turks, Marokkaans, overig), thuistaal, opleiding ouders,leerlinggewicht, sekse; schoolscore; dummies voor ontbrekende gegevens #p<.10; * p<.05; ** p<.01

Op de toetsen zien we het beeld dat de verschillen tussen programma- en contro-lekinderen overeen komt met dat bij alle kinderen in groep 2 (tabel 2.1) en bij alle

onderzoekskinderen (tabel 2.8). Voor wat betreft de gedragsoordelen zien we bijdeze doorstroomgroep, nog duidelijker dan bij de groeter groep onderzoekskinde-ren (vgl. tabel 2.8) dat de Kaleidoscoopkinderen lager scoren op de schaalaangenaam gedrag en hoger op de schaal extraversie. Bij beide programma's isde tendens dat de werkhouding minder wordt beoordeeld dan bij de controlekin-deren. Om de groei tussen 1997 en 2000 te kunnen bepalen, analyseren we deontwikkeling bij begrippen en woordenschat (TAKtoets) ten opzichte van de sco-res op de in 1997 in het Nederlands afgenomen helft van de passievewoordenschattoets van de DTT (zie ook Veen et al, 2000, p. 17-18). Bij ordenenanalyseren we de ontwikkeling ten opzichte van de scores op de in 1997 afgeno-men Vragenlijst Denkprocessen (VLDP). Bij de gedragsoordelen kijken we naar

34

Resultaten

de ontwikkeling tussen 1997 en 2000, op beide meetmomenten werd de zelfdeschaal gebruikt. Tabel 2.13 geeft een samenvatting van de resultaten.

Tabel 2.13 Residuele verschilscores 2000-1997 in groep 2 uitgedrukt als afwijking van de ge-

middelde residuele verschilscore, zowel ruw (ongecontroleerd) als gecontroleerd voor

covariaten inclusief de schoolscore;gemiddelden, SD's en d-scores voor paarsgewijze vergelij-

kingen tussen programma's en controlegroep.

35

Een jaar later. Vervolgonderzoek evaluatie van kaleidoscoop en piramide

a Een hoge score op deze schaal betekent negatief sociaal-emotioneel gedragCovariaten: Turks, Marokkaans, thuistaal, SES, sekse; schoolscore# p<.10; * p<.05; ** p<.01

Deze tabel met gegevens over de doorstroomgroep laat op de toetsen geen signifi-cante verschillen in groei zien tussen de programmakinderen en de controlegroeptussen de eerste meting in 1997 en het laatste meetmoment. Als we kijken naar degroeiscores op de afzonderlijke toetsen dan is de tendens op de Begrippentoets datde programmakinderen minder vooruit zijn gegaan ten opzichte van de eerste me-ting in 1997 dan de controlegroep. Wanneer we echter kijken naar groeiscores opde Woordenschattoetsen Nederlands op eerdere meetmomenten, dan zien we datin eerdere jaren de programmakinderen meer groei vertoonden dan de controle-groep. In 1998 was het verschil voor de Piramidekinderen significant; in 1999vertoonde juist de Kaleidscoopgroep significant meer groei ten opzichte van deeerste meting in 1997. De groeiscores vertonen op deze 'talige' toetsen dus eengrillig patroon over de jaren.Op Ordenen en de VLDP is het patroon iets consistenter. Over de jaren heen ver-tonen de programmagroepen steeds iets meer vooruitgang dan de controlegroep(behalve Piramide tussen 1997 en 1998), al zijn de verschillen nergens signifi-cant.De TAK-toets laat geen verschillen in groei zien tussen 1997 en 2000. Kijken wenaar de programma's afzonderlijk dan zien we dat er bij Kaleidoscoop tussen1997 en 1999 wel een positief verschil was met de controlegroep op de Passieve

36

Resultaten

Woordenschattoets Nederlands. Die voorsprong hebben de Kaleidoscoopkinderennu (in 2000) niet meer en is zelfs omgebogen in een klein –niet significant- nega-tief verschil in groei met de controlegroep. Bij de Piramidekinderen is het beelddat hun vooruitgang op de Woordenschattoets in eerdere jaren steeds positief isgeweest ten opzichte van de controlegroep, alleen in de periode 1997-1998 washet verschil in groei met de controlegroep significant.Op de gedragsoordelen (schalen Schobl-R) zien we bij Kaleidoscoop als tendenseen achteruitgang op werkhouding en aangenaam gedrag; bij de Piramidekinde-ren is dat veel minder het geval. Op deze beide onderdelen scoorde decontrolegroep in 1997 al beter; de conclusie zou dus luiden dat de controlegroepzijn voorsprong op deze onderdelen heeft vergroot. Op emotionele stabiliteit zienwe bij de Piramidekinderen een mindere ontwikkeling (de kinderen lopen nogmeer achter bij de controlegroep dan ze in 1997 al deden). Bij Kaleidoscoop is deontwikkeling juist andersom: hier lopen de leerlingen hun achterstand van 1997in.

GROEP 3Bij deze groep willen we de ontwikkeling bepalen op de domeinen die in 2000gemeten zijn met de Woordenschattoets en de toets Rekenen-Wiskunde. Eerstpresenteren we de stand van zaken op deze toetsen alsmede de scores op de oor-delen begrijpend en technisch lezen in 2000.

37

Een jaar later. Vervolgonderzoek evaluatie van kaleidoscoop en piramide

Tabel 2.14 Resultaten van de 2000-meting in groep 3 voor de doorstroomgroep eerst ruw (on-

gecontroleerd); daarna gecontroleerd voor covariaten; aantallen, gemiddelden, SD 's en d-

scores voor paarsgewijze vergelijkingen tussen programma's en controlegroep.

Covariaten: Etnische groep (Turks, Marokkaans, overig), thuistaal, opleiding ou-ders, leerling-gewicht, sekse; schoolscore; duinmies voor ontbrekende gegevens.#p<.10; * p<.05; **p<.01

Het globale beeld is in overeenstemming met het beeld over de hele groep 3 (zietabel 2.2).

38

Resultaten

Voor het bepalen van de groeiscores analyseren we de ontwikkeling ten opzichtevan de scores op de in 1997 in het Nederlands afgenomen helft van de Woorden-schattoets en op de in 1997 afgenomen Vragenlijst Denkprocessen (VLDP).In tabel 2.15 staan de resultaten samengevat, waarbij we nogmaals willen wijzenop de zeer kleine aantallen in deze analyses. Voor het oordeel over begrijpend le-zen presenteren we geen groeiscores, omdat het aantal waarnemingen in decontrolegroep hier minder dan 4 is.

Tabel 2.15 Residuele verschilscores 2000-1997 in groep 3 uitgedrukt als afwijking van de ge-

middelde residuele verschilscore, zowel ruw (ongecontroleerd) als gecontroleerd voor

covariaten inclusief de schoolscore; gemiddelden, SD's en d-scores voor paarsgewijze verge-

lijkingen tussen programma's en controlegroep.

Covariaten: Turks, Marokkaans, thuistaal, SES, sekse; schoolscore # p<.10; *p<.05; ** p<.01

Om te beginnen laat de tabel de kleine aantallen kinderen zien die voor deze ana-lyses beschikbaar waren; vooral bij de Kaleidoscoop- en de controlegroep.Als we kijken naar de resultaten voor deze kinderen uit de doorstroomgroep zienwe geen significante verschillen in vooruitgang tussen de programmakinderen ende controlegroep in de periode 1997 – 2000.Kijken we naar tendensen dan zien we dat de Kaleidoscoopkinderen op zowel detalige (woordenschat) als de meer mathematische toetsen (VLDP – Rekenen-Wiskunde) een betere ontwikkeling hebben doorgemaakt dan de controlegroep.

39

Een jaar later. Vervolgonderzoek evaluatie van kaleidoscoop en piramide

Bij de Piramidekinderen geldt het omgekeerde, zij scoren juist iets slechter dan decontrolegroep. Bij Rekenen-Wiskunde valt op dat het verschil van Piramide metde controlegroep groter wordt na controle voor de covariaten. Nogmaals moet be-nadrukt worden dat de aantallen te klein zijn om harde conclusies op te baseren.

2.4 Nadere gegevens over de onderzoeksscholen

Reeds eerder werd duidelijk dat de groep controle-leerlingen op scholen zittendie, gemeten aan hun SE-score, een mogelijk gunstiger leeromgeving bieden dande beide groepen programmascholen. Bij deze folluw-up is getracht nog nader in-formatie te verkrijgen die een indruk kan geven van mogelijke andere verschillentussen programma- en controlescholen. Daartoe zijn vragenlijsten voorgelegd aandirecties en leerkrachten van de kleutergroepen. In deze paragraaf doen we ver-slag van de uitkomsten van dit deel van het onderzoek, waarbij steedscontrolescholen en programmascholen worden vergeleken. Omdat de vragenlijs-ten voor het grootste deel afkomstig zijn uit het Prima cohortonderzoek zullen we,indien dat verhelderend is, ook landelijke gegevens van de Prima referentiesteek-proef vermelden. Deze zijn gerapporteerd in Ledoux et al., 2000.

2.4.1. Gegevens afkomstig van de directiesIn totaal werden 22 vragenlijsten terug ontvangen; 12 daarvan zijn afkomstig vande directie van programmascholen (4 maal Kaleidoscoop, 8 maal Piramide) en 10van directies van controlescholen.

Leerlingenaantal en veranderingen daarin

De algemene tendens in de cijfers is dat Piramidescholen wat kleiner zijn. Zo zijner geen Piramidescholen met 250 of meer leerlingen, terwijl dat voor 50% van deKaleidoscoop en 40% van de controlescholen wel zo is.Een tweede tendens is dat beide typen programmascholen de laatste jaren watkleiner geworden zijn. Het leerlingenaantal van ongeveer de helft van deze scho-len is de afgelopen jaren gedaald, bij een kwart van de Piramidescholen wordt dedaling door de directie zelfs sterk genoemd. Bij de controlescholen is er maar bij20% sprake van een (lichte) daling (en landelijk zegt ongeveer 25% dat de leer-lingenaantallen gedaald zijn).

40

Resultaten

Veranderingen in aandeel allochtone leerlingen

De scholen verschillen in het aandeel allochtone leerlingen, maar hier gaat het omde vraag of dat aandeel de laatste jaren sterk is gewijzigd. 30 tot 50 procent vande directies spreekt van een toename van het aandeel allochtone leerlingen in deafgelopen jaren, 10 tot 25 procent spreekt juist van een afname. Er zijn geen dui-delijke verschillen op dit punt tussen de programma- en de controlescholen.Terzijde vermelden we dat van de 5 programmascholen die spreken van een toe-name van het aandeel allochtone leerlingen er 2 directies zijn die dat (mede)toeschrijven aan de deelname aan het programma; van de 3 scholen die een dalingmelden schrijft geen enkele dat toe aan de programmadeelname.

Tussentijdse in- en uitstroom

Hierbij is de tendens dat Kaleidoscoopscholen minder tussentijdse instroom ver-melden dan zowel de Piramide- als de controlescholen. Met betrekking tot demate van tussentijdse uitstroom zijn er weinig verschillen tussen beide typen pro-grammascholen en controlescholen.

Contacten met voorschoolse voorzieningen

Alle programmascholen, maar ook vrijwel alle controlescholen onderhouden con-tacten met peuterspeelzalen. Verder onderhouden alle Kaleidoscoopscholen ookcontact met kinderdagverblijven; bij de Piramide- en de controlescholen geldt datvoor ongeveer 33% van de scholen. Een laatste verschil is dat 3 van de 4 Kaleido-scoopscholen eigen voorschoolse voorzieningen in huis hebben; voor de anderetwee groepen scholen geldt dat niet.Er zijn verder geen opvallende verschillen tussen de scholen in het doel van devoorschoolse contacten. Wel lijken al deze scholen meer belang te hechten aandeze contacten dan landelijk. Op een schaal van 1 tot 3 scoren deze onderzoek-scholen gemiddeld 2.6, terwijl dat landelijk 1.95 is.

2.4.2. Gegevens afkomstig van leerkrachten groep 2In totaal werden 34 vragenlijsten terug ontvangen; 25 daarvan zijn afkomstig vanleerkrachten op programmascholen (15 maal Kaleidoscoop, 10 maal Piramide) en9 van leerkrachten op controlescholen.

41

Een jaar later. Vervolgonderzoek evaluatie van kaleidoscoop en piramide

(Onderwijskundige) omstandigheden

Bij Piramide en de controlescholen komen combinatieklassen relatief weinigvoor: ongeveer de helft van de leerkrachten heeft alleen leerlingen van groep 2 inde klas. Bij Kaleidoscoop geldt dat maar voor 7%, de overige 93% heeft eencombinatieklas. Ook landelijk komen combinatieklassen het meest voor (81%).Het aantal leerlingen in de klas is bij Kaleidoscoop en Piramide iets lager (22.8resp. 22.1) dan bij de controlescholen (24.8); landelijk wordt hier een gemiddeldevan 24.7 behaald.Het aandeel duobanen verschilt weinig tussen de scholen: 44% is enige leer-kracht, 38% heeft een duobaan en bij de rest is sprake van een substantiëlevervanging; dit komt ongeveer overeen met het landelijk beeld.Wel is er bij de programmascholen, conform de bedoeling, vaker sprake van eendubbele bezetting. Bij de controlescholen is dat voor 89% hooguit 1 dagdeel perweek het geval (landelijk 77%), maar bij Kaleidoscoop voor geen enkele schoolen bij Piramide bij 20%. Van vier of meer dagdelen per week dubbele bezetting isbij 11% van controlescholen sprake (landelijk 8%), maar bij Kaleidoscoop en Pi-ramide bij respectievelijk 79 en 50 procent.

Systematisch contact met voorschoolse voorzieningen

Van systematische contacten met voorschoolse voorzieningen is bij Kaleidoscoophet meest sprake, namelijk bij 60% van de leerkrachten. Bij Piramide geldt datvoor 40% en bij de controlescholen voor 33%. Dat is wel hoger dan landelijk,waar slechts 18% systematische contacten met voorschoolse voorzieningen on-derhoudt.Over het doel en het belang van deze contacten zijn er geen grote verschillen tus-sen de typen scholen. Wel wordt er door deze leerkrachten meer belang aangehecht dan landelijk. Op een schaal van 1 tot 5, die dit meet, scoren de leer-krachten van Kaleidoscoop en Piramide gemiddeld 4.0 en 4.2, terwijl decontrolegroep 4.1 scoort. Landelijk is het gemiddelde op dit schaaltje 3.9.

Overgang van groep 2 naar groep 3

Ongeveer 90% bereidt die overgang voor door de leerlingen bezoekjes te latenmaken aan groep 3. Er zijn geen belangrijke verschillen en dit is ook conform hetlandelijke beeld.

42

Resultaten

Ook op het gebied van de systematische aandacht voor voorbereidend lezen enrekenen bij de leerlingen en het gebruik van eventuele voorlopers bij de methodedie in groep 3 wordt gebruikt zien we geen belangrijke verschillen tussen de leer-krachten van beide typen programmascholen en van de controlescholen.

Oordelen over zichzelf en het team

Tot slot is de leerkrachten een reeks uitspraken voorgelegd over hun omgang metde leerlingen, over de waardering van het werk in de kleuterbouw binnen deschool en over het team van de school. Binnen het Primacohort-onderzoek zijn uitdeze uitspraken drie schalen geconstrueerd, die ook bij deze kleinere groep leer-krachten op programma- en controle scholen voldoende betrouwbaar blijken tezijn (alpha's van .76 tot .85). Het gaat dan om de schalen (zie voor details: Le-doux et al., 2000, p. 139-140):• vertrouwen in eigen kunnen• oordeel waardering kleuteronderwijs op school• oordeel teamcohesieIn de volgende tabel geven we gemiddelden, ook voor de landelijke referen-tiesteekproef van Prima.

Tabel 2.16 Oordelen over zichzelf en het eigen team. Schaalgemiddelden programma's,

controlegroep en landelijke steekproef Primacohort-onderzoek.

We vinden nauwelijks verschillen op deze schalen tussen leerkrachten van debeide typen programmascholen en de controlescholen. Al deze leerkrachten heb-ben gemiddeld iets meer vertrouwen in eigen kunnen dan landelijk. Dewaardering voor het werk in de kleuterbouw lijkt op de programmascholen eenfractie hoger te liggen dan op de controlescholen en landelijk.En op de controlescholen is het oordeel over de teamcohesie wat lager dan op deprogrammascholen en landelijk.

43

Een jaar later. Vervolgonderzoek evaluatie van kaleidoscoop en piramide

2.4.3. ConclusieIn dit follow-up onderzoek zijn enkele onderdelen van het Prima instrumentariumgebruikt om te proberen wat meer beeld te krijgen van mogelijke verschillen tus-sen de scholen, waarop de programma's Piramide en Kaleidoscoop wordenuitgevoerd en de in dit onderzoek gebruikte controlescholen.Over het geheel genomen kan gesteld worden dat er weinig extra bijzonderhedennaar voren zijn gekomen. De programmascholen lijken iets vaker in de ongunsti-ge omstandigheid te verkeren dat hun leerlingaantal aan het dalen is.Daartegenover verkeren programmascholen duidelijk vaker in de gunstige om-standigheid dat er sprake is van een dubbele bezetting op de groep. Uiteraardheeft dit direct te met de deelname aan de programma's.

44

3 Samenvatting en conclusies

In deze rapportage wordt verslag gedaan van de follow-upstudie in het kader vanhet evaluatieonderzoek naar de programma's Kaleidoscoop en Piramide. Dezevervolgstudie is uitgevoerd in opdracht van het Ministerie van Onderwijs, Cultuuren Wetenschappen. Het onderzoek als geheel wordt uitgevoerd met als doel vastte stellen of de programma's Kaleidoscoop en Piramide een meerwaarde hebbenten opzichte van het reguliere aanbod in peuterspeelzalen en de onderbouw vanhet basisonderwijs. Ten behoeve van deze follow-up zijn, als vervolg op eerderemetingen in 1997, 1998 en 1999 in het jaar 2000 metingen verricht bij drie groe-pen kinderen: kinderen die deelnemen aan of hebben deelgenomen aanKaleidoscoop en Piramide en kinderen die een reguliere peuterspeelzaal en/of eenreguliere basisschool bezochten.Het rapport bouwt voort op de verslaglegging van de resultaten van eerdere me-tingen. Na de tweede meting (1998) zijn de tussentijdse resultaten beschreven ineen interimrapportage (Leseman, Veen, Triesscheijn en Otter, 1999) en vervol-gens, na de derde meting (1999) verscheen een eindrapport (Veen, Roeleveld enLeseman, 2000).De onderhavige rapportage heeft betrekking op de resultaten van de follow-upstudie.

De kinderen uit het evaluatieonderzoek naar Kaleidoscoop en Piramide bevindenzich op het moment van de uitvoering van deze vierde meting (2000) in de groe-pen 2 en 3 van het basisonderwijs. Een groot deel van de kinderen bevindt zich ophet moment van de toetsafname dus nog in de groep waar één van beide pro-gramma's (Kaleidoscoop of Piramide) wordt uitgevoerd. Van een effectmeting`enige tijd na afloop van het programma' is dus feitelijk voor een deel van de kin-deren nog geen sprake. Voor de kinderen in groep 3 (ongeveer een derde van dekinderen in het onderzoek) is dat wel het geval. Zij hebben het programma op hetmoment van de meting al bijna een jaar achter zich.

Een eerste, algemene conclusie naar aanleiding van de in dit rapport gepresen-teerde resultaten is, dat uit de tabellen geen consistente patronen naar vorenkomen. De resultaten zijn wisselend, over de jaren heen; per groep; per type toets.

45

Een jaar later. Vervolgonderzoek evaluatie van kaleidoscoop en piramide

Formuleerden we in het eindrapport nog dat de programma's al met al gunstignaar voren komen in vergelijking met de controleconditie, die conclusie valt opdit moment in algemene zin eigenlijk niet meer goed te handhaven.

Om meer greep te krijgen op de uitkomsten moeten we de resultaten op de afzon-derlijke (clusters van) analyses bekijken. In de eerste plaats kijken we naar degroeiscores. Dit zijn de resultaten van de kinderen die al eerder meededen met hetonderzoek, de `doorstroomgroep' die al sinds de peuterspeelzaal gevolgd wordten de 'onderzoekskinderen' die een jaar later, in groep 1, aan het onderzoek zijngaan meedoen. Het beeld is dan dat de aan Kaleidoscoop en Piramide deelnemen-de kinderen op Ordenen (en in het verlengde hiervan Rekenen-Wiskunde in groep3) sinds de eerste meting meer vooruit zijn gegaan dan de controlegroep. De ver-schillen met de controlegroep zijn niet altijd significant, maar het beeld is vakerpositief voor de programmakinderen. Het omgekeerde zien we, globaal, voor Be-grippen en Woordenschat. We concluderen voorzichtig dat de groei voor deprogrammakinderen meer lijkt te zitten in de vaardigheden op het logisch-mathemathische terrein (Ordenen, Rekenen/Wiskunde) dan op het talige (Begrip-pen/woordenschat). Op de schalen die we gebruiken voor het meten van desociaal-emotionele ontwikkeling van de kinderen, zien we door de jaren heen gril-lige patronen, ook wanneer we alleen kijken naar de doorstroomgroep. Wanneerwe echter kijken naar de ontwikkeling tussen het eerste en laatste meetmomentzien we vooral voor Kaleidoscoop als tendens een achteruitgang op de schalenwerkhouding en aangenaam gedrag. Bij Piramide zien we een mindere ontwikke-ling op emotionele stabiliteit in vergelijking met de controlegroep.

Voorts zijn er analyses uitgevoerd op de hele groep. Dat zijn in de eerste plaatskinderen die al eerder meededen, maar ook nieuwe kinderen, die in deze follow-up voor het eerst aan een testafname meedoen. Dan zien we de lagere score opBegrippen in vergelijking met de controlegroep terug: zowel Kaleidoscoop als Pi-ramide scoren lager op Begrippen dan de kinderen uit de controlegroep. OpWoordenschat echter is er geen verschil met de controlegroep en in 1999 scoor-den de programma's zelfs -meestal significant- hoger op woordenschat(Nederlands) dan de controlegroep.Op de scores voor Ordenen en Rekenen-Wiskunde verschillen de programma's indeze analyses. De Piramide-kinderen scoren significant hoger op Ordenen in

46

Samenvatting en conclusies

groep 2 dan de controlegroep, maar juist lager op Rekenen-Wiskunde in groep 3.Kaleidoscoop scoort juist lager op Ordenen en op Rekenen-Wiskunde gelijk aande controlegroep.Een nieuw, in eerdere metingen nog niet verzameld gegeven is de leesvaardigheidvan de kinderen in groep 3. De groep-drie-leerkrachten werd gevraagd per leer-ling zowel het niveau van het technisch lezen (AVI-niveau) als van het begrijpendlezen te registreren. Groep 3 staat in het teken van het leren lezen en omdat ze erhet hele jaar intensief mee bezig zijn en gedurende het jaar ook AVI-toetsjes af-nemen, hebben de leerkrachten naar verwachting een goed beeld van de prestatiesvan de kinderen op deze gebieden. Uit de analyses blijkt dat de kinderen uit deprogramma's zowel op begrijpend als op technisch lezen significant hoger scorendan de leerlingen uit de controlegroep. Ook al gaat het hier om leerkrachtregistra-ties, we hebben geen reden om aan te nemen dat de leerkrachten uit deprogrammascholen ten onrechte hogere scores toekennen of ongegrond positieveroordelen dan hun collega's uit de controlescholen. In de eerste plaats niet omdatde leesscore voor technisch lezen (AVI-niveau) immers bepaald wordt met behulpvan een externe maat. Voorts wordt de beoordeling niet gedaan door de directeuitvoerders van de programma's en leerkrachten die hier 'baat' bij zouden kunnenhebben, maar door de leerkrachten van groep 3, die verder van de directe pro-gramma-uitvoering af staan. Deze groep 3 leerkrachten zullen wellicht niet eensaltijd precies weten welke kinderen het programma hebben gevolgd. Een indicatievoor het feit dat de (groep-3-)programmaleerkrachten hun leerlingen niet syste-matisch en mogelijk ten onrechte gunstiger beoordelen dan de leerkrachten uit decontrolegroep vormen verder de scores op de gedragsoordelen. Die vallen immersniet onverdeeld gunstiger uit voor de programmakinderen. Er kan, met anderewoorden, heel goed daadwerkelijk sprake zijn van een beter leesbegrip en een be-tere technische leesvaardigheid bij de kinderen uit de programma's.

We zien in dit onderzoek over de jaren heen nogal wat wisselingen in de resulta-ten en het is moeilijk om 'harde' conclusies te trekken. Voor deze wisselendebevindingen zijn verschillende oorzaken aan te wijzen. Zo hebben we gedurendehet onderzoek te maken met wisselende groepen aan het onderzoek deelnemendekinderen. Er is sprake van uitval (bij de overgang van de peuterspeelzaal naar debasisschool; verhuizing; overstap naar andere basisscholen, etc). Maar er komenook kinderen bij: in groep 1 van de basisschool is de onderzoeksgroep aangevuld

47

Een jaar later. Vervolgonderzoek evaluatie van kaleidoscoop en piramide

met nieuwe 'nieuwe' onderzoekskinderen. Al op het tweede meetmoment hebbenwe dus kinderen in het onderzoek die sinds de speelzaal meedoen en kinderen dieveel korter aan de programma's zijn 'blootgesteld'. Het kan hier gaan om kinde-ren met heel uiteenlopende voorgeschiedenissen, bijvoorbeeld op het terrein vandeelname aan een voorschoolse voorziening: van kinderen die tot hun vierde jaarnooit aan een voorschoolse voorziening hebben deelgenomen tot kinderen dielangere tijd intensief een peuterspeelzaal, kinderdagverblijf of andere vorm vanopvang hebben bezocht. In de follow-up, waarin grotere aantallen kinderen wer-den betrokken bij de groepsgewijs afgenomen toetsen uit het Cito-leerlingvolgsysteem en de Primatoetsen, is de onderzoeksgroep nog eens uitge-breid.

De doorstroomgroep is de groep die het langst meedoet: aan de programma's en -voor zover het de controlegroep betreft - aan een peuterspeelzaal en een basis-school met een 'regulier' aanbod - althans, geen Kaleidoscoop of Piramide -. Wezouden onze uitspraken over de effecten van de programma's dan ook het liefstbaseren op de resultaten van deze kinderen. Het probleem met deze longitudinalegroep is dat hij (door verhuizing etc. maar ook doordat we, door ziekte of afwe-zigheid tijdens de testafname toetsgegevens van deze kinderen missen, waardoorwe niet steeds de beschikking hebben over een complete set gegevens) langza-merhand kleiner wordt. Dit is ook de reden voor de aanvullingen met nieuwekinderen. Maar bij de vierde meting is een bijkomende complicatie dat de kinde-ren nu verspreid zijn over de groepen 2 en 3 en hiermee over verschillende, niethelemaal vergelijkbare toetsen. De aantallen kinderen per toets zijn al met al navier jaar klein geworden, hetgeen de kans op toeval groter maakt en de interpreta-tie van de uitkomsten moeilijker.

Al met al verrichten we dus analyses op verschillende groepen kinderen (de door-stroomgroep, de onderzoekskinderen en alle kinderen) en die analyses gevenwisselende uitkomsten te zien.

Voorts geldt dat het onderzoek niet plaatsvindt in een laboratoriumsituatie, waarinwe allerlei verschijnselen naar onze hand kunnen zetten. Weliswaar is sprake vaneen onderzoeksopzet waarin programmascholen en een controlegroep met elkaarworden vergeleken, maar er heeft geen random verdeling van de kinderen over de

48

Samenvatting en conclusies

verschillende condities plaatsgevonden. De programmalocaties zijn destijds, on-der andere voor de experimenten geselecteerd vanwege het hoge percentage(allochtone) kinderen uit achterstandssituaties. Bij de selectie van de controleloca-ties speelde dit criterium ook een belangrijke rol: het moest gaan om speelzalenmet een naar sociaal-economische en etnische achtergrond zoveel mogelijk verge-lijkbare groep kinderen in dezelfde wijk of een vergelijkbare wijk elders. Enhoewel dus is geprobeerd om de controlegroep voor wat betreft de kenmerken vande leerlingpopulatie zoveel mogelijk te laten overeenkomen met de programma-locaties, vonden we toch aanwijzingen voor verschillen op dit aspect tussen deprogramma- en de controlescholen. Het is weliswaar gelukt om groepen kinderensamen te stellen die niet van elkaar verschillen op individuele achtergrondken-merken als leeftijd, sekse etniciteit en opleidingsniveau van de ouders. De SE-score van de Kaleidoscoop- en Piramidescholen bleek in de loop van het onder-zoek echter aanzienlijk hoger dan de SE-score van de controlescholen. Ditbetekent dat de kinderen in de controlegroep mogelijkerwijs in een gunstigerleeromgeving vertoeven dan de kinderen uit de programmascholen. Om hier ietsmeer over te kunnen zeggen is in het vervolgonderzoek daarom geprobeerd ommet behulp van vragenlijsten aan directie en leerkrachten van groep 2 op de pro-gramma- en de controlescholen aanvullende informatie te verkrijgen over enkeleschool- en klaskenmerken. We vonden op de bevraagde variabelen echter geennoemenswaardige verschillen. Als laatste is daarom geprobeerd om de positie vande drie groepen scholen te bepalen ten opzichte van het landelijke beeld. Hiervooris gebruik gemaakt van de gegevens van leerlingen uit groep 2 van de referen-tiesteekproef uit het Prima-bestand (representatief voor alle Nederlandsebasisscholen) waarvan de resultaten op Begrippen en Ordenen en verschillendeachtergrondkenmerken bekend zijn. Uit deze exercitie blijkt opnieuw dat de pro-grammascholen wat betreft etnische en sociaal-economische samenstelling eenwat andere positie innemen dan de controlescholen. Op de programmascholen ishet aandeel allochtone leerlingen veel groter dan landelijke gemiddeld. En ook bijde SE-score zien we dit verschil terug, evenals bij het percentage leerlingen methet Nederlands als thuistaal. De groep controlescholen neemt op dit punt een tus-senpositie in: beduidend meer allochtoon gekleurd dan landelijk, maar wel watminder dan de programmascholen.Naar aanleiding van de analyses op de toetsresultaten concluderen we dat, door tecontroleren voor deze verschillen in kenmerken van zowel individuele leerlingen

49

Een jaar later. Vervolgonderzoek evaluatie van kaleidoscoop en piramide

als van de betreffende scholen, de controlescholen redelijk overeenstemmen methet landelijke beeld. Daarmee vormt 'onze' controlegroep, nadat rekening is ge-houden met verschillen in samenstelling van de leerlingbevolking zoals die totuitdrukking komt in de hier gehanteerde covariaten, een geschikte maatstaf omleerlingen uit de programmascholen mee te vergelijken.

Andere ontwikkelingen die de onderzoekresultaten kunnen beinvloeden zijn pro-cessen in de uitvoeringspraktijk van de programma's. De eerste meting vond in depeuterspeelzalen plaats vlak na de trainingsfase, op een moment waarop de erva-ring van de leidsters met het programma nog gering was. Weliswaar werd in deimplementatiestudie gevonden dat grote delen van de programma's in de peuter-speelzalen en de scholen werden uitgevoerd zoals bedoeld (Reezigt, 1999), maarvan een uitvoeringstraditie en een uitgekristalliseerde uitvoeringspraktijk was inde eerste jaren van dit evaluatieonderzoek nog geen sprake. En dan zijn er pro-blemen als leerkrachtentekorten en ziekteverzuim, verschijnselen die nietkenmerkend zijn voor de programma's maar het hele onderwijs treffen en de uit-voeringspraktijk in de scholen natuurlijk ook beïnvloeden. Denk aan de tutor vanhet Piramideprogramma of de 'extra' leerkracht uit Kaleidoscoop die elders in deschool worden ingezet op plaatsen waar een tekort heerst; verloop, wisselingen(ongetrainde leerkracht die wordt ingezet in de onderbouw), etc. Dit zijn ontwik-kelingen op de achtergrond, waar we in dit onderzoek helaas geen systematischverzamelde informatie over hebben die kan helpen bij de interpretatie van de be-vindingen.

Ten slotte is met behulp van het Prima-bestand nagegaan of er verschillen zijn inprestaties op de gehanteerde toetsen tussen leerlingen die wel en leerlingen dieniet deelnamen aan een voorschoolse voorziening. We kunnen met behulp van ditonderzoek niet ondubbelzinnig aantonen dat deelname aan de programma's Ka-leidoscoop en Piramide gunstig is ten opzichte van deelname van kinderen metachterstanden aan 'reguliere' peuterspeelzalen en basisscholen, maar misschienvalt er met behulp van het Prima-bestand wel iets te zeggen over het voordeel vandeelname aan voorschoolse voorzieningen in het algemeen. Kaleidoscoop en Pi-ramide vormen immers een nadere pedagogisch-didactische invulling van eenvoorschools traject. De redenering zou kunnen zijn dat, wanneer deelname aaneen voorschoolse voorziening op de korte termijn zijn vruchten lijkt af te werpen,

50

Samenvatting en conclusies

blijkend uit betere toetsresultaten op de basisschool, dit beschouwd kan wordenals een ondersteuning van het in gang gezette beleid om de deelname aan voor-schoolse voorzieningen voor kinderen met dreigende achterstanden te vergroten.Uit onze analyses (die overigens tot nu toe nog niet eerder werden verricht op de-ze Prima-data) leiden we in de eerste plaats af dat deelname aan een voorschoolsevoorziening een bijdrage kan leveren aan het behalen van betere resultaten ingroep 2. Aparte analyses voor allochtone en autochtone leerlingen laten boven-dien een extra voordeel zien voor allochtone leerlingen die een voorschoolsevoorziening bezochten op het gebied van taal. Uit deze laatste bevinding moetoverigens uitdrukkelijk niet de conclusie worden getrokken dat deze voorzienin-gen zich nu eenzijdig op stimulering van de taalontwikkeling moeten gaanrichten. Uit onze gegevens blijkt immers bijvoorbeeld ook dat juist met de bredepedagogische programma's Kaleidoscoop en Piramide opbrengsten op anderedomeinen te realiseren zijn.

51

Een jaar later. Vervolgonderzoek evaluatie van kaleidoscoop en piramide

52

Literatuur

Bleichrodt, N., Resing, W., & Zaal, J. (1993). Beoordeling van schoolgedrag

(SCHOBL-R). Amsterdam: Vrije Universiteit.

Blok, H., & Leseman, P.P.M. (1996). Effecten van voorschoolse stimuleringspro-gramma's: een review van reviews. Pedagogische Studiën, 73, 184-197.

Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd edi-

tion). Hillsdale, NJ: Erlbaum.

Driessen, G, A. van Langen, R. Portengen, H. Vierke (1998). Basisonderwijs:veldwerkverslag, leerlinggegevens en oudervragenlijsten. Basisrapport Prima-cohortonderzoek 1996-97. Nijmegen: Instituut voor Toegepaste Sociale We-tenschappen.

Groenendaal, H.J., & Colthof, J. (1983). Vragenlijst Denkprocesen, Beknopte

Handleiding. Utrecht: Rijksuniversiteit, IPAW.

Groenendaal, H.J., van der Horst, J.M.H., & Palmen, C.M.A. (1987). Taalvaar-digheid en algemeen cognitief functioneren van kleuters in verschillendesociaal-economische milieus. Pedagogische Studien, 64, 381-389.

Jungbluth, P., A. van Langen, Th. Peetsma, H. Vierke (1996). Leerlinggegevensbasisonderwijs en speciaal onderwijs. Technische rapportage Prima-cohortonderzoek 1994-95. Amsterdam/Nijmegen: SCO-Kohnstamm Insti-tuut/Instituut voor Toegepaste Sociale Wetenschappen.

Ledoux, G., M. Overmaat, I. van der Veen & A. van der Meijden (2000). School-en klaskenmerken basisonderwijs. Basisrapportage PRIMA-cohortonderzoek.Derde meting 1998-1999. Amsterdam, SCO-Kohnstamm Instituut

53

Een jaar later. Vervolgonderzoek evaluatie van kaleidoscoop en piramide

Leseman, P.; A. Veen; B. Triesscheijn, M. Otter (1999). Evaluatie van Kaleido-scoop en Piramide. Verslag van tussentijdse resultaten. Amsterdam: SCO-Kohnstamm Instituut. SCO-rapport 539.

Narain, G. en L. Verhoeven (1994). Ontwikkeling van tweetaligheid bij allochtone

kleuters. Tilburg: Tilburg University Press.

Reezigt, G.J. (1999). De implementatie van Kaleidoscoop en Piramide. Gronin-gen, GION.

Schroots, J.J.F. en Alphen de Veer, R.J. van (1976). LDT, Leidse Diagnostische Test.

Deel I Handleiding. Amsterdam: Swets en Zeitlinger.

Snijders, J.Th. en Snijders-Oomen, N. (1975). Snijders-Oomen niet verbale intelli-

gentieschaal (SON 21/2-7). Groningen: Wolters-Noordhoff.

Veen, A., J. Roeleveld, P. Leseman (2000). Evaluatie van Kaleidoscoop en Pira-mide. Eindrapportage. Amsterdam: SCO-Kohnstamm Instituut. SCO-rapport576.

Verhoeven, L., A. Vermeer, C. van de Guchte (1986). Taaltoets Allochtone Kin-

deren: toetspakket. Tilburg: Zwijssen.

54

Bijlage 1

Onderzoeksinstrumenten evaluatieonderzoek Kaleidoscoop — Piramide - periode 1997-2000

Taalontwikkeling

Cognitieve

ontwikkeling

Sociaal

Emotionele Extraversie

ontwikkeling Werkhouding

Aangenaam gedrag

Emotionele stabiliteit

Overig Oudervragenlijst X X

Formulier achtergrondkenmerken X X X X

Directievragenlijst X

Vragenlijst leerkrachten groep 2

X

Passieve Woordenschat uit de Diagnostische Toets Tweetaligheid (DTT, Narain

& Verhoeven, 1994).

Sub-toets Passieve Woordenschat uit de Taaltoets Allochtone Kinderen (TAK;

Verhoeven, Vermeer en Van de Guchte, 1986.

55

Een jaar later. Vervolgonderzoek evaluatie van 'caleidoscoop en piramide

Vragenlijst Denkprocessen (VLDP; 34 items; Groenendaal & Colthof, 1983)Onderdeel Plaatjes Sorteren van de Kleuter-SON (6 items; Snijders & Snijders-Oomen, 1975)

Test Blokpatronen van de Leidse Diagnostische Test (LDT; 15 items; Schroots &van Alphen de Veer, 1976).

Ordenen, Platenboek Oudste Kleuters, Cito.

Begrippentoets groep 2, Cito

Woordenschattoets groep 3, Cito

Rekenen-Wiskunde 1 E3, Cito

Leesindicator (bereikte niveau van technisch en begrijpend lezen volgens leer-kracht)

R-Schobl (Bleichrodt, Resing, & Zaal, 1993).

Onderdeel uit Vragenlijst leerkrachten groep 2 Primacohort-onderzoek

Oudervragenlijst werd eenmalig afgenomen in de eigen taal en was gericht op hetverzamelen van informatie over de bekendheid met het programma en achtergrond-kenmerken van de kinderen zoals het opleidingsniveau van de ouders, hungeboorteland, de thuistaal en de gezinssamenstelling.

Formulier achtergrondkenmerken (geboortedatum, sekse, opleidingsniveau ou-ders, leerlinggewicht, etnische herkomst, datum van deelname aanprogramma/voorziening), eenmalig door leidster of leerkracht ingevuld voornieuw aan het onderzoek deelnemende kinderen.

Onderdeel uit Directievragenlijst Primacohort-onderzoek

56

Bijlage 2

Overzicht van de aantallen leerlingen in de vier achtereenvolgende metingen (in-stroom, doorstroom en uitval).

Instroom, doorstroom en uitval van peuters en kleuters naar programma

57

Een jaar later. Vervolgonderzoek evaluatie van kaleidoscoop en piramide

58

Bijlage 3

PRIMA-leerlingen met en zonder voorschoolse ervaringDe Prima-gegevens maken het ook mogelijk een korte vergelijking uit te voerenvan leerlingen die geen kinderdagverblijf of peuterspeelzaal hebben bezocht metleerlingen die dat wel gedaan hebben. De gegevens hierover zijn afkomstig uit deoudervragenlijst van PRIMA.Ruim 8000 ouders van Prima-leerlingen uit groep 2 van de referentiesteekproefhebben de vragen over bezoek van voorschoolse voorzieningen beantwoord.Daarvan zegt 41% dat hun kind een kinderdagverblijf heeft bezocht en maar liefst78% dat hun kind een peuterspeelzaal heeft bezocht'. Slechts 13% van de leerlin-gen heeft geen van beide voorschoolse voorzieningen bezocht.Het bezoek van voorschoolse voorzieningen hangt samen met de opleiding en deetniciteit van de ouders. In de volgende tabel vermelden we enkele kenmerkenvan drie groepen leerlingen: de groep zonder voorschoolse ervaring (13%); degroep die hetzij een kinderdagverblijf, hetzij een peuterspeelzaal heeft bezocht(59%); en de groep die beide voorzieningen heeft bezocht (28%).

I Deze percentages zijn aan de hoge kant. Dit zou het gevolg kunnen zijn van selectieve respons(het zijn vooral de wat beter opgeleide ouders die de vragenlijst invullen); van vraagstelling(bekendheid met begrippen als 'peuterspeelzaal' en 'kinderdagverblijf; verschillen tussen dezetypen voorschoolse voorzieningen); of van sociale wenselijkheid (het is goed om deel te nemenaan een voorschoolse voorziening).

59

Een jaar later. Vervolgonderzoek evaluatie van kaleidoscoop en piramide

Achtergrondkenmerken leerlingen groep 2 PRIMA-referentiegroep;

naar voorschoolse ervaringen

percentage meisjes

percentage etnische kinderen

(Turks/Marokkaans/overig)

percentage 1.25 leerlingen

percentage 1.90 leerlingen

percentage thuistaal Nederlands

(hoogste) Opleiding ouders

(1= hooguit lo; tot 4 = hbo/wo)

# p<.10; * p<.05; ** p<.01

Bij de leerlingen zonder bezoek van voorschoolse voorzieningen zien we eenover-vertegenwoordiging van allochtone kinderen, van kinderen met leerlingge-wicht 1.90 en van kinderen waarbij Nederlands geen thuistaal is. De opleidingvan de ouders van deze kinderen is gemiddeld het laagste. De minste etnischekinderen en de hoogste opleidingen zien we bij de groep leerlingen die één vanbeide voorschoolse voorzieningen heeft bezocht.

Vervolgens gaan we na of scores op de toetsen Begrippen en Ordenen verschillentussen de hier onderscheiden drie groepen leerlingen uit groep 2. We geven weerruwe en gecorrigeerde (` adjusted') gemiddelden op deze toetsen en geven d-scores voor de groepen die wel voorschoolse voorzieningen hebben bezocht ver-geleken met de groep die geen voorschoolse voorziening bezocht (zieonderstaande tabel).

60

Resultaten leerlingen groep 2 PRIMA-referentiegroep; eerst ruw (ongecontroleerd); daarna

gecontroleerd voor covariaten; aantallen, gemiddelden, SD's en d-scores voor paarsgewijze

vergelijkingen tussen leerlingen zonder en met bezoek voorschoolse voorzieningen

geen voorschool kdv of psz

kdv en psz

d-scores

Covariaten: Etnische groep (Turks, Marokkaans, overig), thuistaal, opleiding ou-ders, leerlinggewicht, sekse; schoolscore; dummies voor ontbrekende gegevens;# p‹.10; * p‹.05; ** p‹.01

We zien dat voor beide toetsen geldt dat de leerlingen met bezoek aan een voor-schoolse voorziening gemiddeld hoger scoren dan de leerlingen zonder bezoekaan zo'n voorziening. Dat was natuurlijk ook te verwachten gezien het verschil insamenstelling van beide groepen. Na correctie voor de covariaten zijn de verschil-len dan ook kleiner geworden en er resteren, in termen van Cohen, nog maarkleine effecten. Deze zijn wel steeds in het voordeel van de groepen die voor-schoolse voorzieningen hebben bezocht.Het voorgaande vormt een aanwijzing dat bezoek van voorschoolse voorzienin-gen mogelijk kan bijdragen aan het behalen van goede leerresultaten in groep 2.Een aparte vraag hierbij is nog of allochtone kinderen hier mogelijk nog meer vanprofiteren dan autochtone kinderen. Daartoe vergelijken we ruwe en gecorrigeer-de scores voor allochtone en autochtone leerlingen met en zonder bezoek aanvoorschoolse instellingen (zie onderstaande tabel).

61

Een jaar later. Vervolgonderzoek evaluatie van kaleidosroop en piramide

Toetsscores van allochtone en autochtone leerlingen groep 2 PRIMA-referentiegroep; naar

voorschoolse ervaringen

Begrippen

allochtone leerlingen (ruwe score)

autochtone leerlingen (ruwe score)

achterstand allochtone leerlingen

in de ruwe score

d-score

gecorrigeerd

d-score

Ordenen

allochtone leerlingen (ruwe score)

autochtone leerlingen (ruwe score)

achterstand allochtone leerlingen

in de ruwe score

d-score

gecorrigeerd

d-score

Covariaten: thuistaal, opleiding ouders, sekse; schoolscore; dummies voor ont-

brekende gegevens; # p<.10; * p<.05; ** p<.01

De gemiddelde achterstand van allochtone leerlingen op de Begrippentoets is het

grootst voor de groep leerlingen die geen voorschoolse voorzieningen hebben be-

zocht: deze groep scoort ruim 7 punten lager dan de autochtone leerlingen zonder

voorschoolse ervaring. Bij de groepen die wel voorschoolse voorzieningen be-

zochten is de achterstand van de allochtone leerlingen minder (ongeveer 5

punten). Ook na correctie voor verschillen in covariaten blijft dezelfde tendens

bestaan.

Ook bij de Ordenentoets is de achterstand van allochtone leerlingen bij de groep

die geen voorschoolse voorziening bezocht het grootst. Na correctie voor covaria-

ten zijn er echter nauwelijks meer verschillen.

Deze uitkomsten wijzen daarmee in de richting van een extra voordeel op het ge-

bied van taal voor allochtone leerlingen die voorschoolse voorzieningen hebben

62

bezocht. Op het domein dat door de Ordenentoets wordt bestreken lijkt er geen

sprake te zijn van een extra voordeel.

63