spss15_stappenplan_08

download spss15_stappenplan_08

of 55

Transcript of spss15_stappenplan_08

  • 7/25/2019 spss15_stappenplan_08

    1/55

    SPSS 15.0in praktische stappen

    voor AGW-bachelors

    auteurs:

    Miranda WinkelhuijzenMickey Chenault

    Monique ReuskenPauline ViltersRobbie Martens

    Capaciteitsgroep

    Methodologie & Statistiek

    2008-2009

  • 7/25/2019 spss15_stappenplan_08

    2/55

    Inhoudsopgave 2

    Inhoudsopgave

    Inleiding.............................................................................................................. 3

    Training 11. SPSS-scherm, vensters, balken en data invoeren en opslaan ............................. 52. Labels en Meetniveaus ..................................................................................... 113. Beschrijvende Statistiek (Descriptive Statistics).............................................. 154. Ontbrekende waarden (Missing Values) .......................................................... 185. Rekenen-1 (Compute Variable) ....................................................................... 206. Kruistabellen (Crosstabs).................................................................................. 227. Oefenen I ........................................................................................................ 25

    Training 28. Grafische uitvoer, printen en SPSS uitvoer in WORD..................................... 279. Groeperen (Split File) ....................................................................................... 2910. Selecteren (Select Cases).................................................................................. 3111. Hercoderen (Recode) ........................................................................................ 3312. Editen van de Uitvoer, het Syntaxvenster, Files en SPSS............................... 3813. Oefenen II ......................................................................................................... 42

    Facultatief14. Rekenen-2 (rekenen met If) .............................................................................. 4415. Bestanden samenvoegen (Merge Files)............................................................ 4816. Cases samenvoegen (Aggregate) ..................................................................... 53

  • 7/25/2019 spss15_stappenplan_08

    3/55

    InleidingHet kunnen werken met statistische software is van onmisbaar belang bij het verrichten van

    onderzoek. In dit blok (1.2b) wordt een introductie gegeven in het softwarepakket SPSS

    (Statistical Package for the Social Sciences), n van de meest populaire statistische

    programmas waarmee alle gangbare statistische procedures kunnen worden uitgevoerd.

    Gedurende 3 trainingen van twee uur zullen de basisbeginselen van het pakket wordenovergedragen. Meer geavanceerdere toepassingen van SPSS zullen in navolgende blokken

    aan de orde komen. Eventueel kan men voor meer gedetailleerde beschrijvingen van het

    SPSS-softwarepakket en voor geavanceerdere toepassingen binnen SPSS een keuze maken

    uit het ruime aanbod van Nederlandstalige en Engelstalige literatuur.

    Aanwijzingen voor het gebruik van dit boekDit boek bevat 16 hoofdstukken (Stappen) die in principe zelfstandig kunnen worden

    doorgewerkt. Er zijn 3 SPSS trainingen van elk 2 uur in het Computerlandschap. Onder

    toezicht van een SPSS trainer zullen Stap 1 tot en met 7 tijdens de eerste training worden

    gemaakt en Stap 8 tot en met 13 tijdens de tweede training. De laatste 3 Stappen worden niet

    behandeld in de trainingen, maar kunnen wel handig zijn tijdens je onderzoek. Elke Stapbevat een inleidende tekst met opdrachten. In de teksten en opdrachten worden de

    keuzemogelijkheden uit het menu van het SPSS-programma .

    De eigenlijke opdrachten, die je in SPSS maakt zijnvetgedrukt.

    Tijdens de 3deSPSS training is het de bedoeling dat je de Antropometrie gegevens van blok

    1.2a m.b.v. SPSS gaat analyseren ten behoeve van je verslag. Ook dan is er een SPSS trainer

    aanwezig om je te helpen.

    De eerste 2 trainingen zijn verplicht, de derde niet.

    Lees een opdracht eerst helemaal door en probeer te begrijpen wat er van je gevraagd wordt.

    Ga vervolgens proberen om tot de oplossing te komen. Als je er na een aantal keren proberen

    echt niet uitkomt, kun je de hulp van de SPSS-trainer inroepen. Doe dat niet te snel, want met

    zelf proberen krijg je een computerprogramma het snelst onder de knie!

    Het kan voorkomen dat teksten in vensters en menus enigszins afwijken van de teksten die

    in deze handleiding zijn gebruikt. Bijvoorbeeld Engels i.p.v. Nederlands. Laat je daardoor

    niet afschrikken. Meestal is duidelijk wat bedoeld wordt.

    Bestanden

    De SPSS bestanden die je nodig hebt zijn te vinden op ELEUM(1.2B HET GEZONDELICHAAM (2B-0203-0809) (FDGW_0809_2B_BLOK_0203)> COURSE MATERIAL> PRACTICA ENTRAININGEN> SPSS TRAINING )

    Voor de eerste twee SPSS trainingen (Stap 1 t/m 13) heb je de volgende bestanden nodig:

    hearing.sav, stap12.sav en geboorte.sav. Voor de extra Stappen 14, 15 en 16 heb je nodig:

    stap14.sav, oef15.sav, medcomp.sav, toets3.sav en audiometry.sav.

    Omdat het in het Computerlandschap niet mogelijk is om de SPSS bestanden direct vanaf

    ELEUM in SPSS te openen moet je de bestanden eerst downloaden en opslaan in je eigen

    werkgebied (I-drive (I:\), onderdeel van het netwerksysteem in het Computerlandschap).

    Vanaf je I-drive kun je dan de bestanden binnen SPSS openen. Download nu eerst de

    benodigde bestanden voor de SPSS trainingen naar je I-drive.

    Inleiding 3

    http://eleum.unimaas.nl/http://eleum.unimaas.nl/bin/common/course.pl?course_id=_122477_1http://eleum.unimaas.nl/bin/common/course.pl?course_id=_122477_1http://eleum.unimaas.nl/webapps/blackboard/content/listContent.jsp?course_id=_122477_1&content_id=_1041721_1&mode=resethttp://eleum.unimaas.nl/webapps/blackboard/content/listContent.jsp?course_id=_122477_1&content_id=_1198700_1&mode=resethttp://eleum.unimaas.nl/webapps/blackboard/content/listContent.jsp?course_id=_122477_1&content_id=_1198700_1&mode=resethttp://eleum.unimaas.nl/webapps/blackboard/content/listContent.jsp?course_id=_122477_1&content_id=_1198700_1&mode=resethttp://eleum.unimaas.nl/webapps/blackboard/content/listContent.jsp?course_id=_122477_1&content_id=_1198700_1&mode=resethttp://eleum.unimaas.nl/webapps/blackboard/content/listContent.jsp?course_id=_122477_1&content_id=_1041721_1&mode=resethttp://eleum.unimaas.nl/bin/common/course.pl?course_id=_122477_1http://eleum.unimaas.nl/bin/common/course.pl?course_id=_122477_1http://eleum.unimaas.nl/http://eleum.unimaas.nl/webapps/blackboard/content/listContent.jsp?course_id=_122477_1&content_id=_1198707_1
  • 7/25/2019 spss15_stappenplan_08

    4/55

    Inleiding 4

    Filmpjes

    Naast dit boek zijn er een aantal instructiefilmpjes op ELEUM beschikbaar waarin de

    verschillende SPSS procedures worden gedemonstreerd. Deze instructiefilmpjes worden

    afgespeeld met de Windows Media Player. Dit programma is alleen lokaal op de computers

    genstalleerd en niet in Citrix (=Student Desktop). Open ELEUM dus lokaal en speel dan de

    filmpjes af door er op te klikken.

    Zelf oefenen

    Natuurlijk mag je vooraf zelfstandig oefenen met SPSS maar voor beide verplichte trainingen

    is er een afsluitende opdracht die tijdensde training gemaakt dient te worden voordat

    presentie wordt genoteerd.

    Thuis werken

    Als je ergens anders, bijvoorbeeld thuis, met SPSS wilt werken heb je verschillende

    mogelijkheden:

    Je kunt SPSS kopen via https://www.surfspot.nl/. Inloggen kan met je eigengebruikersnaam en wachtwoord.

    Je kunt SPSS gebruiken via http://anywhere.ub.unimaas.nlIn plaats van SPSS op je eigen PC te installeren, kun je het dan starten op een

    Universiteitsserver. Ook hier kun je weer inloggen met je eigen gebruikersnaam en

    wachtwoord.

    Verder is het handig om te weten dat er verschillende versies van SPSS zijn. In dit boek is

    gewerkt met SPSS versie 15.

    De benodigde practicumbestanden kun je vanaf je I-drive in het Computerlandschapdoormailen naar huis.

    https://www.surfspot.nl/http://anywhere.ub.unimaas.nl/http://anywhere.ub.unimaas.nl/https://www.surfspot.nl/
  • 7/25/2019 spss15_stappenplan_08

    5/55

    Training 1 1. SPSS-scherm, vensters, balken en data invoeren en opslaan 5

    1. SPSS-scherm, vensters, balken en data invoeren en opslaanWanneer je SPSS aanroept verschijnt een openingsscherm. Dat bestaat uit een aantal balken,

    knoppen en vensters. Welke balken enz. worden getoond is standaard geregeld, maar kan

    door de gebruiker worden aangepast. We gaan uit van de standaardinstellingen in het

    Computerlandschap.

    1.1 SPSS opstarten

    Het programma SPSS kan men in het computerlandschap alleen vinden binnen Citrix

    (=Student Desktop).Hiertoe log je eerst in in n van de computers met je eigen username

    en password. Vervolgens klik je opStudent Desktopen log in in Citrix, weer met

    gebruikmaking van je eigen username en password. Nu heb je beneden aan het scherm twee

    toolbars. De bovenste toolbar is die van Citrix!!

    Gebruik de bovenste toolbar en open SPSS via en bekijk het openingsscherm.Soms krijg je bij het

    opstarten een klein venster met de vraag What would you like to do? dat je de mogelijkheid

    biedt om recentelijk gebruikte bestanden te openen. Druk op [Cancel] en bekijk het

    datavenster dat de SPSS Data Editor wordt genoemd. Maak het scherm zo groot mogelijk

    door rechtsboven op het middelste icoontje te klikken (maximaliseren).De bovenste balk

    is detitelbalk: Untitled1[DataSet0]-SPSS Data Editor. Daaronder vind je de menubalkmet

    het hoofdmenu: File, Edit, View, Data, Transform enz. Onder de menubalk vind je de

    knoppenbalk(toolbar). Met een klik op zon knop kunnen handelingen direct worden

    uitgevoerd. De betekenis van een knop wordt zichtbaar in destatusbalk(helemaal linksonder

    in het scherm) als de knop met de muis wordt aangewezen. Probeer!In het midden van deze

    statusbalk kun je bijvoorbeeld ook zien of het SPSS-programma gereed is of bezig is met de

    uitvoering van een taak. Het is goed om die boodschappen bij de volgende opdrachten eens inde gaten te houden!

    Een belangrijk kenmerk van SPSS is dat het werkt met verschillende vensters. De te

    analyseren gegevens en hun eigenschappen worden ingevoerd en opgeslagen middels de z.g.

    SPSS Data Editor. Deze bestaat uit 2 vensters: het datavenster (Data View) en het

    variabelenvenster (Variable View):

    De Data Viewbevat de gegevens (de data) die geanalyseerd moeten worden. Elke kolombetreft een ander kenmerk, ofwel variabele (vb. gewicht, lengte, haarkleur) . Elke rij betreft

    een ander onderzoeksgeval, een case (vb. persoon, land, ziekenhuis, school).

  • 7/25/2019 spss15_stappenplan_08

    6/55

    Training 1 1. SPSS-scherm, vensters, balken en data invoeren en opslaan 6

    Datavenster (Data View):

    In de Variable Viewworden de eigenschappen voor elke variabele weergegeven. Hierinworden o.a. het type variabele (numeriek, datum etc.), het aantal decimalen, de labels en de

    ontbrekende waarden (missing values) gedefinieerd.

    Variabelenvenster (Variable View):

    Je kunt de Data Viewen de Variabele Viewafwisselend oproepen door linksonder op het

    desbetreffende tabblad te klikken:

    Probeer!

  • 7/25/2019 spss15_stappenplan_08

    7/55

    Training 1 1. SPSS-scherm, vensters, balken en data invoeren en opslaan 7

    De resultaten van de analyse verschijnen in een uitvoer- ofwel outputvenstervan de SPSS

    Viewer. Het outputvenster kun je nu nog niet zien, omdat er nog geen analyses uitgevoerd

    zijn. Pas vanaf het moment dat je een procedure aanroept wordt een outputvenstergeopend.

    Gegevens invoerenStel je hebt van een drietal proefpersonen de volgende gegevens:

    Volgnummer,

    Leeftijd in jaren,

    Geslacht (1= man; 2= vrouw)

    Intelligentiequotint

    Lichaamslengte in cm

    Lichaamsgewicht in kg.

    De gegevens zijn als volgt in een tabel samengevat:

    Volgnummer Leeftijd Geslacht IQ Lengte Gewicht

    101 23 1 114 176 82.4

    102 47 1 98 182 95.3

    103 38 2 121 169 72.9

    SPSS spreekt in zon geval van 3 cases(=de rijen of regels) met 6 variabelen(=de

    kolommen). We willen deze gegevens met SPSS analyseren en moeten ze daartoe eerst

    invoeren in SPSS. Daarbij moet je onderscheid maken tussen de getallen en de namen van

    de variabelen.

    1.2 Getallen invoeren.

    Start SPSS en zorg dat je je in de Data View bevindt. In de bovenste cel van de eerste

    kolom moet de waarde 101 komen, daaronder 102 en tenslotte 103. Selecteer de eerste cel

    middels de muis of pijltjestoetsen. Deze cel wordt vet omrand. Type 101 in en druk

    vervolgens op Enter. Het getal 101.00 verschijnt in de eerste cel en de variabele krijgt de

    door SPSS gereserveerde naam: var00001. Tegelijkertijd wordt de volgende cel automatisch

    geselecteerd. Type 102 in en klik op Enter, en type 103 in de volgende cel. Het feit dat

    SPSS niet 103, maar 103.00 weergeeft heeft te maken met de standaardinstelling van SPSS.

    De standaardinstelling van SPSS is F8.2, d.w.z. gegevens mogen maximaal 8 karakters langzijn en worden weergegeven in 2 decimalen. Dit kan worden gewijzigd in de Variable View.

    Hier komen wij later op terug. Ga nu met de pijltjestoetsen of de muis naar de bovenste

    cel van de tweede kolom. Voer op dezelfde manier de waarden van de andere variabelen

    (leeftijd, geslacht, iq, lengte en gewicht) in het datavenster in.

  • 7/25/2019 spss15_stappenplan_08

    8/55

    Training 1 1. SPSS-scherm, vensters, balken en data invoeren en opslaan 8

    1.3 Variabelennamen invoeren.

    In principe maakt het voor SPSS niet uit welke namen je aan de variabelen geeft. Zoals we

    hierboven al zagen bedenkt SPSS zelf variabele namen als je geen namen opgeeft:

    var00001, var00002, var00003, enz. SPSS stelt echter een aantal voorwaarden aan de

    naamgeving, bijvoorbeeld geen spaties en nog een aantal andere tekens worden niettoegestaan. Je merkt vanzelf wanneer een variabelennaam niet aan de voorwaarden voldoet

    daar SPSS onjuiste namen niet accepteert en de volgende melding Variable name contains

    an illegal character geeft in een venster.

    We zullen nu de door SPSS gegeven variabelennamen veranderen in namen die iets meer

    over de inhoud zeggen: we kiezen voor volgnummer, leeftijd, geslacht, iq, lengteengewicht.

    Eerst volgnummeri.p.v. var00001

    Dubbelklik op de cel waarin de naamvar00001staat. Het variabelenvenster (Variable

    View) verschijnt. Het is ook mogelijk om in het variabelenvenster te komen door links onder

    in de Data Editor op Variable View te klikken. De eerste regel is zwart gemarkeerd. Alleen

    de cel var00001onder de kolom Name is wit gemarkeerd.Type hier volgnummerin enklik op Enter. In de tweede rij onder de kolom Name type je leeftijdin en klik daarna

    op Enter. Voer op dezelfde wijze de resterende vier variabelennamen in.

    De Variable View en Data View zullen er als volgt uitzien:

    Data View:

    Variable View:

  • 7/25/2019 spss15_stappenplan_08

    9/55

    Training 1 1. SPSS-scherm, vensters, balken en data invoeren en opslaan 9

    Laten we even vooruit lopen en kijken hoe je met SPSS gegevens uit het datavenster kan

    kopiren naar het outputvenster. Dit is vooral handig als twee variabelen, bijvoorbeeld

    gewichten lengte, met elkaar vergeleken moeten worden en in de datafile erg ver van elkaar

    staan. Kies bovenaan in de menubalk .Er

    verschijnt een dialoogvenster met duidelijk herkenbare kaders. In het linker kader staan allevariabelennamen van het datavenster en de rechter kaders zijn nog leeg. Je wilt per persoon

    (volgnummer) de variabelen lengte engewichtmet elkaar vergelijken.Selecteer met de

    pijltjestoetsen of de muis in het linker kader telkens 1 van de drie variabelen en breng

    deze n voor n via de knop naar het bovenste rechter kader onder Variables. Men

    kan de drie variabelen ook in n keer naar dat kader overbrengen door de Ctrl-toets

    ingedrukt te houden ten tijde van het selecteren van de drie variabelen in het linker

    kader en ze vervolgens tegelijk met de knop naar rechts onder Variableste

    transporteren:

    Druk nu op [OK]en SPSS gaat aan het werk (kijk naar de statusbalk!). Je ziet meteen dat

    het datavenster verdwijnt en het outputvenster verschijnt. In het uitvoervenster komt een

    overzicht te staan van alle drie de personen (cases) met betrekking tot de opgegeven

    variabelen volgnummer, lengteengewicht:

    Case Summariesa

    101.00 176.00 82.40

    102.00 182.00 95.30

    103.00 169.00 72.90

    3 3 3

    1

    2

    3

    NTotal

    volgnummer lengte gewicht

    Limited to first 100 cases.a.

    1.4 OpslaanWe willen nu de data en de output gaan opslaan. Deze files kunnen bijvoorbeeld op de

    I- drive bewaard worden.

    Voor het opslaan van de data ga je eerst met de cursor ergens in de SPSS Data Editor

    staan (Data View of Variable View)!! Kies vervolgens . Selecteer achter

    Opslaan inde juiste schijf (drive, bijv. I-drive). Type achterBestandsnaam de gewenste

    naam van het bestand, bijvoorbeeld. stap1. Achter Opslaan als typevult SPSS

    automatisch het juiste file type (.sav) in.Tenslotte klik je op Opslaanom de opdracht te

    laten uitvoeren. Het datavenster en variabelenvenster zijn nu beide opgeslagen in n file,

    namelijk stap1.sav. Merk op dat de extensie van de SPSS datafile altijd (!) .SAV is.

  • 7/25/2019 spss15_stappenplan_08

    10/55

    Training 1 1. SPSS-scherm, vensters, balken en data invoeren en opslaan 10

    Voor het opslaan van de output ga je eerst met de cursor ergens in de output van de

    SPSS Viewer staan en herhaal daarna bovenstaande procedure. De SPSS outputfile

    wordt altijd opgeslagen met .SPO als extensie (dus hier als stap1.spo).

    Dus onthoud goed: Datavenster = sav-file, Outputvenster = spo-file!

    Sluit SPSS af () nadat je zowel de datafile als de outputfile bewaard hebt.

    LET OP!!!!!

    1. Wanneer je gegevens wilt opslaan moet je cursor altijd (!) in de Data Viewof VariableViewstaan, en als je uitvoer wilt opslaan moet de cursor in het betreffende Outputvenster

    staan. Het opslaan gaat zeer zeker fout als je dit niet in acht neemt. SPSS kan namelijk geen

    data inlezen met een .spo extensie en ook geen uitvoer met een .sav extensie!!!

    2. In SPSS moet het datavenster en outputvenster altijd apart worden opgeslagen. Ze kunnenniet samen/tegelijkertijd worden opgeslagen!!

  • 7/25/2019 spss15_stappenplan_08

    11/55

    Training 1 2. Labels en Meetniveaus 11

    2. Labels en MeetniveausMeestal bestaan de gegevens die met SPSS geanalyseerd worden uit cijfers. Zo'n hele waslijst

    met cijfers is niet echt duidelijk, zeker als er geen omschrijving bij de variabele of van de

    waarden van die variabele staat. Om dit te verhelpen kunnen we labels toekennen aan de

    variabelen en hun waarden. Het is belangrijk te weten dat deze labels alleen dienen terverduidelijking van de betekenis van de betreffende variabele zelf of van zijn waarden. De

    labels veranderen nietsaan de waarden (de cijfers) zelf. Er kunnen twee soorten labels

    toegekend worden:

    Variable labelsvoor de variabelen zelf (meestal een uitgebreidere variabelennaam) en

    Value labelsvoor de verschillende waarden die een variabele kan aannemen.

    Zo zou de variabelegeslacht geen variable label hoeven te krijgen (de naam is al duidelijkgenoeg), maar wel value labels: de waarde 1 het value label man, en de waarde 2 het value

    label vrouw.De variabele iqzou het variable label intelligentie-quotient volgens de methode van William

    Stern kunnen krijgen. Value labels zijn voor iqniet van toepassing.

    Variabelen kunnen worden ingedeeld in 3 soorten wat betreft hun meetniveau: variabelen

    waarvan de uitkomsten in klassen zijn verdeeld zoals geslacht, land van herkomst, etniciteit

    etc. noemen we categorische ofwel nominale variabelen. Aan de verschillende klassen

    kunnen getallen worden toegekend. Deze getallen hebben echter geen betekenis in

    rekenkundige zin: man=1 en vrouw=2 betekent niet dat vrouwen 2 keer een man zijn. Naast

    nominale variabelen kennen we ook ordinale variabelen, zoals opleidingsniveau. Hierbij is

    wel sprake van een rangorde (meer of minder opleiding, vb. VMBO=1, Havo=2, VWO=3).

    Variabelen waarbij de categorien niet alleen kunnen worden geordend, maar waarbij ookgeldt dat de afstanden tussen twee opeenvolgende categorien steeds gelijk is noemen we

    interval variabelen, bijvoorbeeld bloeddruk (mmHg) en temperatuur (oC). In dit geval is er

    geen sprake van een vastliggend nulpunt. Het hoogste meetniveau hebben ratio variabelen.

    Deze variabelen hebben naast de kenmerken van het interval meetniveau ook nog een

    absoluut nulpunt. Voorbeelden zijn leeftijd (jaren) en lengte (cm). Voor de duidelijkheid van

    je SPSS databestand is het handig om nominale en ordinale variabelen te voorzien van value

    labels.

    2.1 Meetniveau invoeren

    Binnen SPSS kan van elke variabele het meetniveau worden opgegeven. Je kunt dit instellenin de Variable View onder de kolom Measure. SPSS kent 3 mogelijkheden: Scalevoor

    interval en ratio schalen, Ordinalvoor ordinale schalen en Nominalvoor nominale schalen.

    We zullen nu het meetniveau gaan opgeven van de variabelen in de datafile van Stap1. Open

    SPSS endaarbinnende file stap1.sav ( ). Het datavenster van de

    Stap 1 verschijnt. Open de Variable View en stel in de kolom Measure volgnummer en

    geslachtin opNominal en de rest op Scale:

  • 7/25/2019 spss15_stappenplan_08

    12/55

    Training 1 2. Labels en Meetniveaus 12

    Opmerking:Jammer genoeg geeft SPSS geen foutmelding als je bij variabelen waarbij je

    als meetniveau nominal hebt ingevoerd het gemiddelde uit laat rekenen!

    2.2 Labels invoeren

    Vervolgens gaan we geschikte labels toekennen aan de variabelen. Het toekennen van value

    labels aan de variabelegeslachtgaat als volgt: Open de Variable View. De variabele

    geslachtkent de waarden 1 en 2, respectievelijk man en vrouw. Klik in de kolom

    Values op None (= er zijn (nog) geen Value Labels gedefinieerd) en klik vervolgens

    op het kleine, grijze vakje met puntjes:

    Het Value Labels venster verschijnt. Zet achter Valuede waarde 1 en achterLabelhet

    woord 'man'. Klik vervolgens op [Add]. Vul vervolgens achter Value2 in en achter

    Label het woord 'vrouw'. Druk daarna weer op [Add].

  • 7/25/2019 spss15_stappenplan_08

    13/55

    Training 1 2. Labels en Meetniveaus 13

    Klik op [OK] ende variabelegeslacht is gelabeld!

    Vervolgens gaan we variable labels geven. Open de Variable View en vul in de kolom

    Label het gewenste variable label in: leeftijd in jaren voor leeftijd, intelligentie

    quotint volgens de methode van William Stern voor iq, lichaamslengte in cm voor lengte,

    lichaamsgewicht in kg voorgewicht.

    Als de meetniveaus en labels zijn toegekend kan dit o.a. gecontroleerd worden door in het

    hoofdmenu te kiezen voor waarna onderstaand venster verschijnt.

    Links staat een kolom met alle variabelen en rechts de informatie (inclusief de toegekende

    labels) van een geselecteerde variabele (hiergeslacht):

    2.3 Nadat je de variabelegeslacht van labels hebt voorzien is er in het datavenster

    ogenschijnlijk nog niets veranderd, maar druk nu eens in de Data View op de derde

    knop van rechts op de taakbalk(heeft de vorm van een kofferlabel of etiketje):

    De cijfers veranderen nu in de toegekende value labels:

    Door nog eens op die knop te drukken krijgt de variabele geslacht weer de getallen als

    inhoud:

    Let wel: het toekennen van labels aan de variabelen en aan de waarden van variabelen

    benvloedt niet de data zelf, het is alleen ter verduidelijking van je data- en uitvoervenster!

  • 7/25/2019 spss15_stappenplan_08

    14/55

    Training 1 2. Labels en Meetniveaus 14

    2.4 Als menvariabele labels i.p.v. variabelennamen in de dialoogvensters gepresenteerd wilt zien

    (dus intelligentie-quotient volgens de methode van William Stern i.p.v. iq), moet SPSS als

    volgt worden ingesteld: Kies in het datavenster.Het Options venster

    verschijnt. Dit bevat 10 tabbladen, waaronder het Generaltabblad:

    KiesDisplay labelsonderVariable Lists (als dat nog niet is aangevinkt)en de labels i.p.v.de namen van de variabelen zullen in de dialoogvensters worden weergegeven. Dit kun

    je nagaan door bijvoorbeeld het volgende dialoogvenster op te vragen: Kies

    .Er verschijnt nu het volgende venster:

  • 7/25/2019 spss15_stappenplan_08

    15/55

    Training 1 2. Labels en Meetniveaus 15

    In het dialoogvenster zie je nu het label: leeftijd in jarenin plaats van alleen devariabelennaam leeftijd. Zo zie je bij de volgende variabelen ook de labels met daarachter

    tussen haken de namen. Druk op [Cancel].

    Het is ook mogelijk om de variable- en value labels in je uitvoer te verkrijgen. Daarvoor stel

    je onder het tabblad Output Labelsals volgt in:

    Alle geproduceerde uitvoer zal nu de variabelen presenteren met variable- en value labels.

  • 7/25/2019 spss15_stappenplan_08

    16/55

    Training 1 3. Beschrijvende Statistiek (Descriptive Statistics) 16

    3. Beschrijvende statistiek (Descriptive Statistics)Bij het beschrijven van variabelen met SPSS wordt veelal gebruik gemaakt van de procedures

    Frequencies, Descriptives en Explore, welke kunnen worden aangevraagd met

    . We zullen de verschillende procedures demonstreren a.d.h.v. het

    bestand hearing.sav. Dit bestand bevat de gegevens van een gehooronderzoek bij 99proefpersonen.

    De volgende variabelen zijn gedefinieerd:

    id identification number

    sex sex (1=male, 2=female)

    hearing1 subjective opinion of own hearing ability (1=good, 2=moderate, 3=poor)

    hearaid hearing aid (1=yes, has a hearing aid; 2=has no hearing aid)

    agegrp1 age group (1=55-64 years, 2=65-74 years, 3=75+ years)

    hearimp hearing impairment (1=hearing impaired, 0=not hearing impaired)

    euroqol Euroqol quality of life measurement on a scale of 0 to 100

    hearscor visual analogue scale (VAS) measurement of one's own hearing on a scale of 0 to

    100

    fi_b_ear fletcher index best ear on the basis of audiometry, the higher the more hearing

    impairment, valid values ranging from 20 to 120

    age age in years

    Het type variabele (het meetniveau, zie Stap 2) bepaalt welke Descriptive Statistics -

    procedure geschikt is. Indien we te maken hebben met een nominale of ordinale variabele diein categorien kan worden ingedeeld (categorische variabele) zoals bijvoorbeeld geslacht, is

    het zinloos om het gemiddelde te berekenen. Een frequentietabel is een geschikte methode

    om dergelijke variabelen te bestuderen. Het berekenen van kengetallen als het gemiddelde en

    de mediaan is natuurlijk wel zeer geschikt voor interval en ratio variabelen (continu

    variabelen).

    Frequencies

    Voor het maken van frequentietabellen gebruikt men de procedure Frequencies.

    3.1 Open het bestand hearing.sav (Opmerking: het bestand stap1.sav kan daarna gesloten

    worden, bepaal zelf of je dit bestand nog wil bewaren).We willen weten hoeveel mensen er in elke leeftijdscategorie (agegrp1) zitten en makendaartoe als volgt een frequentietabel van deze variabele:

    Kies < Frequencies>. Klik links in het Frequencies

    venster op de variabele agegrp1en plaats deze met een druk op de zwarte pijl naar

    het rechter kader onder Variable(s):

  • 7/25/2019 spss15_stappenplan_08

    17/55

    Training 1 3. Beschrijvende Statistiek (Descriptive Statistics) 17

    Klik op [OK]. Er wordt automatisch overgeschakeld naar het outputvenster, waarin de

    frequentietabel verschijnt (zie instructiefilmpje: frequencies.avi). Hoeveel mensen zitten er

    in elke leeftijdscategorie?[zie * onderaan]Roep het bovenstaande dialoogvenster opnieuw op. Ook andere zaken kunnen in de

    uitvoer worden opgevraagd door gebruik te maken van de drukknoppen [Statistics]

    (statistische kengetallen), [Charts](staafdiagrammen, cirkeldiagrammen en histogrammen)

    en [Format](wijzigt opmaak van frequentietabel). Wanneer er alleen maar interesse bestaatvoor deze uitvoer en de frequentietabel zelf niet nodig is, kan men de optie Display frequencytablesuitschakelen door hier met de muis op te klikken.

    3.2 Maak middels de drukknop [Charts] onderaan het Frequencies venster een

    staafdiagram (Bar charts) van de variabele agegrp1, zonder dat er in de uitvoer weer de

    frequentietabel verschijnt.

    Descriptives

    Met deze procedure is het mogelijk statistische kengetallen (gemiddelde, standaarddeviatie,

    variantie, minimum, maximum etc) te berekenen. Wat betreft de betekenis van deze

    kengetallen wordt verwezen naar het theorieboek Methodologie en Statistiek deel 1

    (Tj. Imbos, et al. Universitaire Pers Maastricht, Maastricht 2001)

    3.3 Roep de procedure op via . Selecteer

    vervolgens in het Descriptive venster de variabele ageen breng deze met de pijl naar

    de rechterkant onder Variable(s).Standaard wordt het gemiddelde, de standaarddeviatie,

    het minimum en het maximum berekend, maar men kan ook een aantal andere kengetallen

    laten berekenen door onder de drukknop [Options] de gewenste statistische kengetallen teselecteren. Selecteer in het Options venster tevens Variance en klik op [OK] (zie

    instructiefilmpje:descriptives.avi). Wat is het gemiddelde en de variantie van de variabele

    age? [zie **]

    *Er zitten resp. 25, 26 en 48 mensen in categorie 1, 2 en 3

    **Gemiddelde 73.43, variantie 71.779

  • 7/25/2019 spss15_stappenplan_08

    18/55

    Training 1 3. Beschrijvende Statistiek (Descriptive Statistics) 18

    ExploreDe procedure Explore is een zeer geschikte methode om inzicht te verkrijgen in de verdeling

    van een variabele en kent vele mogelijkheden. We bekijken de variabelefi_b_ear.

    3.4 Kies < Explore>. Klik in het linker kader op devariabelefi_b_ear en plaats deze met een druk op de zwarte pijl naar het rechter

    kader onderDependent List.Selecteer de variabele sex onder Factor listom de verdeling

    vanfi_b_ear voor mannen en vrouwen apart te bestuderen:

    Klik op [OK] en bekijk de uitvoer (zie instructiefilmpje: explore.avi). Het resultaat is dat de

    variabelefi_b_earvoor mannen en vrouwen afzonderlijk geanalyseerd wordt. OnderDisplay

    kun je kiezen welke uitvoer geproduceerd moet worden. Standaard bestaat de uitvoer uit een

    aantal statistische kengetallen en tevens wordt er voor elke groep een takbladgrafiek en een

    boxplot gemaakt. SPSS geeft dit aan metBoth. Wil men slechts een deel van deze uitvoer

    kies dan voor Statistics dan welPlots.Verder kent de procedure Explore nog een aantaldrukknoppen: [Statistics] voor het aanvragen van extra statistische kengetallen

    (betrouwbaarheidsintervallen, percentielen en outliers), [Plots] voor het opvragen van diverse

    grafieken en [Options] die betrekking heeft op het wel of niet meenemen van cases met

    ontbrekende waarden wanneer er meerdere variabelen in de Dependent List staan.

  • 7/25/2019 spss15_stappenplan_08

    19/55

    Training 1 4. Ontbrekende waarden (Missing Values) 19

    4. Ontbrekende waarden (Missing Values)Een onderzoeker verzamelde van zes patinten de 5 verschillende bloedwaarden (b1 t/m b5).

    De resultaten zijn als volgt:

    patnr b1 b2 b3 b4 b5

    1 92.2 1.94 15.7 125 4.992 92.7 1.90 15.6 -1 4.79

    3 95.0 2.05 13.7 76 4.57

    4 90.8 1.83 15.1 24 5.46

    5 92.2 1.88 15.1 57 4.36

    6 92.7 1.89 15.1 -1 4.52

    Bij de variabeleb4ontbrak de waarde van patint 2 en patint 6. Omdat -1 een waarde is die

    niet voor kan komen als bloedwaarde voor deze variabele gebruikte de onderzoeker de

    waarde -1 om aan te geven dat er iets fout is met die waarde (bijvoorbeeld niet gemeten of

    een verkeerde meting). Als SPSS met deze gegevens aan de slag gaat en bijvoorbeeld hetgemiddelde van b4 moet berekenen, gaat dat als volgt:

    (125 + (-1) + 76 + 24 + 57 + (-1))= 280/6= 46.667. Dat kan niet bedoeling zijn! Die -1

    vertekent het gemiddelde. Om dit te voorkomen moet de waarde -1 voor de betreffende

    variabele als ontbrekende waardeof missing valueworden gedefinieerd. Wordt het

    gemiddelde dan berekend, dan neemt SPSS deze -1 niet mee in de berekening. Het

    gemiddelde wordt dan (125+76+24+57)/4 = 70.5, en verschilt nogal met de oorspronkelijke

    46.67, maar is wel de juiste weergave van de gegevens.

    4.1 Kies om een lege Data Editor te verkrijgen en sluit daarna het nog

    openstaande bestand hearing.sav af zonder te bewaren. Voer vervolgens van

    bovenstaande data alleen kolom b4 in. Dit kun je in de eerste kolom van de Data Viewdoen. Ga naar de Variable View en noem de variabeleb4.Klik bij variabeleb4onder de

    kolom Missing op None en klik op het kleine, grijze vakje met puntjes:

    Het volgende venster verschijnt:

  • 7/25/2019 spss15_stappenplan_08

    20/55

    Training 1 4. Ontbrekende waarden (Missing Values) 20

    Je wilt af van No missing values en een discrete waarde (-1) als missing value definiren.

    Selecteer de betreffende optie Discrete missing valuesen vul het eerste rechthoekje met

    -1. Het zou kunnen zijn dat er voor deze variabele nog andere discrete waarden als

    ontbrekend gedefinieerd moesten worden. Daarvoor kun je het tweede en derde rechthoekje

    gebruiken (je kunt dus maar maximaal 3 discrete waarden als missing values aangeven). Dat

    is hier niet het geval. Klik daarom op de [OK] knop.In de Variable View staat nu bij

    variabele b4onderMissingeen -1.0, wat betekent dat -1 een ontbrekende waarde is voorvariabele b4. Daar zie je niets van in het datavenster, maar als je nu het gemiddelde berekent

    van de betreffende variabele (via ) zul je

    zien dat SPSS bij het berekenen rekening houdt met de twee cases met een -1 voor de

    ontbrekende gegevens.Doen!

    Als sprake is van een range(of interval) van waarden die als ontbrekende waarden

    beschouwd moeten worden, kun je in het Missing Valuesvenster kiezen voor de optie

    Range plus one optional discrete missing valueen in de twee rechthoekjes de laagste en de

    hoogste waarde opgeven. In het onderste rechthoekje kun je tevens nog n discrete waarde

    invullen.

    Tot nu is gesproken over missing values die door de gebruiker werden gedefinieerd en

    daarom User Missing Valuesheten. Een tweede soort missing values worden door SPSS zelf

    gecreerd wanneer voor een case een cel niet wordt ingevuld, of wanneer het programma een

    reken- of leesopdracht krijgt en in een bepaald geval niet weet wat het moet invullen. SPSS

    vult dan automatisch een zgn.System Missing Valuein, wat eigenlijk neerkomt op een lege

    cel. Bij de procedures ComputeVariableenRecodekomen we hier nog op terug.

  • 7/25/2019 spss15_stappenplan_08

    21/55

    Training 1 5. Rekenen-I (Compute Variable) 21

    5. Rekenen-1 (Compute Variable)SPSS biedt de mogelijkheid nieuwe variabelen te berekenen of te herberekenen.

    5.1 Laat SPSS het bestand stap 12.sav lezen en sluit de overige databestanden. Kies

    en ga na dat er is sprake is van zes variabelen (nr, gewicht,lengte, x, yenz) en dat er bij lengteenysprake is van ontbrekende waarden.

    Stel je wilt voor de zes personen de Quetelet-index berekenen. (Quetelet-index=het gewicht

    in kg gedeeld door het kwadraat van de lengte in meters).

    5.2 Nadat je voor de opties en hebt gekozen verschijnt

    het Compute Variable venster. Linksboven vul je de naam van de zogenaamde Target

    Variablein. Dat is de naam van de variabele waarin het resultaat van de berekening wordt

    opgeslagen. Type hier queteletin. OnderNumeric Expressionbevindt zich het het

    formulevenster waarin het rekenvoorschrift ofwel de formule moet komen. Bestaande

    variabelen die je nodig hebt voor de berekening kun je links in de variabelenlijst selecteren enm.b.v. de pijl in het rekenvoorschrift plaatsen. Selecteer links de variabelegewichten

    breng die over naarhet formulevenster.Vervolgens wil je gaan delen. Het teken voor deze

    operatie is /. Klik op dat teken in de rekenmachine. Daarna haal je de variabele lengte

    naar het formulevenster.Kwadrateren is machtsverheffen (teken: **) tot de macht 2. In de

    formule moet nu staan: gewicht/lengte**2. Omdat machtsverheffen vr delen wordt

    uitgevoerd, hoef je hier niet met haakjes te werken. Haakjes vind je overigens ook op het

    toetsenbord van de rekenmachine. In plaats van gebruik te maken van de linker

    variabelenlijst en de toetsen van de rekenmachine, kun je ook de formule gewoon intypen in

    het formulevenster.

    Uiteindelijk ziet het Compute Variable venster dus als volgt uit:

  • 7/25/2019 spss15_stappenplan_08

    22/55

    Training 1 5. Rekenen-I (Compute Variable) 22

    Als de formule gereed is kun je met [OK] SPSS de opdracht geven om de berekening uit

    te voeren (zie instructiefilmpje: compute.avi).De nieuwe variabele verschijnt in de meest

    rechtse kolom van de Data View. Controleer dit.

    Je ziet in het datavenster dat op de vierde regel geen waarde voor queteletis ingevuld, maardat er een . staat. Bij het berekenen van queteletvoor deze case kwam SPSS eenontbrekendewaarde -1 tegen voor de variabele lengte. Zoals we in Stap 4hebben gezien

    behandelt SPSS in zon geval de -1 alsof het een System Missing Value is!

    Tip:Als je een nieuwe variabele maakt met Compute Variable, is het handig om deze

    variabele meteen van een label en het juiste formaat te voorzien. Klik daarvoor in het

    Compute Variable scherm op drukknop [Type & Label]. In het nu volgend scherm kan het

    gewenste label en de juiste formaat worden opgegeven. Daarbij is het ook mogelijk de

    gebruikte rekenkundige expressie als label te kiezen.

    Opmerking 1:Onderstaande tabel geeft de betekenis van de tekens (relationele operators) in het

    rekenscherm:

    = gelijk aan

    ~= niet gelijk aan

    < kleiner dan

    groter dan

    >= groter dan of gelijk aan

    +,-,*,/ resp. plus, min, maal, gedeeld door

    ** tot de macht

    ~ niet

    ( ) tussen haakjes

    Voor het combineren van rekenkundige expressies kan gebruik worden gemaakt van:

    & en (ook: AND)

    Voorbeeld (hearing.sav bestand): geslacht =1 & hearaid = 1 (betreft mannen met

    een hoorapparaat)

    | of (ook: OR)

    Voorbeeld (hearing.sav bestand): hearaid = 1 | hearing1 = 3 (betreft alle

    respondenten met een gehoorapparaat en alle respondenten die zelf vinden dat zeslecht horen )

    Opmerking 2:

    SPSS voert berekeningen altijd case voor case uit, dus rij voor rij. Je kunt daardoor

    bijvoorbeeld niet alle waarden van n variabele (per kolom) bij elkaar optellen.

  • 7/25/2019 spss15_stappenplan_08

    23/55

    Training 1 6. Kruistabellen (Crosstabs)23

    6. Kruistabellen (Crosstabs)Een handige manier om inzicht in categorische data (= nominale en ordinale variabelen) te

    verkrijgen is middels een kruistabel, een soort multidimensionele frequentietabel. In een

    kruistabel worden de waarden van de ene variabele (de kolommen) gekruist tegen de waarden

    van de andere variabele (de rijen). Elke rij * kolom combinatie heet een cel. Alle cellentezamen vormen de kruistabel. In de cellen staan de waargenomen aantallen ofwel de

    geobserveerde frequenties.

    De procedure Crosstabszal aan de hand van een voorbeeld worden uitgelegd. We gaan uit

    van het hearing.sav bestand (voor de beschrijving van dit bestand zie Stap3) en we willen

    weten hoe de waarnemingen verdeeld zijn wat betreft het geslacht (sex) en de

    hoorverslechtering (hearimp).

    6.1 Open hearing.sav en sluit daarna stap12.sav zonder te bewaren. Voorzie sexen hearimp

    van de juiste value labels (zie de beschrijving van het bestand in Stap 3) en definieer 999

    als missende waarde voor hearimp.

    Het venster Crosstabsmaak je actief via . In

    het kader onderRow(s)geef je de variabele op die de rij moet gaan vormen, en onder

    Column(s)de variabele die de kolom moet gaan vormen.

    6.2 Start de procedure Crosstabs. Geef als rijvariabele sexop en als kolomvariabele

    hearimp:

    Druk op [OK].Het outputvenster verschijnt en in het eerste gedeelte van de uitvoer staat een

    tabel met samenvattende gegevens (aantallen en ontbrekende waarden). Vervolgens staat er

    een afdruk van de gewenste kruistabel(zie instructiefilmpje: crosstabs.avi). Ga na hoeveel

    vrouwen een verslechterd gehoor hebben. En hoeveel mannen? [zie *]

    *39 vrouwen en 34 mannen

  • 7/25/2019 spss15_stappenplan_08

    24/55

    Training 1 6. Kruistabellen Crosstabs) 24

    6.3 Middels de procedure Crosstabs worden standaard de geobserveerde frequenties in een

    kruistabel weergegeven. Er kan ook een uitgebreidere kruistabel worden opgevraagd waarin

    percentages vermeld worden. Herhaal de vorige opdracht maar activeer nu in het

    Crosstabs venster de drukknop [Cells...]. Het volgende venster verschijnt:

    Vink de hokjes onder CountsenPercentagesaan zoals hierboven is aangegeven en druk

    op [Continue] en vervolgens op [OK].Je verkrijgt op deze manier een uitgebreidere

    kruistabel waarin naast de geobserveerde frequenties ook de kolom,- rij,- en totale

    percentages vermeld staan:

    sex * hearimp Crosstabulation

    14 34 48

    29.2% 70.8% 100.0%

    58.3% 46.6% 49.5%

    14.4% 35.1% 49.5%

    10 39 49

    20.4% 79.6% 100.0%

    41.7% 53.4% 50.5%

    10.3% 40.2% 50.5%

    24 73 97

    24.7% 75.3% 100.0%

    100.0% 100.0% 100.0%

    24.7% 75.3% 100.0%

    Count

    % within sex

    % within hearimp

    % of Total

    Count

    % within sex

    % within hearimp

    % of Total

    Count

    % within sex

    % within hearimp

    % of Total

    male

    female

    sex

    Total

    not hearing

    impaired

    hearing

    impaired

    hearimp

    Total

    Uit bovenstaande tabel kan men aflezen dat 29.2% van de mannen geen verslechterd gehoor

    heeft (% within SEX, =14/48). Van de mensen die geen verslechterd gehoor hebben, is

    bovendien 58.3% man (% within HEARIMP, =14/24). Ook kan men in de tabel zien dat

    14.4% van alle proefpersonen mannen zijn met geen verslechterd gehoor (% of Total,

    =14/97). Ga na hoeveel procent van de vrouwen een verslechterd gehoor heeft. [zie *]

    Hoeveel procent van het totale aantal proefpersonen zijn vrouwen met een verslechterd

    gehoor? [zie **]

    *79.6%

    **40.2%

  • 7/25/2019 spss15_stappenplan_08

    25/55

    Training 1 6. Kruistabellen Crosstabs) 25

    Het kan zijn dat je soms alleen genteresseerd bent in rijpercentages, vink dan alleen dat

    hokje aan. De tabel is daardoor gemakkelijker te lezen.

    Het is ook mogelijk een kruistabel te maken voor verschillende groepen, zoals bijvoorbeeld

    een kruistabel vansextegen hearimp voor de drie leeftijdsgroepen (agegrp1) afzonderlijk.

    6.4 Vraag een kruistabel op van sex(Row) tegenhearimp(Column) en geef daarbij onder

    Layeragegrp1op.Het resultaat is dat voor elke waarde van de variabele agegrp1eenkruistabel vansextegen hearimpwordt gemaakt.

    Vraag: Hoeveel procent van de mannen van 55-64 jaar (agegrp1=1) hebben een

    verslechterd gehoor?[zie *]

    *100%

  • 7/25/2019 spss15_stappenplan_08

    26/55

    Training 1 7. Oefenen I 26

    7. Oefenen IIn deze Stap zullen de hiervoor besproken procedures toegepast worden.

    De uitwerkingen zijn na de laatste sessie van training 1 beschikbaar op ELEUM (file:

    uitwerkingen_Stap7.pdf) zodat je je eigen uitvoer en de antwoorden kunt controleren.Voordat je begint is het handig om te controleren of SPSS als volgt is ingesteld: kies binnen

    het SPSS datavenster of outputvenster klik op het tabblad Viewer

    en zorg dat links onderaan Display commands in the log is aangevinkt:

    In de outputfile komt nu naast de uitvoer ook de SPSS syntax te staan, d.w.z. de SPSS

    commandotaal. Aan de hand van deze syntax kun je later bij elke opgave nagaan welke

    SPSS procedures je hebt toegepast bij een bepaalde opgave, en kun je deze vergelijken met

    de procedures en de syntax in de uitwerkingen op ELEUM.

    Sla alle uitvoer op in n outputfile en schrijf de antwoorden op de vragen hieronder op.

    Het kan zijn dat je SPSS trainer vraagt om je uitvoer en de antwoorden te laten zien

    voordat je kunt aftekenen, bewaar ze dus beide in elk geval!!!

    Open het bestand hearing.sav en sluit alle andere databestanden die eventueel nog open

    zijn zonder te bewaren.

    7.1 Zorg dat de variabelen sex, hearaid en agegrp1 van de juiste value labels zijn voorzien.

    De hiervoor benodigde beschrijving van hearing.sav vind je in Stap 3!

    7.2 Onderzoek de variabele agemiddels de procedure Explore voor mannen en

    vrouwen afzonderlijk.

    Wat is de gemiddelde leeftijd van de mannen? ..

    Wat is de variantie van de leeftijd van de vrouwen? ..

  • 7/25/2019 spss15_stappenplan_08

    27/55

    Training 1 7. Oefenen I 27

    7.3 Definieer 998 als missende waarde voor de variabele hearaid.

    7.4 Gebruik de procedure Frequencies om te onderzoeken hoeveel procent van de

    proefpersonen een hoorapparaat heeft (wel hoorapparaat: hearaid =1, geenhoorapparaat: hearaid=2)

    Wat is het verschil tussen de percentages in de kolom Percent en de kolom Valid Percent?

    ...

    7.5.1 Maak een kruistabel van hearaiden agegrp1.Zorg dat er alleen aantallen in deze

    kruistabel afgedrukt worden, dus geen percentages.Beantwoord onderstaande vragen:

    a. Hoeveel personen in de oudste leeftijdsgroep hebben een hoorapparaat?

    b. Hoeveel personen zitten er in de oudste leeftijdsgroep?

    c. Bereken nu hoeveel procent van de oudste leeftijdsgroep een hoorapparaat heeft? ...........

    d. Bereken ook hoeveel procent van de personen zonder hoorapparaat tot de jongste

    leeftijdsgroep behoort?e. Probeer uit de tabel af te leiden of er een relatie is tussen het hebben van een hoorapparaat en

    de leeftijdscategorie

    7.5.2 Vraag dezelfde kruistabel aan maar nu met alle rij, kolom en totaal percentages.

    Ga na waar de antwoorden van c. en d. terug te vinden zijn in de tabel.

    7.6 Maak middels de procedure Frequencies eerst een bar chart en daarna een histogram

    van de variabelen ageen agegrp1 zonder dat er in de uitvoer frequentietabellen

    verschijnen.

    Beslis voor beide variabelen apart welke grafiek de data het beste weergeeft, en

    waarom?

    Hier komen we in de volgende Stap nog op terug.

  • 7/25/2019 spss15_stappenplan_08

    28/55

    Training 2 8. Grafische uitvoer, printen en SPSS uitvoer in WORD 28

    8. Grafische uitvoer, printen en SPSS uitvoer in WORDTot nu toe werd de uitvoer zichtbaar gemaakt in het outputvenster en kon de inhoud van dit

    venster, eventueel na correctie, worden opgeslagen in een file. De uitvoer bestond uit tekst,

    soms uit tabellen en tekst. Een aantal procedures produceert behalve tekst ook plaatjes. Bij

    weer andere procedures bestaat de uitvoer uit louter plaatjes.

    8.1 Grafische uitvoer: Histogram

    Open hearing.sav. Kies voor . Selecteer in het

    venster dat wordt aangeboden ageals variabele en druk op [OK]. SPSS maakt een

    histogram van de gekozen variabele. Controleer of dat inderdaad is gebeurd door het

    outputvenster te bekijken.

    Door in het uitvoervenster dubbel te klikken op het histogram verschijnt de zogenaamde

    SPSS Chart Editor. In dit venster is het mogelijk de grafische uitvoer van het betreffende

    histogram naar wens te veranderen (te editen). Dit venster heeft namelijk zijn eigen menu- en

    knoppenbalk. Als voorbeeld zullen we de kleur van de staven van het histogram veranderen.Dubbelklik in de uitvoer op het histogram zodat de Chart Editor verschijnt. Dubbelklik

    vervolgens op een staaf om het gehele histogram te selecteren. Het Properties venster

    verschijnt. In dit venster kan onder het tabblad Fill & Borderde gewenste kleur

    geselecteerd worden. Dit kan ook door gebruik te maken van de Fill Color knop van de

    knoppenbalk welke hieronder is aangegeven met de pijl:

    Kies een kleur en druk op [Apply] in het Properties venster (niet nodig wanneer men

    gebruik maakt van de Fill Color knop). De kleur van het histogram verandert meteen.

  • 7/25/2019 spss15_stappenplan_08

    29/55

    Training 2 8. Grafische uitvoer, printen en SPSS uitvoer in WORD 29

    8.2 Grafische uitvoer: Bar Chart (Staafgrafiek)

    Maak nu een Bar Chart (staafgrafiek) van de variabele age. Kies , en vervolgens Simple, druk op de knop [Define]. Vul in bij Bars

    Represent: N of cases. Definieer ageals Category Axis en klik op [OK]. Vergelijk deze

    grafiek met het histogram.Naar welke gaat je voorkeur uit, motiveer. [zie *]Voor welk soort variabele geeft een

    Bar Chart een goede weergave van de data?[zie **]

    De inhoud van het uitvoervenster kan rechtstreeks naar een printer worden gestuurd of

    worden opgeslagen in een Spo-file (zie Stap1).

    8.3 Printen:

    Om de computer een printopdracht te geven klik je op . Klik in het

    Afdrukken venster op [Eigenschappen] om in te stellen dat de printer 2 paginas per A4

    print!!! Dat deze mogelijkheid bestaat is handig om te weten aangezien, je tijdens je studie

    regelmatig opdrachten met SPSS voor statistiek moet maken. Klik op [OK] en vervolgensop [Annuleren] (het echte uitprinten komt nog wel!).

    8.4 SPSS uitvoer in Word.:

    Uitvoer in het outputvenster kan op een gemakkelijke manier gekopieerd worden naar een

    (bestaand) WORD document. Dit is erg handig voor bijvoorbeeld het maken van een verslag.

    In deze Stap gaan we eerst een grafiek en een tabel maken m.b.v SPSS, en vervolgens zullen

    we enkele onderdelen van deze uitvoer naar een WORD bestand kopieren.

    Om te kijken of er een verband bestaat tussen leeftijd en de fletcher index maken we een

    puntenwolk (een scatter).Definieer binnen hearing.sav eerst de waarde 999 als missing

    value voorfi_b_ear. Kies , daarna Simple

    Scatter en klik op [Define]. Zet ageop de x-as enfi_b_earop de y-as. Klikop [OK].

    Hoe zou je het verband tussen beide variabelen kunnen omschrijven?[zie ***] Maak

    ook een frequentietabel van de variabele sex.

    Open een nieuw WORD document. Ga vervolgens weer terug naar het SPSS

    outputvenster. Dubbelklik in de uitvoer op de puntenwolk zodat de Chart Editor

    verschijnt. Kies . Ga naar het WORD document en kies

    .Nu verschijnt de puntenwolk als plaatje in je WORD document.

    Selecteer nu de frequentietabel in het outputvenster. Kies . Ganaar het WORD document en kies .Nu verschijnt de frequentietabel ook

    in het WORD document.

    * Voorkeur voor histogram omdat age een continu variabele is

    ** Bar Chart is geschikt voor categorische variabelen*** Lineair verband

  • 7/25/2019 spss15_stappenplan_08

    30/55

    Training 2 9. Groeperen (Split File) 30

    9. Groeperen (Split File)

    Vaak is het wenselijk om een bepaalde procedure bijv. Descriptives, niet voor alle cases

    samen te laten uitvoeren, maar voor aparte groepen van cases. Dit kan met de procedure Split

    File. Deze procedure zullen we demonstreren aan de hand van het bestand geboorte.sav. Ditbestand bevat 40 cases met gegevens omtrent het geboortegewicht (geb_gew) en de

    zwangerschapsduur (zw_duur). Een derde variabele (zk_huis) bevat een code voor hetdeelnemende ziekenhuis (zk_huis=1, 2, of 3)

    9.1 Open geboorte.sav en sluit hearing.sav (eventueel bewaren, is niet noodzakelijk voor

    verdere stappen). Dit bestand bevat geboortegegevens (geboortegewicht,

    zwangerschapsduur en deelnemend ziekenhuis) van 40 kinderen.Via en

    kom je in het Split File venster.Selecteer de optie []voor Compare groups. Zet de

    variabelezk_huisin het venster Groups Based on. De optie [] voor Sort the file by

    grouping variablesis standaard geactiveerd, want de cases moeten gesorteerd zijn op basis

    van de groepsvariabele(n) om Split File goed te laten verlopen:

    Na [OK]zie je in het datavenster dat de sortering is uitgevoerd en tevens staat rechtsonder

    vermeld dat Split File actief is (Split File On)

  • 7/25/2019 spss15_stappenplan_08

    31/55

    Training 2 9. Groeperen (Split File) 31

    Voer nu op de gebruikelijke wijze de procedure Descriptives uit voor de variabelen

    geb_gewenzw_duur.( etc). De volgende

    uitvoer verschijnt(zie instructiefilmpje: splitfile.avi):

    Descriptive Statistics

    15 ,70 1,40 1,0733 ,20166

    15 26,00 35,00 30,0667 2,63131

    15

    14 ,80 1,90 1,4429 ,33904

    14 27,00 36,00 31,3571 2,95107

    14

    11 1,00 1,70 1,3182 ,23587

    11 28,00 36,00 32,0909 2,77325

    11

    geb_gew

    zw_duur

    Valid N (listwise)

    geb_gew

    zw_duur

    Valid N (listwise)

    geb_gew

    zw_duur

    Valid N (listwise)

    zk_huis1,00

    2,00

    3,00

    N Minimum Maximum Mean Std. Deviation

    Uit de uitvoer is op te maken dat SPSS de drie ziekenhuizen apart heeft behandeld! Dit is het

    resultaat van Split File byzk_huis.

    Je hebt hier gebruik gemaakt van n groepsvariabele (zk_huis), maar dat mogen er ook meerzijn. Dan wordt er voor elke combinatie van deze variabelen een aparte uitvoer gegeven.

    Let op:Het is alleen zinvol om te splitsen op een variabele die groepen ofwel categorien

    kent (categorische variabele)

    9.2 Open het bestand hearing.sav en sluit geboorte.sav af zonder te bewaren. Bereken de

    gemiddelde leeftijd voor mannen en vrouwen apart door gebruik te maken van de

    procedure Split File. [zie*]

    * mannen 73.51; vrouwen 73.36

  • 7/25/2019 spss15_stappenplan_08

    32/55

    Training 2 10. Selecteren (Select Cases) 32

    10. Selecteren (Select Cases)In Stap 9(Split File) hebben we gezien dat het mogelijk is SPSS procedures te laten

    uitvoeren voor aparte groepen van cases. De uitvoer wordt dan voor elke groep apart

    weergegeven. Het is ook mogelijk om alleen die cases (rijen) te selecteren die aan bepaalde

    condities voldoen. Zo kunnen bijvoorbeeld die cases worden geselecteerd waarvoor devariabelegeslachtgelijk is aan de waarde 1, en tevens de variabele leeftijdgroter is dan 45.

    Dat selecteren kan van tijdelijke aard zijn (tot het moment dat de selectie wordt opgeheven)

    of van blijvende aard. In het eerste geval worden de NIET-geselecteerde cases in de Data

    View gemarkeerd (=Filtered) middels een schuine streep door het rijnummer (meest linker

    kolom). In het andere geval worden de cases uit het actuele bestand definitief verwijderd

    (=Deleted)!! Alleen door de gegevens opnieuw in te lezen kunnen deze cases nog

    geanalyseerd worden. Voorzichtigheid is dus geboden!!

    10.1 Open de file geboorte.sav (mocht je deze nog hebben openstaan na Stap 9 zet dan eerst

    Split File uit!) en sluit hearing.sav af.Zoals we al zagen Stap 9 bevat dit bestand een aantal

    geboortegegevens van 40 kinderen. De derde variabele (zk_huis) bevat een code voor het

    deelnemende ziekenhuis (zk_huis = 1, 2 of 3). Voor de te verrichten analyses zijn alleen de

    gegevens vanzk_huis=1 nodig. We willen dan ook alleen die cases selecteren die voldoen

    aanzk_huis=1. Via Menu-keuze kom je in het Select Cases

    venster. Kies binnen dit venster onderSelect voorIf condition is satisfied en onder

    OutputvoorDelete unselected cases (we zijn dus onvoorzichtig!):

    Klik op [If...]en je komt in een venster dat gelegenheid biedt de conditie (zk_huis = 1) op te

    geven:

  • 7/25/2019 spss15_stappenplan_08

    33/55

    Training 2 10. Selecteren (Select Cases) 33

    Als je vervolgens [Continue] en [OK] gebruikt wordt de selectie uitgevoerd . De Data

    View blijkt inderdaad nog maar 15 cases te bevatten. Natuurlijk hebben die allemaal de

    waarde '1' voor de variabele zk_huis.

    10.2 Open een nieuw datavenster middels en sluit het bestand

    geboorte.sav zonder (!) op te slaan. Laat SPSS geboorte.sav opnieuw lezen. Zoek het

    selectievenster weer op, maar kies nu voor Filter out unselected cases. Definieer onder

    [If] dezelfde conditie en voer de selectie uit (zie instructiefilmpje: selectcases.avi).Je ziet

    nu in het datavenster dat alle waarden er nog in staan. Alleen zijn de niet-geselecteerde cases

    in de nummerkolom (links) gemarkeerd. Er is bovendien een nieuwe variabele gecreerd:

    filter_$. Die bevat een '0' voor de niet-geselecteerde en een '1' voor de geselecteerde cases.

    Rechtsonder in het datavenster staat vermeld: Filter on. Wanneer je nu procedures uitvoert

    (Case Summaries, Frequencies, etc) hebben die slechts betrekking op de geselecteerde (= niet

    gemarkeerde) cases.

    Let op!

    De selectie blijft bestaan totdat je de selectie opheft . De selectie wordt opgeheven doorin het Select Cases venster onder Select de knopAll Caseste activeren. Als je dat doet zul

    je zien dat de variabelefilter_$blijft bestaan. Die kun je dus later nog eens gebruiken. Zou

    je dan niet meer weten op welke selectie die variabele betrekking heeft dan kun je

    dubbelklikken op de naam van die variabele (filter_$). Dit geldt overigens alleen voor de

    laatst uitgevoerde selectie!

    Stel dat je de cases wilt selecteren die betrekking hebben opzk_huis=1 en ook nog voldoenaan de voorwaardezw_duur< 30. Je moet in dat geval de dubbele conditie in n keer

    opgeven: zk_huis = 1 AND zw_duur < 30. In plaats van AND kun je ook het teken &gebruiken. Het is dus niet mogelijk die selectie in twee stappen uit te voeren!

    Alle procedures onder Transform worden ook voor de niet geselecteerde casesverricht!!!

  • 7/25/2019 spss15_stappenplan_08

    34/55

    Training 2 11. Hercoderen (Recode) 34

    11. Hercoderen (Recode)Soms is het gewenst de waarden van een categorische variabele te hercoderen. Als

    bijvoorbeeldgeslacht gecodeerd is als 0 (man) en 1 (vrouw) en je wilt dit veranderen in 3

    (man) en 4 (vrouw) is Hercoderen (Recode) een geschikte methode. Dit moet men niet

    verwarren met het toekennen van de value labels in de Variable View (Stap 2)! Wanneer devariabele is gehercodeerd van 0-1 naar 3-4, zal men in de Variable View de value labels

    opnieuw moeten definiren (dus: 3=man en 4=vrouw).

    Een ander geval waarin de procedure Recode gebruikt moet worden is wanneer men de

    waarden van een interval of continue variabele in klassen wil verdelen. Denk daarbij aan de

    variabele leeftijd(in jaren) die men wil hercoderen in de variabele lftcat, waarin de leeftijd in

    een beperkt aantal categorien (bijv. jong, middel, oud) is verdeeld. Ook dit kan met de

    functie Hercoderen.

    Bij hercoderen heb je keuze uit twee mogelijkheden:

    1. Into Same Variables, waarbij de oorspronkelijke waarden van de te hercoderen variabeleworden overschreven met (ofwel vervangen door) de nieuwe waarden. Het gevolg is dat

    je niet meer kunt nagaan wat de oorspronkelijke waarden waren, de originele variabele

    wordt namelijk overschreven. Het is daarom aan te raden de andere mogelijkheid te

    gebruiken

    2. Into Different Variables, waarbij een nieuwe variabele wordt gecreerd en de oudevariabele met de oorspronkelijke waarden blijft bestaan. Dit is de meest veilige methode!

    11.1 Open het hearing.sav bestand en sluit geboorte.sav.

    We gaan de variabele hearscor indelen in klassen. Defineer eerst de waarde 999 van

    hearscor als missende waarde.

    Kies en .In het Recode into Different

    Variables venster staat links een lijst van de bestaande variabelen. Je kunt daar een of

    meerdere variabele(n) selecteren (= input variabele) door er op te klikken en middels een

    klik op de zwarte pijl naar het middelste kader te transporteren (Numeric Variable-

    >Output Variable). Selecteer de variabele hearscor en breng deze naar het middelste

    kader.

    Het is de bedoeling dat in dat kader achter ? op de plaats van het ?-teken de naam van de

    nieuwe variabele (= output variabele) moet komen. Die naam kun je rechtsboven onder

    Output Variableopgeven, waarna je op [Change] drukt en het ?-teken door de nieuwe naamwordt vervangen. Het is ook mogelijk om een label aan je nieuwe variabele toe te voegen

    onderLabel, die ook rechts onder Output Variablestaat.Noem de nieuwe variabele scocat

    en druk op [Change]:

  • 7/25/2019 spss15_stappenplan_08

    35/55

    Training 2 11. Hercoderen (Recode) 35

    Druk vervolgens op [Old and New Values...]. Er verschijnt een venster waar je de oude

    en de nieuwe waarden kunt opgeven.We willen de variabele hearscorhercoderen in de nieuwe variabelescocatvolgens hetvolgende hercoderingsvoorschrift:

    Hearscor25 scocat = 1

    25 (groter dan) 25.

    Klik links onder Old Value op de 5-de optie (= Range, LOWEST through value...) en vul25 in het rechthoekje eronder. Rechts onderNew Valuetyp je bij Value 1 in en klik op

    [Add]. Waarden van hearscorvanaf het minimum t/m 25 worden gehercodeerd naar 1.

    Klik nu links op de 4-de optie (= Range:) en vul 25 en 50 in. BijNew Valuevul je bijValue 2 in en klik weer [Add]. Alle waarden van hearscorgroter dan 25 en kleiner of gelijk

    aan 50 worden gehercodeerd naar 2.

    Completeer het hercoderings-voorschrift voor de andere waarden van de input

    variabele zodat het venster er uiteindelijk als volgt uit ziet:

  • 7/25/2019 spss15_stappenplan_08

    36/55

    Training 2 11. Hercoderen (Recode) 36

    Druk op [Continue] en in het nieuwe venster op [OK] waarna de hercodering wordt

    uitgevoerd (zie instructiefilmpje: recode.avi). In het datavenster (meest rechtse kolom) staat

    een nieuwe variabele (scocat), met als uitkomstmogelijkheid de waarden 1, 2, 3 en 4.

    Geef in de Variable View aan dat scocateen ordinale variabele is (onder Measure, zie

    Stap 2).

    Controleer of de hercodering goed is uitgevoerd via . Plaats de oorspronkelijke variabele (hearscor) onder de

    Dependent List en de nieuwe variabele (scocat) onder Factor List. Kies onderaan het

    venster onderDisplayvoor Statistics (plots zijn niet nodig):

    Druk op [OK]. In het uitvoerscherm verschijnt nu een beschrijving van de variabele

    hearscor voor elke waarde vanscocat:

  • 7/25/2019 spss15_stappenplan_08

    37/55

    Training 2 11. Hercoderen (Recode) 37

    Descriptives

    17.50 2.500

    -14.27

    49.27

    .

    17.50

    12.500

    3.536

    15

    205

    .

    . .

    . .

    45.80 1.248

    43.22

    48.38

    46.44

    50.0038.917

    6.238

    30

    5020

    10

    -1.447 .464

    1.355 .902

    66.41 .846

    64.71

    68.12

    66.53

    70.00

    32.959

    5.741

    55

    7520

    10

    -.220 .350

    -1.071 .688

    83.67 1.463

    80.64

    86.69

    83.06

    80.00

    51.362

    7.167

    78

    10022

    8

    1.651 .472

    1.326 .918

    Mean

    Lower Bound

    Upper Bound

    95% Confidence

    Interval for Mean

    5% Trimmed Mean

    Median

    Variance

    Std. Deviation

    Minimum

    MaximumRange

    Interquartile Range

    Skewness

    Kurtosis

    Mean

    Lower Bound

    Upper Bound

    95% Confidence

    Interval for Mean

    5% Trimmed Mean

    MedianVariance

    Std. Deviation

    Minimum

    MaximumRange

    Interquartile Range

    Skewness

    Kurtosis

    Mean

    Lower Bound

    Upper Bound

    95% Confidence

    Interval for Mean

    5% Trimmed Mean

    Median

    Variance

    Std. Deviation

    Minimum

    MaximumRange

    Interquartile Range

    Skewness

    Kurtosis

    Mean

    Lower Bound

    Upper Bound

    95% Confidence

    Interval for Mean

    5% Trimmed Mean

    Median

    Variance

    Std. Deviation

    MinimumMaximumRange

    Interquartile Range

    Skewness

    Kurtosis

    scocat

    1.00

    2.00

    3.00

    4.00

    hearscor

    Statistic Std. Error

    Aan de hand van de minimum en maximum waarden vanhearscorbinnen descocat groepenkan men controleren of de hercodering is goed gegaan (vergelijk deze met het hercoderings-

    voorschrift). Zo zie je dat de minimum(= 15) en maximum (= 20) waarden van hearscor

    binnen de categoriescocat=1 voldoen aan de voorwaarde van het hercoderingsvoorschrift:

    Hearscor25 -> scocat = 1

  • 7/25/2019 spss15_stappenplan_08

    38/55

    Training 2 11. Hercoderen (Recode) 38

    Opmerkingen:Als je een nieuwe variabele maakt via de procedure Recode into Different Variables zullen

    de niet in het hercoderingsvoorschrift voorkomende waarden van de originele (input)

    variabele automatisch System Missing Values worden in de nieuwe variabele. Je kunt

    dat ondervangen door de onderste button (All other values) te gebruiken in hetRecode Variables venster en alle niet genoemde waarden samen te vatten in n

    nieuwe waarde.

    Wil men bij de procedure Recode dat alle System- en User Missing Values van de originelevariabele, ook als missing values worden gezien in de nieuwe variabele dan is het

    noodzakelijkdat in het Recode venster (Old and New Values) deze System- en User

    Missing Values worden gehercodeerd naar System Missing Values.

    Kies: System or user-missing (Old Value) System-missing (New Value):

  • 7/25/2019 spss15_stappenplan_08

    39/55

    Training 2 12. Editen van de Uitvoer, het Syntaxvenster, Files en SPSS 39

    12. Editen van de Uitvoer, het Syntaxvenster, Files en SPSSIn Stap 8is heel kort al gesproken over het bewerken van de uitvoer. In deze Stap gaan we

    hier wat dieper op in. Het outputvenster bestaat uit twee delen, links een gedeelte waarin de

    opbouw van de uitvoer schematisch is weergegeven en rechts de uitvoer zelf.

    Editen van de uitvoer:

    12.1 Voer een aantal procedures uit in het hearing.sav bestand, maak bijvoorbeeld een

    frequentietabel vanfi_b_ear. Zorg dat het uitvoervenster schermvullend (groot) is.

    Er zijn verschillende mogelijkheden om de uitvoer te editen:

    In het linkergedeelte van het outputvenster staan de verschillende onderdelen van de uitvoer

    schematisch onder elkaar. Het gaat voor deze training te ver om alle onderdelen uit te leggen.

    Belangrijk om te onthouden is dat je een deel van een analyse kunt verwijderen door het

    desbetreffende onderdeel aan te klikken en op (van het toetsenbord) te drukken.

    In het rechtergedeelte staat de uitvoer zelf. Middels een schuifbalk helemaal aan de

    rechterkant kun je snel door deze uitvoer schuiven (scrollen). Een onderdeel kan worden

    verwijderd door erop te klikken en op te drukken. Het is ook mogelijk een stuktekst of een tabel in de uitvoer te wijzigen. Om bijvoorbeeld de titel Frequencies (boven aan

    de frequentietabel) te veranderen in Frequentietabel van Fi-b-ear klikt men eerst twee keer

    dubbel op de betreffende tekst zelf. Er verschijnt een apart venster, waarbinnen men de tekst

    eenvoudig kan aanpassen.

    Verander de titel van de frequentietabel van Frequencies naar Frequentietabel van

    fi_b_ear en probeer tevens deze nieuwe titel cursief te maken door gebruik te maken

    van de formatting toolbar bovenaan het scherm (wanneer deze toolbar niet automatisch

    verschijnt klik je bovenaan op ):

    Originele titel

  • 7/25/2019 spss15_stappenplan_08

    40/55

    Training 2 12. Editen van de Uitvoer, het Syntaxvenster, Files en SPSS 40

    Gewijzigde titel

    Het is ook mogelijk een nieuw stuk tekst tussen te voegen in de uitvoer. Dit kan middels

    , of met onderstaand icoontje van de knoppenbalk bovenaan het

    uitvoervenster:

    Er verschijnt nu een leeg tekstvenster waarbinnen je de gewenste tekst kunt typen:

  • 7/25/2019 spss15_stappenplan_08

    41/55

    Training 2 12. Editen van de Uitvoer, het Syntaxvenster, Files en SPSS 41

    Opmerking:Het nieuwe tekstvenster verschijnt altijd direct onderhet onderdeel dat op datmoment actief is, d.w.z. lichtgrijs gekleurd is met een rode pijl ervoor in het linkerdeel van

    het outputvenster. Je kunt zon onderdeel actief maken door er 1 keer op te klikken.

    Probeer een nieuw stukje tekst toe te voegen onder de frequentietabel.

    In Stap7zagen we al dat het mogelijk is om de SPSS commandos (syntax) die uitgevoerd

    worden op te nemen in de uitvoer (via en vink dan Displaycommands in the log aan). Dit is heel handig wanneer men in afgedrukte SPSS uitvoer wil

    nagaan welke procedures zijn uitgevoerd. Bekijk of deze optie al is aangevinkt!

    Het Syntaxvenster:

    Wij hebben tot nu toe gewerkt met de Data View, de Variable Viewen de Output. Er is ook

    een venster waarin SPSS instructies direct ingetikt kunnen worden, het Syntaxvenster (SPSS

    Syntax Editor). Het is je misschien al een keer opgevallen dat er in een menu-optie van een

    bepaalde procedure van SPSS ook een [Paste]-knop onder de [OK]-knop staat. Als je inplaats van de [OK]-knop op de [Paste]-knop zou drukken, kom je automatische in het

    Syntaxvenster terecht, waarin de instructie van SPSS in geschreven vorm staat. Vanuit het

    Syntaxvenster kun je deze instructies laten uitvoeren door in de toolbar op het pijltje te

    drukken.Een syntaxvenster is heel handig als je bijvoorbeeld een handeling vaak wil laten

    uitvoeren maar telkens voor een andere conditie. Je kunt namelijk in het syntaxvenster

    stukjes tekst markeren, kopiren en plakken en kleine veranderingen, al naar gelieve,

    aanbrengen.

    12.2 We werken met het hearing.sav bestand. Stel je wilt een aantal kruistabellen maken: sexvs hearing1, sex vs hearaid, agegrp1 vs hearaid, hearing1 vs hearaid. Via

    krijg je automatische alle mogelijke

    combinaties van tabellen van de variabelen die onder Rows(s) staan met de variabelen die

    onder Column(s) worden vermeld. Dit betekent dat je een aantal tabellen zou krijgen die je

    niet wilt. Of je zou een paar keer de crosstabs procedure moeten uitvoeren met iedere keer

    andere combinaties van variabelen. Dit kun je ook anders aanpakken door gewoon de eerste

    kruistabel aan te vragen via . Voer dit uit en

    geef de variabele sexals rijvariabele op en de variabele hearaidals kolomvariabele.

    Klik nu niet op [OK], maar op [Paste].Je komt dan automatische in een venster met als

    titel Syntax1-SPSS Syntax Editor:

  • 7/25/2019 spss15_stappenplan_08

    42/55

    Training 2 12. Editen van de Uitvoer, het Syntaxvenster, Files en SPSS 42

    De tekst die erin staat beschrijft in syntax taal het commando Crosstabs. Elk commando

    eindigt met een punt. Je kunt dit commando selecteren en middels Copy en Paste een aantal

    keren plakken. Kopieer de tekst twee keer en pas vervolgens per kopie de

    variabelenamen aan zodat er uiteindelijk drie kruistabellen zullen worden gemaakt: sex

    tegen hearaid, sex tegenagegrp1 enhearaid tegenagegrp1. Selecteer de gehele tekstmiddels Ctrl-A en klik vervolgens op het driehoekige pijltje () in de toolbar om de

    opdracht uit te laten voeren.Dit kan ook via de menukeuze . Alle gewenste

    kruistabellen worden nu achter elkaar aangemaakt in het uitvoervenster.

    Als je commentaar wilt toevoegen binnen een syntaxfile dan kan dit voorafgaande aan een

    commando, tussen twee commandos of na het laatste commando en moet je de regel

    beginnen met een * en afsluiten met een punt. Dan weet SPSS dat zon regel alleen

    commentaar bevat en niet als een commando beschouwd dient te worden.

    Wanneer je bezig bent met een onderzoeksopdracht is het handig om de syntax file op te

    slaan voor toekomstig gebruik (File> Save As). Deze file krijgt automatisch .sps als extensie.

    Files en SPSS:

    In de loop van de practica zijn we een aantal bestandstypen tegengekomen. Om een overzicht

    te geven staan ze in onderstaande tabel.

    Bestandstype Extensie

    Datafile van SPSS *.sav

    Outputfile *.spo

    Syntaxfile *.sps

  • 7/25/2019 spss15_stappenplan_08

    43/55

    Training 2 13. Oefenen II 43

    13. Oefenen II

    Net zoals in Stap7 gaan we ook nu weer een aantal SPSS procedures die tot nu toe aan de

    orde zijn gekomen toepassen. De uitwerkingen van de opgaven zullen na de laatste sessie van

    training 2 beschikbaar zijn op ELEUM (file:uitwerkingen_Stap13.pdf) zodat je je eigenuitvoer en de antwoorden kunt controleren.

    Sla alle uitvoer op in n outputfile en schrijf de antwoorden op de vragen hieronder op.

    Het kan zijn dat je SPSS trainer vraagt om je uitvoer en de antwoorden te laten zien

    voordat je kunt aftekenen, bewaar ze dus beide in elk geval!!!

    Open hearing.sav (misschien heb je dit bestand nog openstaan van de vorige Stap, daar kun

    je dan ook mee verder werken). Zie Stap3voor een beschrijving van dit bestand.

    13.1 Onderzoek alle variabelen middels de procedure Descriptives: Bekijk van alle variabelen

    (behalve vanid) de minimum en maximum waarde. Vergelijk deze met de waarden die deze

    variabelen kunnen aannemen volgens de beschrijving in Stap3. Zijn er variabelen metwaarden die niet valide zijn? Zo ja, definieer al deze waarden dan als missing values voor

    de desbetreffende variabele.

    NB: Bij fi_b_ear is naast 999 ook 16,67 een niet valide waarde. In het databestand is deze

    waarde ingevoerd als 16,6666666 Om dit op een juiste manier als missing te definieren

    kun je in dit geval in het betreffende venster bij missing de derde optie Range plus one

    optional discrete valuekiezen en invullen: low 1, high 19, Discrete value 999.

    Herhaal vervolgens de opdracht Descriptives en kijk opnieuw naar de minimum en

    maximum waarden. Check of je de volgende tabel hebt gekregen:

    Descriptive Statistics

    99 1 2 1,51 ,503

    98 1 3 1,81 ,668

    98 1 2 1,98 ,142

    99 1 3 2,23 ,831

    97 0 1 ,75 ,434

    97 25 100 68,61 16,117

    97 15 100 64,36 16,379

    95 20,00 68,33 40,5263 10,10952

    99 56 92 73,43 8,472

    88

    sex

    hearing1

    hearaid

    agegrp1

    hearimp

    euroqol

    hearscor

    fi_b_ear

    age

    Valid N (listwise)

    N Minimum Maximum Mean Std. Deviation

    Pas als je bovenstaande tabel hebt gekregen kun je verder gaan met de volgende opdracht!

    13.2 Zorg dat de variabelen sex en agegrp1zijn voorzien van de juiste value labels.

    13.3 Bereken een nieuwe variabele agemonth die de leeftijd in maanden weergeeft.Bestudeerhiervoor nogmaals Stap 5.Wat is de gemiddelde leeftijd in maanden?.............................

    13.4 We willen alleen die mensen analyseren die geen hoorapparaat hebben (hearaid= 2) n eenfletcherindex hebben van groter of gelijk aan 35 (fi-b-ear35), omdat juist deze mensen veel

    baat zouden hebben van een hoorapparaat. Selecteer deze mensen.Aanwijzing: Selecteer debetreffende mensen via procedure Select Cases (zie Stap10). Check de instelling bij Select

    Cases: unselected cases moetengefilterdworden!

  • 7/25/2019 spss15_stappenplan_08

    44/55

    Training 2 13. Oefenen II 44

    Van deze groep mensen willen we onderstaande vragen beantwoorden. Laat SPSS de

    daarvoor benodigde analyses uitvoeren.

    Wat is de gemiddelde leeftijd van deze groep mensen? .

    Wat zijn de percentages mannen en vrouwen in deze groep?..

    13.5 Gebruik de procedure Explore om de fletcher index per leeftijdscategorie van alle

    cases te bestuderen.

    Aanwijzing:Zet eerst Select Cases uit!! Ga hievoor terug naar het Select Cases venster enselecteer onder Select de knop All cases. Kies vervolgens in Explore: Dependent list:fi_b_ear, Factor List: agegrp1!! En niet age!

    Bestudeer de kengetallen zoals het gemiddelde, de standaard deviatie, het minimum en

    maximum, de range etc. en maak geschikte grafieken. Probeer alle uitvoer te begrijpen.

    Wat merk je op als je naar de relatie tussen de fletcher index en de leeftijd

    kijkt?...................................................................................................................

    13.6 Onderzoek de verschillen in fletcher index tussen de verschillende leeftijdsgroepen,

    maar nu zonder gebruik te maken van de procedure Explore (zie Stap 9).

    13.7 Maak een nieuwe variabele euroqolcatwaarbij de waarden van euroqol in klassen

    ingedeeld worden. De waarden van 0 t/m 50 vaneuroqolmoeten bij de nieuwe variabelewaarde 1 krijgen, 51 t/m 75 waarde 2, en 76 t/m 100 waarde 3, dus het

    hercoderingsvoorschrift luidt:

    0 euroqol 50 -> euroqolcat =1

    51 euroqol 75 -> euroqolcat =2

    76 euroqol 100 -> euroqolcat =3

    Controleer via de procedure Explore of de hercodering is goed gegaan.

    Maak van deze nieuwe variabele een frequentieverdeling.

    Beslis welke grafiek (bar chart of histogram) het meest geschikt is voor de variabele

    euroqolcat en maak deze grafiek.

  • 7/25/2019 spss15_stappenplan_08

    45/55

    Facultatief 14. Rekenen-2 (rekenen met If) 45

    14. Rekenen-2 (rekenen met If)

    In Stap5is het rekenen in SPSS behandeld.Bekijk die Stap nog eens. Vaak komt het voor

    dat je een rekenvoorschrift wilt laten uitvoeren alleen voor cases die aan een bepaalde

    voorwaarde voldoen. We willen bijvoorbeeld een inkomensafhankelijke bijdrage berekenendie niet voor alle inkomens hetzelfde percentage bedraagt. Dit is niet mogelijk middels de

    procedures Select Cases of Split File!

    14.1 Laat SPSS het bestand stap14.sav lezen en zorg dat via het rekenvenster verschijnt. Stap14.sav bevat drie variabelen: nr, geslachten

    inkomen. We willen nu een nieuwe variabele laten berekenen die we bijdragenoemen. Deze

    variabele moet worden berekend volgens onderstaand rekenvoorschrift:

    Als inkomen 5000 dan bijdrage= 5% * (inkomen-2000)

    Als 5000 < inkomen

    7500 dan bijdrage= 7.5% * (inkomen-2000)Als inkomen> 7500 dan bijdrage= 10% * (inkomen-2000)

    Dit doen we als volgt:

    Maak eerst het sommetjebijdrage= (inkomen- 2000) * 0.05:

    Gebruik nog niet de [OK]-knop, maar klik onderaan op [If]. Onderstaand venster

    verschijnt. Kies voor de optie 'Include if case satisfies condition en vul de voorwaarde in

    (hier:inkomen5000):

  • 7/25/2019 spss15_stappenplan_08

    46/55

    Facultatief 14. Rekenen-2 (rekenen met If) 46

    Druk vervolgens op [Continue] en in het volgende venster op [OK] om de rekenpartij

    uit te laten voeren.Je ziet dat de rekenpartij alleen voor de cases met een inkomen 5000

    wordt uitgevoerd, terwijl voor de andere cases de System Missing waarde is ingevuld.

    Ga terug naar het Compute Variable venster en voer vervolgens de volgenderekenopdracht uit: bijdrage= (inkomen-2000)* 0.10. Stel middels [If] als voorwaarde de

    conditie: inkomen> 7500. Klik op [Continue] en daarna op [OK]. SPSS vraagt nu

    toestemming om de bestaande variabele te overschrijven (Change existing variable?). Klik

    op [OK],want je wilt natuurlijk een aantal van de System Missing waarden vervangen

    (namelijk die waarvoor geldt:inkomen> 7500).

    Tenslotte moet bijdrage= (inkomen-2000)* 0.075 nog worden berekend onder de

    voorwaarde dat 5000 < inkomen 7500.Hierbij doet zich een probleem voor. Je zou

    mogen verwachten dat onder [If ] gewoon '5000 < inkomen7500' ingevuld kan worden. Als

    je dat doet begint SPSS inderdaad te rekenen, maar doet dat alleen voor het linker deel van de

    ingevulde conditie: '5000 < inkomen' (anders gezegd: voorinkomen > 5000). De gewenste

    conditie bestaat echter uit twee delen en die delen moeten apartworden opgegeven en

    verbonden door de operators AND ofwel &. Je dient dus in dit geval onder [If] op te

    geven:

    inkomen > 5000 AND inkomen7500of: inkomen> 5000 & inkomen7500.

    Als je nu kijkt naar de waarden die voor bijdragezijn berekend valt het op dat case 7 een

    negatieve waarde heeft:

  • 7/25/2019 spss15_stappenplan_08

    47/55

    Facultatief 14. Rekenen-2 (rekenen met If) 47

    Rekenkundig klopt dat wel, maar de opdrachtgever wil in het geval van een negatieve waarde

    de bijdrage op 0 stellen. Hiervoor staan verschillende methoden ter beschikking, zoals:

    RECODE bijdrage: waarden kleiner dan 0 worden 0.

    COMPUTE bijdrage: waarden kleiner dan 0 worden 0.

    We kunnen echter ook een andere, ingewikkeldere methode gebruiken, waarmee meteen het

    gebruik van Functions wordt gedemonstreerd.

    14.2 Ga weer naar het Compute Variable venster.De Target Variable is nog steedsbijdrage. In

    het veld Numeric Expression maken we gebruik van de functie Max. Deze functie bevindt

    zich onder Function group: Statistical, selecteer vervolgens bijFunctions and Special

    Variables:Max. Maxzorgt ervoor dat het maximum van een aantal argumenten wordtgekopieerd naar de Target Variable.Selecteer Max en breng die met het pijltje omhoog.

    Op de plaats van de ?,? komt achtereenvolgens bijdrageen 0te staan:

  • 7/25/2019 spss15_stappenplan_08

    48/55

    Facultatief 14. Rekenen-2 (rekenen met If) 48

    De functie Max bepaalt nu voor elke case het maximum van0en de waarde van de variabele

    bijdrageen plaatst dat maximum in bijdrage. Met andere woorden, wanneer de waarde van

    bijdragekleiner dan 0 is, zoals het geval bij case 7, wordt deze waarde vervangen door 0. In

    alle andere gevallen blijft de eerder berekende waarde van bijdrage gewoon gehandhaafd.

    Laat SPSS de rekenpartij uitvoeren voorallecases (dus onder [If] selecteer jeInclude

    all cases !).

    SPSS kent een groot aantal functies. Het gaat hier te ver om het gebruik ervan te

    demonstreren. Blader het lijstje eens door om een indruk te krijgen van demogelijkheden.Via Help zou je nog informatie kunnen krijgen over een specifieke functie en

    tijdens je studie zul je meer mogelijkheden vanzelf ontdekken.

  • 7/25/2019 spss15_stappenplan_08

    49/55

    Facultatief 15. Bestanden samenvoegen (Merge Files) 49

    15. Bestanden samenvoegen (Merge Files)In de praktijk komt het dikwijls voor dat gegevens, die bij elkaar horen, zijn opgeslagen in

    verschillende files. Het kan zijn dat er twee (of meer) files zijn met verschillende cases, het

    kan ook zijn dat in twee (of meer) files verschillende variabelen van dezelfde cases zijn

    opgeslagen. Vaak moeten die files worden samengevoegd (= merge).

    Add Cases

    De datafile oef15.sav bevat gegevens omtrent vier toetsuitslagen van een vijftal studenten.

    Indien er toetsuitslagen van andere studenten in een andere datafile zijn opgeslagen, is het

    natuurlijk wenselijk om op een gegeven moment de twee datafiles te combineren in n file.

    Dat kan met de menu-optie onder . Wanneer je op klikt,

    moet je kiezen voor .

    We willen de gegevens van toets3.sav (data over de vier toetsuitslagen van vijf andere

    studenten) toevoegen aan de datafile oef15.sav.

    15.1 Open eerst oef15.sav en sluit databestanden van vorige Stappen af.Dit is je actieve

    datafile. Kies vervolgens .In het venster dat nu

    verschijnt kies je voor an external SPSS data file. Kies toets3.sav middels [Browse]. Nadat

    je op [Continue] hebt gekliktverschijnt het volgende venster:

    Je ziet dat SPSS meteen begrijpt dat de beide datafiles overeenkomstige variabelen hebben.

    Deze gezamenlijke variabelen plaatst SPSS automatisch in de rechter box van het dialoog

    venster.

    Klik op [OK] en constateer zelf door in het datavenster te kijken hoe de twee datafiles

    samengevoegd zijn.

    Je kunt de samengevoegde datafile, eventueel onder een nieuwe naam, opslaan. Bedenk een

    toepasselijke filenaam en sla de nieuwe datafile op met behulp van .

    Uit bovenstaand voorbeeld wordt duidelijk dat het handig is als de twee datafiles die je wilt

    samenvoegen dezelfde variabelen(-namen) bevatten. Het kan echter ook voorkomen dat de

  • 7/25/2019 spss15_stappenplan_08

    50/55

    Facultatief 15. Bestanden samenvoegen (Merge Files) 50

    ene datafile variabelen bevat die niet in de andere datafile voorkomen. Stel we willen de

    cases van de databestanden hearing.sav en geboorte.sav (zie Stap 9) samenvoegen.

    Onderstaand dialoogvenster verschijnt:

    Een (*) achter de variabelenaam betekent dat de variabele behoort tot het actieve bestand

    (hearing.sav), terwijl een (+) betekent dat de variabele alleen tot de toe te voegen file behoort

    (geboorte.sav).

    De variabelen die in beide bestanden voorkomen worden automatisch opgenomen in de

    nieuwe samengevoegde file. De andere (*) en (+) variabelen kunnen in het nieuwe bestand

    worden opgenomen door ze met de pijl naar rechts onder Variables in New Active Dataset

    te brengen. De (+)-variabelen, die dus niet voorkomen in het actieve bestand, worden daarbij

    voor de cases in het actieve bestand aangemaakt en gevuld met de waarde system missing(zie Stap 4). Het omgekeerde kan natuurlijk ook het geval zijn!

    15.2 Add VariablesNaast het samenvoegen van twee datafiles met dezelfde variables (Add Cases) is het ook

    mogelijk om twee datafiles die dezelfde cases (bijv. personen) betreffen maar die

    verschillende variabelen bevatten, aan elkaar te koppelen met .

    Stel je beschikt bijvoorbeeld voor de personen in het bestand hearing.sav ook over gegevens

    van hun medische consumptie. Die gegevens staan echter in een ander databestand. Het kaninteressant zijn om deze datafiles aan elkaar te koppelen om zodoende bijvoorbeeld te

    onderzoeken of medische consumptie verschilt voor de personen met en zonder een

    hoortoestel. De datafile met de gegevens over de medische consumptie is medcomp.sav.

    Deze bevat 2 variabelen, identificatie nummer (id) en medische consumptie (medcomp). Wewillen de variabelemedcompgaan toevoegen aan hearing.sav.

    Van essentieel belang bij zon koppelmanoeuvre is de sleutel ofwel key variable. Dat is

    een variabele die in beide bestanden voorkomt en die SPSS laat weten welke cases gekoppeld

    moeten worden. Het is overigens heel goed mogelijk, en in de praktijk zelfs meestal het

    geval, dat er onderzoekseenheden (hier personen) zijn die niet in beide data sets voorkomen.

    In dit voorbeeld is de sleutel het identificatienummer (id). Dit moet uniek zijn voor de

  • 7/25/2019 spss15_stappenplan_08

    51/55

    Facultatief 15. Bestanden samenvoegen (Merge Files) 51

    dataset(s). SPSS vereist bovendien dat in beide datafiles de cases geordend zijn in oplopende

    waarden voor de sleutel of key variabele.

    Open het bestand medcomp.sav en sluit andere databestanden. Zorg dat de cases van

    medcomp.sav gesorteerd worden volgens de variabele id. Dit doe je volgens de stappen: in het volgende scherm:

    Vul onder Sort by: idin, klik op [OK]. Open naast medcomp.sav de file hearing.sav.

    Sorteer ook binnen hearing.sav op id.

    Zorg dat je met je muis in hearing.sav staat (dan is dat de actieve file). Klik op

    . In het dialoogvenster Add Variables to

    hearing.sav selecteer je onder de optieAn open dataset de file medcomp.s