Digital Content Marketing Congres '14 | Wouter Gijsbertsen | Cliptoo
spss15_stappenplan_08
Transcript of spss15_stappenplan_08
-
7/25/2019 spss15_stappenplan_08
1/55
SPSS 15.0in praktische stappen
voor AGW-bachelors
auteurs:
Miranda WinkelhuijzenMickey Chenault
Monique ReuskenPauline ViltersRobbie Martens
Capaciteitsgroep
Methodologie & Statistiek
2008-2009
-
7/25/2019 spss15_stappenplan_08
2/55
Inhoudsopgave 2
Inhoudsopgave
Inleiding.............................................................................................................. 3
Training 11. SPSS-scherm, vensters, balken en data invoeren en opslaan ............................. 52. Labels en Meetniveaus ..................................................................................... 113. Beschrijvende Statistiek (Descriptive Statistics).............................................. 154. Ontbrekende waarden (Missing Values) .......................................................... 185. Rekenen-1 (Compute Variable) ....................................................................... 206. Kruistabellen (Crosstabs).................................................................................. 227. Oefenen I ........................................................................................................ 25
Training 28. Grafische uitvoer, printen en SPSS uitvoer in WORD..................................... 279. Groeperen (Split File) ....................................................................................... 2910. Selecteren (Select Cases).................................................................................. 3111. Hercoderen (Recode) ........................................................................................ 3312. Editen van de Uitvoer, het Syntaxvenster, Files en SPSS............................... 3813. Oefenen II ......................................................................................................... 42
Facultatief14. Rekenen-2 (rekenen met If) .............................................................................. 4415. Bestanden samenvoegen (Merge Files)............................................................ 4816. Cases samenvoegen (Aggregate) ..................................................................... 53
-
7/25/2019 spss15_stappenplan_08
3/55
InleidingHet kunnen werken met statistische software is van onmisbaar belang bij het verrichten van
onderzoek. In dit blok (1.2b) wordt een introductie gegeven in het softwarepakket SPSS
(Statistical Package for the Social Sciences), n van de meest populaire statistische
programmas waarmee alle gangbare statistische procedures kunnen worden uitgevoerd.
Gedurende 3 trainingen van twee uur zullen de basisbeginselen van het pakket wordenovergedragen. Meer geavanceerdere toepassingen van SPSS zullen in navolgende blokken
aan de orde komen. Eventueel kan men voor meer gedetailleerde beschrijvingen van het
SPSS-softwarepakket en voor geavanceerdere toepassingen binnen SPSS een keuze maken
uit het ruime aanbod van Nederlandstalige en Engelstalige literatuur.
Aanwijzingen voor het gebruik van dit boekDit boek bevat 16 hoofdstukken (Stappen) die in principe zelfstandig kunnen worden
doorgewerkt. Er zijn 3 SPSS trainingen van elk 2 uur in het Computerlandschap. Onder
toezicht van een SPSS trainer zullen Stap 1 tot en met 7 tijdens de eerste training worden
gemaakt en Stap 8 tot en met 13 tijdens de tweede training. De laatste 3 Stappen worden niet
behandeld in de trainingen, maar kunnen wel handig zijn tijdens je onderzoek. Elke Stapbevat een inleidende tekst met opdrachten. In de teksten en opdrachten worden de
keuzemogelijkheden uit het menu van het SPSS-programma .
De eigenlijke opdrachten, die je in SPSS maakt zijnvetgedrukt.
Tijdens de 3deSPSS training is het de bedoeling dat je de Antropometrie gegevens van blok
1.2a m.b.v. SPSS gaat analyseren ten behoeve van je verslag. Ook dan is er een SPSS trainer
aanwezig om je te helpen.
De eerste 2 trainingen zijn verplicht, de derde niet.
Lees een opdracht eerst helemaal door en probeer te begrijpen wat er van je gevraagd wordt.
Ga vervolgens proberen om tot de oplossing te komen. Als je er na een aantal keren proberen
echt niet uitkomt, kun je de hulp van de SPSS-trainer inroepen. Doe dat niet te snel, want met
zelf proberen krijg je een computerprogramma het snelst onder de knie!
Het kan voorkomen dat teksten in vensters en menus enigszins afwijken van de teksten die
in deze handleiding zijn gebruikt. Bijvoorbeeld Engels i.p.v. Nederlands. Laat je daardoor
niet afschrikken. Meestal is duidelijk wat bedoeld wordt.
Bestanden
De SPSS bestanden die je nodig hebt zijn te vinden op ELEUM(1.2B HET GEZONDELICHAAM (2B-0203-0809) (FDGW_0809_2B_BLOK_0203)> COURSE MATERIAL> PRACTICA ENTRAININGEN> SPSS TRAINING )
Voor de eerste twee SPSS trainingen (Stap 1 t/m 13) heb je de volgende bestanden nodig:
hearing.sav, stap12.sav en geboorte.sav. Voor de extra Stappen 14, 15 en 16 heb je nodig:
stap14.sav, oef15.sav, medcomp.sav, toets3.sav en audiometry.sav.
Omdat het in het Computerlandschap niet mogelijk is om de SPSS bestanden direct vanaf
ELEUM in SPSS te openen moet je de bestanden eerst downloaden en opslaan in je eigen
werkgebied (I-drive (I:\), onderdeel van het netwerksysteem in het Computerlandschap).
Vanaf je I-drive kun je dan de bestanden binnen SPSS openen. Download nu eerst de
benodigde bestanden voor de SPSS trainingen naar je I-drive.
Inleiding 3
http://eleum.unimaas.nl/http://eleum.unimaas.nl/bin/common/course.pl?course_id=_122477_1http://eleum.unimaas.nl/bin/common/course.pl?course_id=_122477_1http://eleum.unimaas.nl/webapps/blackboard/content/listContent.jsp?course_id=_122477_1&content_id=_1041721_1&mode=resethttp://eleum.unimaas.nl/webapps/blackboard/content/listContent.jsp?course_id=_122477_1&content_id=_1198700_1&mode=resethttp://eleum.unimaas.nl/webapps/blackboard/content/listContent.jsp?course_id=_122477_1&content_id=_1198700_1&mode=resethttp://eleum.unimaas.nl/webapps/blackboard/content/listContent.jsp?course_id=_122477_1&content_id=_1198700_1&mode=resethttp://eleum.unimaas.nl/webapps/blackboard/content/listContent.jsp?course_id=_122477_1&content_id=_1198700_1&mode=resethttp://eleum.unimaas.nl/webapps/blackboard/content/listContent.jsp?course_id=_122477_1&content_id=_1041721_1&mode=resethttp://eleum.unimaas.nl/bin/common/course.pl?course_id=_122477_1http://eleum.unimaas.nl/bin/common/course.pl?course_id=_122477_1http://eleum.unimaas.nl/http://eleum.unimaas.nl/webapps/blackboard/content/listContent.jsp?course_id=_122477_1&content_id=_1198707_1 -
7/25/2019 spss15_stappenplan_08
4/55
Inleiding 4
Filmpjes
Naast dit boek zijn er een aantal instructiefilmpjes op ELEUM beschikbaar waarin de
verschillende SPSS procedures worden gedemonstreerd. Deze instructiefilmpjes worden
afgespeeld met de Windows Media Player. Dit programma is alleen lokaal op de computers
genstalleerd en niet in Citrix (=Student Desktop). Open ELEUM dus lokaal en speel dan de
filmpjes af door er op te klikken.
Zelf oefenen
Natuurlijk mag je vooraf zelfstandig oefenen met SPSS maar voor beide verplichte trainingen
is er een afsluitende opdracht die tijdensde training gemaakt dient te worden voordat
presentie wordt genoteerd.
Thuis werken
Als je ergens anders, bijvoorbeeld thuis, met SPSS wilt werken heb je verschillende
mogelijkheden:
Je kunt SPSS kopen via https://www.surfspot.nl/. Inloggen kan met je eigengebruikersnaam en wachtwoord.
Je kunt SPSS gebruiken via http://anywhere.ub.unimaas.nlIn plaats van SPSS op je eigen PC te installeren, kun je het dan starten op een
Universiteitsserver. Ook hier kun je weer inloggen met je eigen gebruikersnaam en
wachtwoord.
Verder is het handig om te weten dat er verschillende versies van SPSS zijn. In dit boek is
gewerkt met SPSS versie 15.
De benodigde practicumbestanden kun je vanaf je I-drive in het Computerlandschapdoormailen naar huis.
https://www.surfspot.nl/http://anywhere.ub.unimaas.nl/http://anywhere.ub.unimaas.nl/https://www.surfspot.nl/ -
7/25/2019 spss15_stappenplan_08
5/55
Training 1 1. SPSS-scherm, vensters, balken en data invoeren en opslaan 5
1. SPSS-scherm, vensters, balken en data invoeren en opslaanWanneer je SPSS aanroept verschijnt een openingsscherm. Dat bestaat uit een aantal balken,
knoppen en vensters. Welke balken enz. worden getoond is standaard geregeld, maar kan
door de gebruiker worden aangepast. We gaan uit van de standaardinstellingen in het
Computerlandschap.
1.1 SPSS opstarten
Het programma SPSS kan men in het computerlandschap alleen vinden binnen Citrix
(=Student Desktop).Hiertoe log je eerst in in n van de computers met je eigen username
en password. Vervolgens klik je opStudent Desktopen log in in Citrix, weer met
gebruikmaking van je eigen username en password. Nu heb je beneden aan het scherm twee
toolbars. De bovenste toolbar is die van Citrix!!
Gebruik de bovenste toolbar en open SPSS via en bekijk het openingsscherm.Soms krijg je bij het
opstarten een klein venster met de vraag What would you like to do? dat je de mogelijkheid
biedt om recentelijk gebruikte bestanden te openen. Druk op [Cancel] en bekijk het
datavenster dat de SPSS Data Editor wordt genoemd. Maak het scherm zo groot mogelijk
door rechtsboven op het middelste icoontje te klikken (maximaliseren).De bovenste balk
is detitelbalk: Untitled1[DataSet0]-SPSS Data Editor. Daaronder vind je de menubalkmet
het hoofdmenu: File, Edit, View, Data, Transform enz. Onder de menubalk vind je de
knoppenbalk(toolbar). Met een klik op zon knop kunnen handelingen direct worden
uitgevoerd. De betekenis van een knop wordt zichtbaar in destatusbalk(helemaal linksonder
in het scherm) als de knop met de muis wordt aangewezen. Probeer!In het midden van deze
statusbalk kun je bijvoorbeeld ook zien of het SPSS-programma gereed is of bezig is met de
uitvoering van een taak. Het is goed om die boodschappen bij de volgende opdrachten eens inde gaten te houden!
Een belangrijk kenmerk van SPSS is dat het werkt met verschillende vensters. De te
analyseren gegevens en hun eigenschappen worden ingevoerd en opgeslagen middels de z.g.
SPSS Data Editor. Deze bestaat uit 2 vensters: het datavenster (Data View) en het
variabelenvenster (Variable View):
De Data Viewbevat de gegevens (de data) die geanalyseerd moeten worden. Elke kolombetreft een ander kenmerk, ofwel variabele (vb. gewicht, lengte, haarkleur) . Elke rij betreft
een ander onderzoeksgeval, een case (vb. persoon, land, ziekenhuis, school).
-
7/25/2019 spss15_stappenplan_08
6/55
Training 1 1. SPSS-scherm, vensters, balken en data invoeren en opslaan 6
Datavenster (Data View):
In de Variable Viewworden de eigenschappen voor elke variabele weergegeven. Hierinworden o.a. het type variabele (numeriek, datum etc.), het aantal decimalen, de labels en de
ontbrekende waarden (missing values) gedefinieerd.
Variabelenvenster (Variable View):
Je kunt de Data Viewen de Variabele Viewafwisselend oproepen door linksonder op het
desbetreffende tabblad te klikken:
Probeer!
-
7/25/2019 spss15_stappenplan_08
7/55
Training 1 1. SPSS-scherm, vensters, balken en data invoeren en opslaan 7
De resultaten van de analyse verschijnen in een uitvoer- ofwel outputvenstervan de SPSS
Viewer. Het outputvenster kun je nu nog niet zien, omdat er nog geen analyses uitgevoerd
zijn. Pas vanaf het moment dat je een procedure aanroept wordt een outputvenstergeopend.
Gegevens invoerenStel je hebt van een drietal proefpersonen de volgende gegevens:
Volgnummer,
Leeftijd in jaren,
Geslacht (1= man; 2= vrouw)
Intelligentiequotint
Lichaamslengte in cm
Lichaamsgewicht in kg.
De gegevens zijn als volgt in een tabel samengevat:
Volgnummer Leeftijd Geslacht IQ Lengte Gewicht
101 23 1 114 176 82.4
102 47 1 98 182 95.3
103 38 2 121 169 72.9
SPSS spreekt in zon geval van 3 cases(=de rijen of regels) met 6 variabelen(=de
kolommen). We willen deze gegevens met SPSS analyseren en moeten ze daartoe eerst
invoeren in SPSS. Daarbij moet je onderscheid maken tussen de getallen en de namen van
de variabelen.
1.2 Getallen invoeren.
Start SPSS en zorg dat je je in de Data View bevindt. In de bovenste cel van de eerste
kolom moet de waarde 101 komen, daaronder 102 en tenslotte 103. Selecteer de eerste cel
middels de muis of pijltjestoetsen. Deze cel wordt vet omrand. Type 101 in en druk
vervolgens op Enter. Het getal 101.00 verschijnt in de eerste cel en de variabele krijgt de
door SPSS gereserveerde naam: var00001. Tegelijkertijd wordt de volgende cel automatisch
geselecteerd. Type 102 in en klik op Enter, en type 103 in de volgende cel. Het feit dat
SPSS niet 103, maar 103.00 weergeeft heeft te maken met de standaardinstelling van SPSS.
De standaardinstelling van SPSS is F8.2, d.w.z. gegevens mogen maximaal 8 karakters langzijn en worden weergegeven in 2 decimalen. Dit kan worden gewijzigd in de Variable View.
Hier komen wij later op terug. Ga nu met de pijltjestoetsen of de muis naar de bovenste
cel van de tweede kolom. Voer op dezelfde manier de waarden van de andere variabelen
(leeftijd, geslacht, iq, lengte en gewicht) in het datavenster in.
-
7/25/2019 spss15_stappenplan_08
8/55
Training 1 1. SPSS-scherm, vensters, balken en data invoeren en opslaan 8
1.3 Variabelennamen invoeren.
In principe maakt het voor SPSS niet uit welke namen je aan de variabelen geeft. Zoals we
hierboven al zagen bedenkt SPSS zelf variabele namen als je geen namen opgeeft:
var00001, var00002, var00003, enz. SPSS stelt echter een aantal voorwaarden aan de
naamgeving, bijvoorbeeld geen spaties en nog een aantal andere tekens worden niettoegestaan. Je merkt vanzelf wanneer een variabelennaam niet aan de voorwaarden voldoet
daar SPSS onjuiste namen niet accepteert en de volgende melding Variable name contains
an illegal character geeft in een venster.
We zullen nu de door SPSS gegeven variabelennamen veranderen in namen die iets meer
over de inhoud zeggen: we kiezen voor volgnummer, leeftijd, geslacht, iq, lengteengewicht.
Eerst volgnummeri.p.v. var00001
Dubbelklik op de cel waarin de naamvar00001staat. Het variabelenvenster (Variable
View) verschijnt. Het is ook mogelijk om in het variabelenvenster te komen door links onder
in de Data Editor op Variable View te klikken. De eerste regel is zwart gemarkeerd. Alleen
de cel var00001onder de kolom Name is wit gemarkeerd.Type hier volgnummerin enklik op Enter. In de tweede rij onder de kolom Name type je leeftijdin en klik daarna
op Enter. Voer op dezelfde wijze de resterende vier variabelennamen in.
De Variable View en Data View zullen er als volgt uitzien:
Data View:
Variable View:
-
7/25/2019 spss15_stappenplan_08
9/55
Training 1 1. SPSS-scherm, vensters, balken en data invoeren en opslaan 9
Laten we even vooruit lopen en kijken hoe je met SPSS gegevens uit het datavenster kan
kopiren naar het outputvenster. Dit is vooral handig als twee variabelen, bijvoorbeeld
gewichten lengte, met elkaar vergeleken moeten worden en in de datafile erg ver van elkaar
staan. Kies bovenaan in de menubalk .Er
verschijnt een dialoogvenster met duidelijk herkenbare kaders. In het linker kader staan allevariabelennamen van het datavenster en de rechter kaders zijn nog leeg. Je wilt per persoon
(volgnummer) de variabelen lengte engewichtmet elkaar vergelijken.Selecteer met de
pijltjestoetsen of de muis in het linker kader telkens 1 van de drie variabelen en breng
deze n voor n via de knop naar het bovenste rechter kader onder Variables. Men
kan de drie variabelen ook in n keer naar dat kader overbrengen door de Ctrl-toets
ingedrukt te houden ten tijde van het selecteren van de drie variabelen in het linker
kader en ze vervolgens tegelijk met de knop naar rechts onder Variableste
transporteren:
Druk nu op [OK]en SPSS gaat aan het werk (kijk naar de statusbalk!). Je ziet meteen dat
het datavenster verdwijnt en het outputvenster verschijnt. In het uitvoervenster komt een
overzicht te staan van alle drie de personen (cases) met betrekking tot de opgegeven
variabelen volgnummer, lengteengewicht:
Case Summariesa
101.00 176.00 82.40
102.00 182.00 95.30
103.00 169.00 72.90
3 3 3
1
2
3
NTotal
volgnummer lengte gewicht
Limited to first 100 cases.a.
1.4 OpslaanWe willen nu de data en de output gaan opslaan. Deze files kunnen bijvoorbeeld op de
I- drive bewaard worden.
Voor het opslaan van de data ga je eerst met de cursor ergens in de SPSS Data Editor
staan (Data View of Variable View)!! Kies vervolgens . Selecteer achter
Opslaan inde juiste schijf (drive, bijv. I-drive). Type achterBestandsnaam de gewenste
naam van het bestand, bijvoorbeeld. stap1. Achter Opslaan als typevult SPSS
automatisch het juiste file type (.sav) in.Tenslotte klik je op Opslaanom de opdracht te
laten uitvoeren. Het datavenster en variabelenvenster zijn nu beide opgeslagen in n file,
namelijk stap1.sav. Merk op dat de extensie van de SPSS datafile altijd (!) .SAV is.
-
7/25/2019 spss15_stappenplan_08
10/55
Training 1 1. SPSS-scherm, vensters, balken en data invoeren en opslaan 10
Voor het opslaan van de output ga je eerst met de cursor ergens in de output van de
SPSS Viewer staan en herhaal daarna bovenstaande procedure. De SPSS outputfile
wordt altijd opgeslagen met .SPO als extensie (dus hier als stap1.spo).
Dus onthoud goed: Datavenster = sav-file, Outputvenster = spo-file!
Sluit SPSS af () nadat je zowel de datafile als de outputfile bewaard hebt.
LET OP!!!!!
1. Wanneer je gegevens wilt opslaan moet je cursor altijd (!) in de Data Viewof VariableViewstaan, en als je uitvoer wilt opslaan moet de cursor in het betreffende Outputvenster
staan. Het opslaan gaat zeer zeker fout als je dit niet in acht neemt. SPSS kan namelijk geen
data inlezen met een .spo extensie en ook geen uitvoer met een .sav extensie!!!
2. In SPSS moet het datavenster en outputvenster altijd apart worden opgeslagen. Ze kunnenniet samen/tegelijkertijd worden opgeslagen!!
-
7/25/2019 spss15_stappenplan_08
11/55
Training 1 2. Labels en Meetniveaus 11
2. Labels en MeetniveausMeestal bestaan de gegevens die met SPSS geanalyseerd worden uit cijfers. Zo'n hele waslijst
met cijfers is niet echt duidelijk, zeker als er geen omschrijving bij de variabele of van de
waarden van die variabele staat. Om dit te verhelpen kunnen we labels toekennen aan de
variabelen en hun waarden. Het is belangrijk te weten dat deze labels alleen dienen terverduidelijking van de betekenis van de betreffende variabele zelf of van zijn waarden. De
labels veranderen nietsaan de waarden (de cijfers) zelf. Er kunnen twee soorten labels
toegekend worden:
Variable labelsvoor de variabelen zelf (meestal een uitgebreidere variabelennaam) en
Value labelsvoor de verschillende waarden die een variabele kan aannemen.
Zo zou de variabelegeslacht geen variable label hoeven te krijgen (de naam is al duidelijkgenoeg), maar wel value labels: de waarde 1 het value label man, en de waarde 2 het value
label vrouw.De variabele iqzou het variable label intelligentie-quotient volgens de methode van William
Stern kunnen krijgen. Value labels zijn voor iqniet van toepassing.
Variabelen kunnen worden ingedeeld in 3 soorten wat betreft hun meetniveau: variabelen
waarvan de uitkomsten in klassen zijn verdeeld zoals geslacht, land van herkomst, etniciteit
etc. noemen we categorische ofwel nominale variabelen. Aan de verschillende klassen
kunnen getallen worden toegekend. Deze getallen hebben echter geen betekenis in
rekenkundige zin: man=1 en vrouw=2 betekent niet dat vrouwen 2 keer een man zijn. Naast
nominale variabelen kennen we ook ordinale variabelen, zoals opleidingsniveau. Hierbij is
wel sprake van een rangorde (meer of minder opleiding, vb. VMBO=1, Havo=2, VWO=3).
Variabelen waarbij de categorien niet alleen kunnen worden geordend, maar waarbij ookgeldt dat de afstanden tussen twee opeenvolgende categorien steeds gelijk is noemen we
interval variabelen, bijvoorbeeld bloeddruk (mmHg) en temperatuur (oC). In dit geval is er
geen sprake van een vastliggend nulpunt. Het hoogste meetniveau hebben ratio variabelen.
Deze variabelen hebben naast de kenmerken van het interval meetniveau ook nog een
absoluut nulpunt. Voorbeelden zijn leeftijd (jaren) en lengte (cm). Voor de duidelijkheid van
je SPSS databestand is het handig om nominale en ordinale variabelen te voorzien van value
labels.
2.1 Meetniveau invoeren
Binnen SPSS kan van elke variabele het meetniveau worden opgegeven. Je kunt dit instellenin de Variable View onder de kolom Measure. SPSS kent 3 mogelijkheden: Scalevoor
interval en ratio schalen, Ordinalvoor ordinale schalen en Nominalvoor nominale schalen.
We zullen nu het meetniveau gaan opgeven van de variabelen in de datafile van Stap1. Open
SPSS endaarbinnende file stap1.sav ( ). Het datavenster van de
Stap 1 verschijnt. Open de Variable View en stel in de kolom Measure volgnummer en
geslachtin opNominal en de rest op Scale:
-
7/25/2019 spss15_stappenplan_08
12/55
Training 1 2. Labels en Meetniveaus 12
Opmerking:Jammer genoeg geeft SPSS geen foutmelding als je bij variabelen waarbij je
als meetniveau nominal hebt ingevoerd het gemiddelde uit laat rekenen!
2.2 Labels invoeren
Vervolgens gaan we geschikte labels toekennen aan de variabelen. Het toekennen van value
labels aan de variabelegeslachtgaat als volgt: Open de Variable View. De variabele
geslachtkent de waarden 1 en 2, respectievelijk man en vrouw. Klik in de kolom
Values op None (= er zijn (nog) geen Value Labels gedefinieerd) en klik vervolgens
op het kleine, grijze vakje met puntjes:
Het Value Labels venster verschijnt. Zet achter Valuede waarde 1 en achterLabelhet
woord 'man'. Klik vervolgens op [Add]. Vul vervolgens achter Value2 in en achter
Label het woord 'vrouw'. Druk daarna weer op [Add].
-
7/25/2019 spss15_stappenplan_08
13/55
Training 1 2. Labels en Meetniveaus 13
Klik op [OK] ende variabelegeslacht is gelabeld!
Vervolgens gaan we variable labels geven. Open de Variable View en vul in de kolom
Label het gewenste variable label in: leeftijd in jaren voor leeftijd, intelligentie
quotint volgens de methode van William Stern voor iq, lichaamslengte in cm voor lengte,
lichaamsgewicht in kg voorgewicht.
Als de meetniveaus en labels zijn toegekend kan dit o.a. gecontroleerd worden door in het
hoofdmenu te kiezen voor waarna onderstaand venster verschijnt.
Links staat een kolom met alle variabelen en rechts de informatie (inclusief de toegekende
labels) van een geselecteerde variabele (hiergeslacht):
2.3 Nadat je de variabelegeslacht van labels hebt voorzien is er in het datavenster
ogenschijnlijk nog niets veranderd, maar druk nu eens in de Data View op de derde
knop van rechts op de taakbalk(heeft de vorm van een kofferlabel of etiketje):
De cijfers veranderen nu in de toegekende value labels:
Door nog eens op die knop te drukken krijgt de variabele geslacht weer de getallen als
inhoud:
Let wel: het toekennen van labels aan de variabelen en aan de waarden van variabelen
benvloedt niet de data zelf, het is alleen ter verduidelijking van je data- en uitvoervenster!
-
7/25/2019 spss15_stappenplan_08
14/55
Training 1 2. Labels en Meetniveaus 14
2.4 Als menvariabele labels i.p.v. variabelennamen in de dialoogvensters gepresenteerd wilt zien
(dus intelligentie-quotient volgens de methode van William Stern i.p.v. iq), moet SPSS als
volgt worden ingesteld: Kies in het datavenster.Het Options venster
verschijnt. Dit bevat 10 tabbladen, waaronder het Generaltabblad:
KiesDisplay labelsonderVariable Lists (als dat nog niet is aangevinkt)en de labels i.p.v.de namen van de variabelen zullen in de dialoogvensters worden weergegeven. Dit kun
je nagaan door bijvoorbeeld het volgende dialoogvenster op te vragen: Kies
.Er verschijnt nu het volgende venster:
-
7/25/2019 spss15_stappenplan_08
15/55
Training 1 2. Labels en Meetniveaus 15
In het dialoogvenster zie je nu het label: leeftijd in jarenin plaats van alleen devariabelennaam leeftijd. Zo zie je bij de volgende variabelen ook de labels met daarachter
tussen haken de namen. Druk op [Cancel].
Het is ook mogelijk om de variable- en value labels in je uitvoer te verkrijgen. Daarvoor stel
je onder het tabblad Output Labelsals volgt in:
Alle geproduceerde uitvoer zal nu de variabelen presenteren met variable- en value labels.
-
7/25/2019 spss15_stappenplan_08
16/55
Training 1 3. Beschrijvende Statistiek (Descriptive Statistics) 16
3. Beschrijvende statistiek (Descriptive Statistics)Bij het beschrijven van variabelen met SPSS wordt veelal gebruik gemaakt van de procedures
Frequencies, Descriptives en Explore, welke kunnen worden aangevraagd met
. We zullen de verschillende procedures demonstreren a.d.h.v. het
bestand hearing.sav. Dit bestand bevat de gegevens van een gehooronderzoek bij 99proefpersonen.
De volgende variabelen zijn gedefinieerd:
id identification number
sex sex (1=male, 2=female)
hearing1 subjective opinion of own hearing ability (1=good, 2=moderate, 3=poor)
hearaid hearing aid (1=yes, has a hearing aid; 2=has no hearing aid)
agegrp1 age group (1=55-64 years, 2=65-74 years, 3=75+ years)
hearimp hearing impairment (1=hearing impaired, 0=not hearing impaired)
euroqol Euroqol quality of life measurement on a scale of 0 to 100
hearscor visual analogue scale (VAS) measurement of one's own hearing on a scale of 0 to
100
fi_b_ear fletcher index best ear on the basis of audiometry, the higher the more hearing
impairment, valid values ranging from 20 to 120
age age in years
Het type variabele (het meetniveau, zie Stap 2) bepaalt welke Descriptive Statistics -
procedure geschikt is. Indien we te maken hebben met een nominale of ordinale variabele diein categorien kan worden ingedeeld (categorische variabele) zoals bijvoorbeeld geslacht, is
het zinloos om het gemiddelde te berekenen. Een frequentietabel is een geschikte methode
om dergelijke variabelen te bestuderen. Het berekenen van kengetallen als het gemiddelde en
de mediaan is natuurlijk wel zeer geschikt voor interval en ratio variabelen (continu
variabelen).
Frequencies
Voor het maken van frequentietabellen gebruikt men de procedure Frequencies.
3.1 Open het bestand hearing.sav (Opmerking: het bestand stap1.sav kan daarna gesloten
worden, bepaal zelf of je dit bestand nog wil bewaren).We willen weten hoeveel mensen er in elke leeftijdscategorie (agegrp1) zitten en makendaartoe als volgt een frequentietabel van deze variabele:
Kies < Frequencies>. Klik links in het Frequencies
venster op de variabele agegrp1en plaats deze met een druk op de zwarte pijl naar
het rechter kader onder Variable(s):
-
7/25/2019 spss15_stappenplan_08
17/55
Training 1 3. Beschrijvende Statistiek (Descriptive Statistics) 17
Klik op [OK]. Er wordt automatisch overgeschakeld naar het outputvenster, waarin de
frequentietabel verschijnt (zie instructiefilmpje: frequencies.avi). Hoeveel mensen zitten er
in elke leeftijdscategorie?[zie * onderaan]Roep het bovenstaande dialoogvenster opnieuw op. Ook andere zaken kunnen in de
uitvoer worden opgevraagd door gebruik te maken van de drukknoppen [Statistics]
(statistische kengetallen), [Charts](staafdiagrammen, cirkeldiagrammen en histogrammen)
en [Format](wijzigt opmaak van frequentietabel). Wanneer er alleen maar interesse bestaatvoor deze uitvoer en de frequentietabel zelf niet nodig is, kan men de optie Display frequencytablesuitschakelen door hier met de muis op te klikken.
3.2 Maak middels de drukknop [Charts] onderaan het Frequencies venster een
staafdiagram (Bar charts) van de variabele agegrp1, zonder dat er in de uitvoer weer de
frequentietabel verschijnt.
Descriptives
Met deze procedure is het mogelijk statistische kengetallen (gemiddelde, standaarddeviatie,
variantie, minimum, maximum etc) te berekenen. Wat betreft de betekenis van deze
kengetallen wordt verwezen naar het theorieboek Methodologie en Statistiek deel 1
(Tj. Imbos, et al. Universitaire Pers Maastricht, Maastricht 2001)
3.3 Roep de procedure op via . Selecteer
vervolgens in het Descriptive venster de variabele ageen breng deze met de pijl naar
de rechterkant onder Variable(s).Standaard wordt het gemiddelde, de standaarddeviatie,
het minimum en het maximum berekend, maar men kan ook een aantal andere kengetallen
laten berekenen door onder de drukknop [Options] de gewenste statistische kengetallen teselecteren. Selecteer in het Options venster tevens Variance en klik op [OK] (zie
instructiefilmpje:descriptives.avi). Wat is het gemiddelde en de variantie van de variabele
age? [zie **]
*Er zitten resp. 25, 26 en 48 mensen in categorie 1, 2 en 3
**Gemiddelde 73.43, variantie 71.779
-
7/25/2019 spss15_stappenplan_08
18/55
Training 1 3. Beschrijvende Statistiek (Descriptive Statistics) 18
ExploreDe procedure Explore is een zeer geschikte methode om inzicht te verkrijgen in de verdeling
van een variabele en kent vele mogelijkheden. We bekijken de variabelefi_b_ear.
3.4 Kies < Explore>. Klik in het linker kader op devariabelefi_b_ear en plaats deze met een druk op de zwarte pijl naar het rechter
kader onderDependent List.Selecteer de variabele sex onder Factor listom de verdeling
vanfi_b_ear voor mannen en vrouwen apart te bestuderen:
Klik op [OK] en bekijk de uitvoer (zie instructiefilmpje: explore.avi). Het resultaat is dat de
variabelefi_b_earvoor mannen en vrouwen afzonderlijk geanalyseerd wordt. OnderDisplay
kun je kiezen welke uitvoer geproduceerd moet worden. Standaard bestaat de uitvoer uit een
aantal statistische kengetallen en tevens wordt er voor elke groep een takbladgrafiek en een
boxplot gemaakt. SPSS geeft dit aan metBoth. Wil men slechts een deel van deze uitvoer
kies dan voor Statistics dan welPlots.Verder kent de procedure Explore nog een aantaldrukknoppen: [Statistics] voor het aanvragen van extra statistische kengetallen
(betrouwbaarheidsintervallen, percentielen en outliers), [Plots] voor het opvragen van diverse
grafieken en [Options] die betrekking heeft op het wel of niet meenemen van cases met
ontbrekende waarden wanneer er meerdere variabelen in de Dependent List staan.
-
7/25/2019 spss15_stappenplan_08
19/55
Training 1 4. Ontbrekende waarden (Missing Values) 19
4. Ontbrekende waarden (Missing Values)Een onderzoeker verzamelde van zes patinten de 5 verschillende bloedwaarden (b1 t/m b5).
De resultaten zijn als volgt:
patnr b1 b2 b3 b4 b5
1 92.2 1.94 15.7 125 4.992 92.7 1.90 15.6 -1 4.79
3 95.0 2.05 13.7 76 4.57
4 90.8 1.83 15.1 24 5.46
5 92.2 1.88 15.1 57 4.36
6 92.7 1.89 15.1 -1 4.52
Bij de variabeleb4ontbrak de waarde van patint 2 en patint 6. Omdat -1 een waarde is die
niet voor kan komen als bloedwaarde voor deze variabele gebruikte de onderzoeker de
waarde -1 om aan te geven dat er iets fout is met die waarde (bijvoorbeeld niet gemeten of
een verkeerde meting). Als SPSS met deze gegevens aan de slag gaat en bijvoorbeeld hetgemiddelde van b4 moet berekenen, gaat dat als volgt:
(125 + (-1) + 76 + 24 + 57 + (-1))= 280/6= 46.667. Dat kan niet bedoeling zijn! Die -1
vertekent het gemiddelde. Om dit te voorkomen moet de waarde -1 voor de betreffende
variabele als ontbrekende waardeof missing valueworden gedefinieerd. Wordt het
gemiddelde dan berekend, dan neemt SPSS deze -1 niet mee in de berekening. Het
gemiddelde wordt dan (125+76+24+57)/4 = 70.5, en verschilt nogal met de oorspronkelijke
46.67, maar is wel de juiste weergave van de gegevens.
4.1 Kies om een lege Data Editor te verkrijgen en sluit daarna het nog
openstaande bestand hearing.sav af zonder te bewaren. Voer vervolgens van
bovenstaande data alleen kolom b4 in. Dit kun je in de eerste kolom van de Data Viewdoen. Ga naar de Variable View en noem de variabeleb4.Klik bij variabeleb4onder de
kolom Missing op None en klik op het kleine, grijze vakje met puntjes:
Het volgende venster verschijnt:
-
7/25/2019 spss15_stappenplan_08
20/55
Training 1 4. Ontbrekende waarden (Missing Values) 20
Je wilt af van No missing values en een discrete waarde (-1) als missing value definiren.
Selecteer de betreffende optie Discrete missing valuesen vul het eerste rechthoekje met
-1. Het zou kunnen zijn dat er voor deze variabele nog andere discrete waarden als
ontbrekend gedefinieerd moesten worden. Daarvoor kun je het tweede en derde rechthoekje
gebruiken (je kunt dus maar maximaal 3 discrete waarden als missing values aangeven). Dat
is hier niet het geval. Klik daarom op de [OK] knop.In de Variable View staat nu bij
variabele b4onderMissingeen -1.0, wat betekent dat -1 een ontbrekende waarde is voorvariabele b4. Daar zie je niets van in het datavenster, maar als je nu het gemiddelde berekent
van de betreffende variabele (via ) zul je
zien dat SPSS bij het berekenen rekening houdt met de twee cases met een -1 voor de
ontbrekende gegevens.Doen!
Als sprake is van een range(of interval) van waarden die als ontbrekende waarden
beschouwd moeten worden, kun je in het Missing Valuesvenster kiezen voor de optie
Range plus one optional discrete missing valueen in de twee rechthoekjes de laagste en de
hoogste waarde opgeven. In het onderste rechthoekje kun je tevens nog n discrete waarde
invullen.
Tot nu is gesproken over missing values die door de gebruiker werden gedefinieerd en
daarom User Missing Valuesheten. Een tweede soort missing values worden door SPSS zelf
gecreerd wanneer voor een case een cel niet wordt ingevuld, of wanneer het programma een
reken- of leesopdracht krijgt en in een bepaald geval niet weet wat het moet invullen. SPSS
vult dan automatisch een zgn.System Missing Valuein, wat eigenlijk neerkomt op een lege
cel. Bij de procedures ComputeVariableenRecodekomen we hier nog op terug.
-
7/25/2019 spss15_stappenplan_08
21/55
Training 1 5. Rekenen-I (Compute Variable) 21
5. Rekenen-1 (Compute Variable)SPSS biedt de mogelijkheid nieuwe variabelen te berekenen of te herberekenen.
5.1 Laat SPSS het bestand stap 12.sav lezen en sluit de overige databestanden. Kies
en ga na dat er is sprake is van zes variabelen (nr, gewicht,lengte, x, yenz) en dat er bij lengteenysprake is van ontbrekende waarden.
Stel je wilt voor de zes personen de Quetelet-index berekenen. (Quetelet-index=het gewicht
in kg gedeeld door het kwadraat van de lengte in meters).
5.2 Nadat je voor de opties en hebt gekozen verschijnt
het Compute Variable venster. Linksboven vul je de naam van de zogenaamde Target
Variablein. Dat is de naam van de variabele waarin het resultaat van de berekening wordt
opgeslagen. Type hier queteletin. OnderNumeric Expressionbevindt zich het het
formulevenster waarin het rekenvoorschrift ofwel de formule moet komen. Bestaande
variabelen die je nodig hebt voor de berekening kun je links in de variabelenlijst selecteren enm.b.v. de pijl in het rekenvoorschrift plaatsen. Selecteer links de variabelegewichten
breng die over naarhet formulevenster.Vervolgens wil je gaan delen. Het teken voor deze
operatie is /. Klik op dat teken in de rekenmachine. Daarna haal je de variabele lengte
naar het formulevenster.Kwadrateren is machtsverheffen (teken: **) tot de macht 2. In de
formule moet nu staan: gewicht/lengte**2. Omdat machtsverheffen vr delen wordt
uitgevoerd, hoef je hier niet met haakjes te werken. Haakjes vind je overigens ook op het
toetsenbord van de rekenmachine. In plaats van gebruik te maken van de linker
variabelenlijst en de toetsen van de rekenmachine, kun je ook de formule gewoon intypen in
het formulevenster.
Uiteindelijk ziet het Compute Variable venster dus als volgt uit:
-
7/25/2019 spss15_stappenplan_08
22/55
Training 1 5. Rekenen-I (Compute Variable) 22
Als de formule gereed is kun je met [OK] SPSS de opdracht geven om de berekening uit
te voeren (zie instructiefilmpje: compute.avi).De nieuwe variabele verschijnt in de meest
rechtse kolom van de Data View. Controleer dit.
Je ziet in het datavenster dat op de vierde regel geen waarde voor queteletis ingevuld, maardat er een . staat. Bij het berekenen van queteletvoor deze case kwam SPSS eenontbrekendewaarde -1 tegen voor de variabele lengte. Zoals we in Stap 4hebben gezien
behandelt SPSS in zon geval de -1 alsof het een System Missing Value is!
Tip:Als je een nieuwe variabele maakt met Compute Variable, is het handig om deze
variabele meteen van een label en het juiste formaat te voorzien. Klik daarvoor in het
Compute Variable scherm op drukknop [Type & Label]. In het nu volgend scherm kan het
gewenste label en de juiste formaat worden opgegeven. Daarbij is het ook mogelijk de
gebruikte rekenkundige expressie als label te kiezen.
Opmerking 1:Onderstaande tabel geeft de betekenis van de tekens (relationele operators) in het
rekenscherm:
= gelijk aan
~= niet gelijk aan
< kleiner dan
groter dan
>= groter dan of gelijk aan
+,-,*,/ resp. plus, min, maal, gedeeld door
** tot de macht
~ niet
( ) tussen haakjes
Voor het combineren van rekenkundige expressies kan gebruik worden gemaakt van:
& en (ook: AND)
Voorbeeld (hearing.sav bestand): geslacht =1 & hearaid = 1 (betreft mannen met
een hoorapparaat)
| of (ook: OR)
Voorbeeld (hearing.sav bestand): hearaid = 1 | hearing1 = 3 (betreft alle
respondenten met een gehoorapparaat en alle respondenten die zelf vinden dat zeslecht horen )
Opmerking 2:
SPSS voert berekeningen altijd case voor case uit, dus rij voor rij. Je kunt daardoor
bijvoorbeeld niet alle waarden van n variabele (per kolom) bij elkaar optellen.
-
7/25/2019 spss15_stappenplan_08
23/55
Training 1 6. Kruistabellen (Crosstabs)23
6. Kruistabellen (Crosstabs)Een handige manier om inzicht in categorische data (= nominale en ordinale variabelen) te
verkrijgen is middels een kruistabel, een soort multidimensionele frequentietabel. In een
kruistabel worden de waarden van de ene variabele (de kolommen) gekruist tegen de waarden
van de andere variabele (de rijen). Elke rij * kolom combinatie heet een cel. Alle cellentezamen vormen de kruistabel. In de cellen staan de waargenomen aantallen ofwel de
geobserveerde frequenties.
De procedure Crosstabszal aan de hand van een voorbeeld worden uitgelegd. We gaan uit
van het hearing.sav bestand (voor de beschrijving van dit bestand zie Stap3) en we willen
weten hoe de waarnemingen verdeeld zijn wat betreft het geslacht (sex) en de
hoorverslechtering (hearimp).
6.1 Open hearing.sav en sluit daarna stap12.sav zonder te bewaren. Voorzie sexen hearimp
van de juiste value labels (zie de beschrijving van het bestand in Stap 3) en definieer 999
als missende waarde voor hearimp.
Het venster Crosstabsmaak je actief via . In
het kader onderRow(s)geef je de variabele op die de rij moet gaan vormen, en onder
Column(s)de variabele die de kolom moet gaan vormen.
6.2 Start de procedure Crosstabs. Geef als rijvariabele sexop en als kolomvariabele
hearimp:
Druk op [OK].Het outputvenster verschijnt en in het eerste gedeelte van de uitvoer staat een
tabel met samenvattende gegevens (aantallen en ontbrekende waarden). Vervolgens staat er
een afdruk van de gewenste kruistabel(zie instructiefilmpje: crosstabs.avi). Ga na hoeveel
vrouwen een verslechterd gehoor hebben. En hoeveel mannen? [zie *]
*39 vrouwen en 34 mannen
-
7/25/2019 spss15_stappenplan_08
24/55
Training 1 6. Kruistabellen Crosstabs) 24
6.3 Middels de procedure Crosstabs worden standaard de geobserveerde frequenties in een
kruistabel weergegeven. Er kan ook een uitgebreidere kruistabel worden opgevraagd waarin
percentages vermeld worden. Herhaal de vorige opdracht maar activeer nu in het
Crosstabs venster de drukknop [Cells...]. Het volgende venster verschijnt:
Vink de hokjes onder CountsenPercentagesaan zoals hierboven is aangegeven en druk
op [Continue] en vervolgens op [OK].Je verkrijgt op deze manier een uitgebreidere
kruistabel waarin naast de geobserveerde frequenties ook de kolom,- rij,- en totale
percentages vermeld staan:
sex * hearimp Crosstabulation
14 34 48
29.2% 70.8% 100.0%
58.3% 46.6% 49.5%
14.4% 35.1% 49.5%
10 39 49
20.4% 79.6% 100.0%
41.7% 53.4% 50.5%
10.3% 40.2% 50.5%
24 73 97
24.7% 75.3% 100.0%
100.0% 100.0% 100.0%
24.7% 75.3% 100.0%
Count
% within sex
% within hearimp
% of Total
Count
% within sex
% within hearimp
% of Total
Count
% within sex
% within hearimp
% of Total
male
female
sex
Total
not hearing
impaired
hearing
impaired
hearimp
Total
Uit bovenstaande tabel kan men aflezen dat 29.2% van de mannen geen verslechterd gehoor
heeft (% within SEX, =14/48). Van de mensen die geen verslechterd gehoor hebben, is
bovendien 58.3% man (% within HEARIMP, =14/24). Ook kan men in de tabel zien dat
14.4% van alle proefpersonen mannen zijn met geen verslechterd gehoor (% of Total,
=14/97). Ga na hoeveel procent van de vrouwen een verslechterd gehoor heeft. [zie *]
Hoeveel procent van het totale aantal proefpersonen zijn vrouwen met een verslechterd
gehoor? [zie **]
*79.6%
**40.2%
-
7/25/2019 spss15_stappenplan_08
25/55
Training 1 6. Kruistabellen Crosstabs) 25
Het kan zijn dat je soms alleen genteresseerd bent in rijpercentages, vink dan alleen dat
hokje aan. De tabel is daardoor gemakkelijker te lezen.
Het is ook mogelijk een kruistabel te maken voor verschillende groepen, zoals bijvoorbeeld
een kruistabel vansextegen hearimp voor de drie leeftijdsgroepen (agegrp1) afzonderlijk.
6.4 Vraag een kruistabel op van sex(Row) tegenhearimp(Column) en geef daarbij onder
Layeragegrp1op.Het resultaat is dat voor elke waarde van de variabele agegrp1eenkruistabel vansextegen hearimpwordt gemaakt.
Vraag: Hoeveel procent van de mannen van 55-64 jaar (agegrp1=1) hebben een
verslechterd gehoor?[zie *]
*100%
-
7/25/2019 spss15_stappenplan_08
26/55
Training 1 7. Oefenen I 26
7. Oefenen IIn deze Stap zullen de hiervoor besproken procedures toegepast worden.
De uitwerkingen zijn na de laatste sessie van training 1 beschikbaar op ELEUM (file:
uitwerkingen_Stap7.pdf) zodat je je eigen uitvoer en de antwoorden kunt controleren.Voordat je begint is het handig om te controleren of SPSS als volgt is ingesteld: kies binnen
het SPSS datavenster of outputvenster klik op het tabblad Viewer
en zorg dat links onderaan Display commands in the log is aangevinkt:
In de outputfile komt nu naast de uitvoer ook de SPSS syntax te staan, d.w.z. de SPSS
commandotaal. Aan de hand van deze syntax kun je later bij elke opgave nagaan welke
SPSS procedures je hebt toegepast bij een bepaalde opgave, en kun je deze vergelijken met
de procedures en de syntax in de uitwerkingen op ELEUM.
Sla alle uitvoer op in n outputfile en schrijf de antwoorden op de vragen hieronder op.
Het kan zijn dat je SPSS trainer vraagt om je uitvoer en de antwoorden te laten zien
voordat je kunt aftekenen, bewaar ze dus beide in elk geval!!!
Open het bestand hearing.sav en sluit alle andere databestanden die eventueel nog open
zijn zonder te bewaren.
7.1 Zorg dat de variabelen sex, hearaid en agegrp1 van de juiste value labels zijn voorzien.
De hiervoor benodigde beschrijving van hearing.sav vind je in Stap 3!
7.2 Onderzoek de variabele agemiddels de procedure Explore voor mannen en
vrouwen afzonderlijk.
Wat is de gemiddelde leeftijd van de mannen? ..
Wat is de variantie van de leeftijd van de vrouwen? ..
-
7/25/2019 spss15_stappenplan_08
27/55
Training 1 7. Oefenen I 27
7.3 Definieer 998 als missende waarde voor de variabele hearaid.
7.4 Gebruik de procedure Frequencies om te onderzoeken hoeveel procent van de
proefpersonen een hoorapparaat heeft (wel hoorapparaat: hearaid =1, geenhoorapparaat: hearaid=2)
Wat is het verschil tussen de percentages in de kolom Percent en de kolom Valid Percent?
...
7.5.1 Maak een kruistabel van hearaiden agegrp1.Zorg dat er alleen aantallen in deze
kruistabel afgedrukt worden, dus geen percentages.Beantwoord onderstaande vragen:
a. Hoeveel personen in de oudste leeftijdsgroep hebben een hoorapparaat?
b. Hoeveel personen zitten er in de oudste leeftijdsgroep?
c. Bereken nu hoeveel procent van de oudste leeftijdsgroep een hoorapparaat heeft? ...........
d. Bereken ook hoeveel procent van de personen zonder hoorapparaat tot de jongste
leeftijdsgroep behoort?e. Probeer uit de tabel af te leiden of er een relatie is tussen het hebben van een hoorapparaat en
de leeftijdscategorie
7.5.2 Vraag dezelfde kruistabel aan maar nu met alle rij, kolom en totaal percentages.
Ga na waar de antwoorden van c. en d. terug te vinden zijn in de tabel.
7.6 Maak middels de procedure Frequencies eerst een bar chart en daarna een histogram
van de variabelen ageen agegrp1 zonder dat er in de uitvoer frequentietabellen
verschijnen.
Beslis voor beide variabelen apart welke grafiek de data het beste weergeeft, en
waarom?
Hier komen we in de volgende Stap nog op terug.
-
7/25/2019 spss15_stappenplan_08
28/55
Training 2 8. Grafische uitvoer, printen en SPSS uitvoer in WORD 28
8. Grafische uitvoer, printen en SPSS uitvoer in WORDTot nu toe werd de uitvoer zichtbaar gemaakt in het outputvenster en kon de inhoud van dit
venster, eventueel na correctie, worden opgeslagen in een file. De uitvoer bestond uit tekst,
soms uit tabellen en tekst. Een aantal procedures produceert behalve tekst ook plaatjes. Bij
weer andere procedures bestaat de uitvoer uit louter plaatjes.
8.1 Grafische uitvoer: Histogram
Open hearing.sav. Kies voor . Selecteer in het
venster dat wordt aangeboden ageals variabele en druk op [OK]. SPSS maakt een
histogram van de gekozen variabele. Controleer of dat inderdaad is gebeurd door het
outputvenster te bekijken.
Door in het uitvoervenster dubbel te klikken op het histogram verschijnt de zogenaamde
SPSS Chart Editor. In dit venster is het mogelijk de grafische uitvoer van het betreffende
histogram naar wens te veranderen (te editen). Dit venster heeft namelijk zijn eigen menu- en
knoppenbalk. Als voorbeeld zullen we de kleur van de staven van het histogram veranderen.Dubbelklik in de uitvoer op het histogram zodat de Chart Editor verschijnt. Dubbelklik
vervolgens op een staaf om het gehele histogram te selecteren. Het Properties venster
verschijnt. In dit venster kan onder het tabblad Fill & Borderde gewenste kleur
geselecteerd worden. Dit kan ook door gebruik te maken van de Fill Color knop van de
knoppenbalk welke hieronder is aangegeven met de pijl:
Kies een kleur en druk op [Apply] in het Properties venster (niet nodig wanneer men
gebruik maakt van de Fill Color knop). De kleur van het histogram verandert meteen.
-
7/25/2019 spss15_stappenplan_08
29/55
Training 2 8. Grafische uitvoer, printen en SPSS uitvoer in WORD 29
8.2 Grafische uitvoer: Bar Chart (Staafgrafiek)
Maak nu een Bar Chart (staafgrafiek) van de variabele age. Kies , en vervolgens Simple, druk op de knop [Define]. Vul in bij Bars
Represent: N of cases. Definieer ageals Category Axis en klik op [OK]. Vergelijk deze
grafiek met het histogram.Naar welke gaat je voorkeur uit, motiveer. [zie *]Voor welk soort variabele geeft een
Bar Chart een goede weergave van de data?[zie **]
De inhoud van het uitvoervenster kan rechtstreeks naar een printer worden gestuurd of
worden opgeslagen in een Spo-file (zie Stap1).
8.3 Printen:
Om de computer een printopdracht te geven klik je op . Klik in het
Afdrukken venster op [Eigenschappen] om in te stellen dat de printer 2 paginas per A4
print!!! Dat deze mogelijkheid bestaat is handig om te weten aangezien, je tijdens je studie
regelmatig opdrachten met SPSS voor statistiek moet maken. Klik op [OK] en vervolgensop [Annuleren] (het echte uitprinten komt nog wel!).
8.4 SPSS uitvoer in Word.:
Uitvoer in het outputvenster kan op een gemakkelijke manier gekopieerd worden naar een
(bestaand) WORD document. Dit is erg handig voor bijvoorbeeld het maken van een verslag.
In deze Stap gaan we eerst een grafiek en een tabel maken m.b.v SPSS, en vervolgens zullen
we enkele onderdelen van deze uitvoer naar een WORD bestand kopieren.
Om te kijken of er een verband bestaat tussen leeftijd en de fletcher index maken we een
puntenwolk (een scatter).Definieer binnen hearing.sav eerst de waarde 999 als missing
value voorfi_b_ear. Kies , daarna Simple
Scatter en klik op [Define]. Zet ageop de x-as enfi_b_earop de y-as. Klikop [OK].
Hoe zou je het verband tussen beide variabelen kunnen omschrijven?[zie ***] Maak
ook een frequentietabel van de variabele sex.
Open een nieuw WORD document. Ga vervolgens weer terug naar het SPSS
outputvenster. Dubbelklik in de uitvoer op de puntenwolk zodat de Chart Editor
verschijnt. Kies . Ga naar het WORD document en kies
.Nu verschijnt de puntenwolk als plaatje in je WORD document.
Selecteer nu de frequentietabel in het outputvenster. Kies . Ganaar het WORD document en kies .Nu verschijnt de frequentietabel ook
in het WORD document.
* Voorkeur voor histogram omdat age een continu variabele is
** Bar Chart is geschikt voor categorische variabelen*** Lineair verband
-
7/25/2019 spss15_stappenplan_08
30/55
Training 2 9. Groeperen (Split File) 30
9. Groeperen (Split File)
Vaak is het wenselijk om een bepaalde procedure bijv. Descriptives, niet voor alle cases
samen te laten uitvoeren, maar voor aparte groepen van cases. Dit kan met de procedure Split
File. Deze procedure zullen we demonstreren aan de hand van het bestand geboorte.sav. Ditbestand bevat 40 cases met gegevens omtrent het geboortegewicht (geb_gew) en de
zwangerschapsduur (zw_duur). Een derde variabele (zk_huis) bevat een code voor hetdeelnemende ziekenhuis (zk_huis=1, 2, of 3)
9.1 Open geboorte.sav en sluit hearing.sav (eventueel bewaren, is niet noodzakelijk voor
verdere stappen). Dit bestand bevat geboortegegevens (geboortegewicht,
zwangerschapsduur en deelnemend ziekenhuis) van 40 kinderen.Via en
kom je in het Split File venster.Selecteer de optie []voor Compare groups. Zet de
variabelezk_huisin het venster Groups Based on. De optie [] voor Sort the file by
grouping variablesis standaard geactiveerd, want de cases moeten gesorteerd zijn op basis
van de groepsvariabele(n) om Split File goed te laten verlopen:
Na [OK]zie je in het datavenster dat de sortering is uitgevoerd en tevens staat rechtsonder
vermeld dat Split File actief is (Split File On)
-
7/25/2019 spss15_stappenplan_08
31/55
Training 2 9. Groeperen (Split File) 31
Voer nu op de gebruikelijke wijze de procedure Descriptives uit voor de variabelen
geb_gewenzw_duur.( etc). De volgende
uitvoer verschijnt(zie instructiefilmpje: splitfile.avi):
Descriptive Statistics
15 ,70 1,40 1,0733 ,20166
15 26,00 35,00 30,0667 2,63131
15
14 ,80 1,90 1,4429 ,33904
14 27,00 36,00 31,3571 2,95107
14
11 1,00 1,70 1,3182 ,23587
11 28,00 36,00 32,0909 2,77325
11
geb_gew
zw_duur
Valid N (listwise)
geb_gew
zw_duur
Valid N (listwise)
geb_gew
zw_duur
Valid N (listwise)
zk_huis1,00
2,00
3,00
N Minimum Maximum Mean Std. Deviation
Uit de uitvoer is op te maken dat SPSS de drie ziekenhuizen apart heeft behandeld! Dit is het
resultaat van Split File byzk_huis.
Je hebt hier gebruik gemaakt van n groepsvariabele (zk_huis), maar dat mogen er ook meerzijn. Dan wordt er voor elke combinatie van deze variabelen een aparte uitvoer gegeven.
Let op:Het is alleen zinvol om te splitsen op een variabele die groepen ofwel categorien
kent (categorische variabele)
9.2 Open het bestand hearing.sav en sluit geboorte.sav af zonder te bewaren. Bereken de
gemiddelde leeftijd voor mannen en vrouwen apart door gebruik te maken van de
procedure Split File. [zie*]
* mannen 73.51; vrouwen 73.36
-
7/25/2019 spss15_stappenplan_08
32/55
Training 2 10. Selecteren (Select Cases) 32
10. Selecteren (Select Cases)In Stap 9(Split File) hebben we gezien dat het mogelijk is SPSS procedures te laten
uitvoeren voor aparte groepen van cases. De uitvoer wordt dan voor elke groep apart
weergegeven. Het is ook mogelijk om alleen die cases (rijen) te selecteren die aan bepaalde
condities voldoen. Zo kunnen bijvoorbeeld die cases worden geselecteerd waarvoor devariabelegeslachtgelijk is aan de waarde 1, en tevens de variabele leeftijdgroter is dan 45.
Dat selecteren kan van tijdelijke aard zijn (tot het moment dat de selectie wordt opgeheven)
of van blijvende aard. In het eerste geval worden de NIET-geselecteerde cases in de Data
View gemarkeerd (=Filtered) middels een schuine streep door het rijnummer (meest linker
kolom). In het andere geval worden de cases uit het actuele bestand definitief verwijderd
(=Deleted)!! Alleen door de gegevens opnieuw in te lezen kunnen deze cases nog
geanalyseerd worden. Voorzichtigheid is dus geboden!!
10.1 Open de file geboorte.sav (mocht je deze nog hebben openstaan na Stap 9 zet dan eerst
Split File uit!) en sluit hearing.sav af.Zoals we al zagen Stap 9 bevat dit bestand een aantal
geboortegegevens van 40 kinderen. De derde variabele (zk_huis) bevat een code voor het
deelnemende ziekenhuis (zk_huis = 1, 2 of 3). Voor de te verrichten analyses zijn alleen de
gegevens vanzk_huis=1 nodig. We willen dan ook alleen die cases selecteren die voldoen
aanzk_huis=1. Via Menu-keuze kom je in het Select Cases
venster. Kies binnen dit venster onderSelect voorIf condition is satisfied en onder
OutputvoorDelete unselected cases (we zijn dus onvoorzichtig!):
Klik op [If...]en je komt in een venster dat gelegenheid biedt de conditie (zk_huis = 1) op te
geven:
-
7/25/2019 spss15_stappenplan_08
33/55
Training 2 10. Selecteren (Select Cases) 33
Als je vervolgens [Continue] en [OK] gebruikt wordt de selectie uitgevoerd . De Data
View blijkt inderdaad nog maar 15 cases te bevatten. Natuurlijk hebben die allemaal de
waarde '1' voor de variabele zk_huis.
10.2 Open een nieuw datavenster middels en sluit het bestand
geboorte.sav zonder (!) op te slaan. Laat SPSS geboorte.sav opnieuw lezen. Zoek het
selectievenster weer op, maar kies nu voor Filter out unselected cases. Definieer onder
[If] dezelfde conditie en voer de selectie uit (zie instructiefilmpje: selectcases.avi).Je ziet
nu in het datavenster dat alle waarden er nog in staan. Alleen zijn de niet-geselecteerde cases
in de nummerkolom (links) gemarkeerd. Er is bovendien een nieuwe variabele gecreerd:
filter_$. Die bevat een '0' voor de niet-geselecteerde en een '1' voor de geselecteerde cases.
Rechtsonder in het datavenster staat vermeld: Filter on. Wanneer je nu procedures uitvoert
(Case Summaries, Frequencies, etc) hebben die slechts betrekking op de geselecteerde (= niet
gemarkeerde) cases.
Let op!
De selectie blijft bestaan totdat je de selectie opheft . De selectie wordt opgeheven doorin het Select Cases venster onder Select de knopAll Caseste activeren. Als je dat doet zul
je zien dat de variabelefilter_$blijft bestaan. Die kun je dus later nog eens gebruiken. Zou
je dan niet meer weten op welke selectie die variabele betrekking heeft dan kun je
dubbelklikken op de naam van die variabele (filter_$). Dit geldt overigens alleen voor de
laatst uitgevoerde selectie!
Stel dat je de cases wilt selecteren die betrekking hebben opzk_huis=1 en ook nog voldoenaan de voorwaardezw_duur< 30. Je moet in dat geval de dubbele conditie in n keer
opgeven: zk_huis = 1 AND zw_duur < 30. In plaats van AND kun je ook het teken &gebruiken. Het is dus niet mogelijk die selectie in twee stappen uit te voeren!
Alle procedures onder Transform worden ook voor de niet geselecteerde casesverricht!!!
-
7/25/2019 spss15_stappenplan_08
34/55
Training 2 11. Hercoderen (Recode) 34
11. Hercoderen (Recode)Soms is het gewenst de waarden van een categorische variabele te hercoderen. Als
bijvoorbeeldgeslacht gecodeerd is als 0 (man) en 1 (vrouw) en je wilt dit veranderen in 3
(man) en 4 (vrouw) is Hercoderen (Recode) een geschikte methode. Dit moet men niet
verwarren met het toekennen van de value labels in de Variable View (Stap 2)! Wanneer devariabele is gehercodeerd van 0-1 naar 3-4, zal men in de Variable View de value labels
opnieuw moeten definiren (dus: 3=man en 4=vrouw).
Een ander geval waarin de procedure Recode gebruikt moet worden is wanneer men de
waarden van een interval of continue variabele in klassen wil verdelen. Denk daarbij aan de
variabele leeftijd(in jaren) die men wil hercoderen in de variabele lftcat, waarin de leeftijd in
een beperkt aantal categorien (bijv. jong, middel, oud) is verdeeld. Ook dit kan met de
functie Hercoderen.
Bij hercoderen heb je keuze uit twee mogelijkheden:
1. Into Same Variables, waarbij de oorspronkelijke waarden van de te hercoderen variabeleworden overschreven met (ofwel vervangen door) de nieuwe waarden. Het gevolg is dat
je niet meer kunt nagaan wat de oorspronkelijke waarden waren, de originele variabele
wordt namelijk overschreven. Het is daarom aan te raden de andere mogelijkheid te
gebruiken
2. Into Different Variables, waarbij een nieuwe variabele wordt gecreerd en de oudevariabele met de oorspronkelijke waarden blijft bestaan. Dit is de meest veilige methode!
11.1 Open het hearing.sav bestand en sluit geboorte.sav.
We gaan de variabele hearscor indelen in klassen. Defineer eerst de waarde 999 van
hearscor als missende waarde.
Kies en .In het Recode into Different
Variables venster staat links een lijst van de bestaande variabelen. Je kunt daar een of
meerdere variabele(n) selecteren (= input variabele) door er op te klikken en middels een
klik op de zwarte pijl naar het middelste kader te transporteren (Numeric Variable-
>Output Variable). Selecteer de variabele hearscor en breng deze naar het middelste
kader.
Het is de bedoeling dat in dat kader achter ? op de plaats van het ?-teken de naam van de
nieuwe variabele (= output variabele) moet komen. Die naam kun je rechtsboven onder
Output Variableopgeven, waarna je op [Change] drukt en het ?-teken door de nieuwe naamwordt vervangen. Het is ook mogelijk om een label aan je nieuwe variabele toe te voegen
onderLabel, die ook rechts onder Output Variablestaat.Noem de nieuwe variabele scocat
en druk op [Change]:
-
7/25/2019 spss15_stappenplan_08
35/55
Training 2 11. Hercoderen (Recode) 35
Druk vervolgens op [Old and New Values...]. Er verschijnt een venster waar je de oude
en de nieuwe waarden kunt opgeven.We willen de variabele hearscorhercoderen in de nieuwe variabelescocatvolgens hetvolgende hercoderingsvoorschrift:
Hearscor25 scocat = 1
25 (groter dan) 25.
Klik links onder Old Value op de 5-de optie (= Range, LOWEST through value...) en vul25 in het rechthoekje eronder. Rechts onderNew Valuetyp je bij Value 1 in en klik op
[Add]. Waarden van hearscorvanaf het minimum t/m 25 worden gehercodeerd naar 1.
Klik nu links op de 4-de optie (= Range:) en vul 25 en 50 in. BijNew Valuevul je bijValue 2 in en klik weer [Add]. Alle waarden van hearscorgroter dan 25 en kleiner of gelijk
aan 50 worden gehercodeerd naar 2.
Completeer het hercoderings-voorschrift voor de andere waarden van de input
variabele zodat het venster er uiteindelijk als volgt uit ziet:
-
7/25/2019 spss15_stappenplan_08
36/55
Training 2 11. Hercoderen (Recode) 36
Druk op [Continue] en in het nieuwe venster op [OK] waarna de hercodering wordt
uitgevoerd (zie instructiefilmpje: recode.avi). In het datavenster (meest rechtse kolom) staat
een nieuwe variabele (scocat), met als uitkomstmogelijkheid de waarden 1, 2, 3 en 4.
Geef in de Variable View aan dat scocateen ordinale variabele is (onder Measure, zie
Stap 2).
Controleer of de hercodering goed is uitgevoerd via . Plaats de oorspronkelijke variabele (hearscor) onder de
Dependent List en de nieuwe variabele (scocat) onder Factor List. Kies onderaan het
venster onderDisplayvoor Statistics (plots zijn niet nodig):
Druk op [OK]. In het uitvoerscherm verschijnt nu een beschrijving van de variabele
hearscor voor elke waarde vanscocat:
-
7/25/2019 spss15_stappenplan_08
37/55
Training 2 11. Hercoderen (Recode) 37
Descriptives
17.50 2.500
-14.27
49.27
.
17.50
12.500
3.536
15
205
.
. .
. .
45.80 1.248
43.22
48.38
46.44
50.0038.917
6.238
30
5020
10
-1.447 .464
1.355 .902
66.41 .846
64.71
68.12
66.53
70.00
32.959
5.741
55
7520
10
-.220 .350
-1.071 .688
83.67 1.463
80.64
86.69
83.06
80.00
51.362
7.167
78
10022
8
1.651 .472
1.326 .918
Mean
Lower Bound
Upper Bound
95% Confidence
Interval for Mean
5% Trimmed Mean
Median
Variance
Std. Deviation
Minimum
MaximumRange
Interquartile Range
Skewness
Kurtosis
Mean
Lower Bound
Upper Bound
95% Confidence
Interval for Mean
5% Trimmed Mean
MedianVariance
Std. Deviation
Minimum
MaximumRange
Interquartile Range
Skewness
Kurtosis
Mean
Lower Bound
Upper Bound
95% Confidence
Interval for Mean
5% Trimmed Mean
Median
Variance
Std. Deviation
Minimum
MaximumRange
Interquartile Range
Skewness
Kurtosis
Mean
Lower Bound
Upper Bound
95% Confidence
Interval for Mean
5% Trimmed Mean
Median
Variance
Std. Deviation
MinimumMaximumRange
Interquartile Range
Skewness
Kurtosis
scocat
1.00
2.00
3.00
4.00
hearscor
Statistic Std. Error
Aan de hand van de minimum en maximum waarden vanhearscorbinnen descocat groepenkan men controleren of de hercodering is goed gegaan (vergelijk deze met het hercoderings-
voorschrift). Zo zie je dat de minimum(= 15) en maximum (= 20) waarden van hearscor
binnen de categoriescocat=1 voldoen aan de voorwaarde van het hercoderingsvoorschrift:
Hearscor25 -> scocat = 1
-
7/25/2019 spss15_stappenplan_08
38/55
Training 2 11. Hercoderen (Recode) 38
Opmerkingen:Als je een nieuwe variabele maakt via de procedure Recode into Different Variables zullen
de niet in het hercoderingsvoorschrift voorkomende waarden van de originele (input)
variabele automatisch System Missing Values worden in de nieuwe variabele. Je kunt
dat ondervangen door de onderste button (All other values) te gebruiken in hetRecode Variables venster en alle niet genoemde waarden samen te vatten in n
nieuwe waarde.
Wil men bij de procedure Recode dat alle System- en User Missing Values van de originelevariabele, ook als missing values worden gezien in de nieuwe variabele dan is het
noodzakelijkdat in het Recode venster (Old and New Values) deze System- en User
Missing Values worden gehercodeerd naar System Missing Values.
Kies: System or user-missing (Old Value) System-missing (New Value):
-
7/25/2019 spss15_stappenplan_08
39/55
Training 2 12. Editen van de Uitvoer, het Syntaxvenster, Files en SPSS 39
12. Editen van de Uitvoer, het Syntaxvenster, Files en SPSSIn Stap 8is heel kort al gesproken over het bewerken van de uitvoer. In deze Stap gaan we
hier wat dieper op in. Het outputvenster bestaat uit twee delen, links een gedeelte waarin de
opbouw van de uitvoer schematisch is weergegeven en rechts de uitvoer zelf.
Editen van de uitvoer:
12.1 Voer een aantal procedures uit in het hearing.sav bestand, maak bijvoorbeeld een
frequentietabel vanfi_b_ear. Zorg dat het uitvoervenster schermvullend (groot) is.
Er zijn verschillende mogelijkheden om de uitvoer te editen:
In het linkergedeelte van het outputvenster staan de verschillende onderdelen van de uitvoer
schematisch onder elkaar. Het gaat voor deze training te ver om alle onderdelen uit te leggen.
Belangrijk om te onthouden is dat je een deel van een analyse kunt verwijderen door het
desbetreffende onderdeel aan te klikken en op (van het toetsenbord) te drukken.
In het rechtergedeelte staat de uitvoer zelf. Middels een schuifbalk helemaal aan de
rechterkant kun je snel door deze uitvoer schuiven (scrollen). Een onderdeel kan worden
verwijderd door erop te klikken en op te drukken. Het is ook mogelijk een stuktekst of een tabel in de uitvoer te wijzigen. Om bijvoorbeeld de titel Frequencies (boven aan
de frequentietabel) te veranderen in Frequentietabel van Fi-b-ear klikt men eerst twee keer
dubbel op de betreffende tekst zelf. Er verschijnt een apart venster, waarbinnen men de tekst
eenvoudig kan aanpassen.
Verander de titel van de frequentietabel van Frequencies naar Frequentietabel van
fi_b_ear en probeer tevens deze nieuwe titel cursief te maken door gebruik te maken
van de formatting toolbar bovenaan het scherm (wanneer deze toolbar niet automatisch
verschijnt klik je bovenaan op ):
Originele titel
-
7/25/2019 spss15_stappenplan_08
40/55
Training 2 12. Editen van de Uitvoer, het Syntaxvenster, Files en SPSS 40
Gewijzigde titel
Het is ook mogelijk een nieuw stuk tekst tussen te voegen in de uitvoer. Dit kan middels
, of met onderstaand icoontje van de knoppenbalk bovenaan het
uitvoervenster:
Er verschijnt nu een leeg tekstvenster waarbinnen je de gewenste tekst kunt typen:
-
7/25/2019 spss15_stappenplan_08
41/55
Training 2 12. Editen van de Uitvoer, het Syntaxvenster, Files en SPSS 41
Opmerking:Het nieuwe tekstvenster verschijnt altijd direct onderhet onderdeel dat op datmoment actief is, d.w.z. lichtgrijs gekleurd is met een rode pijl ervoor in het linkerdeel van
het outputvenster. Je kunt zon onderdeel actief maken door er 1 keer op te klikken.
Probeer een nieuw stukje tekst toe te voegen onder de frequentietabel.
In Stap7zagen we al dat het mogelijk is om de SPSS commandos (syntax) die uitgevoerd
worden op te nemen in de uitvoer (via en vink dan Displaycommands in the log aan). Dit is heel handig wanneer men in afgedrukte SPSS uitvoer wil
nagaan welke procedures zijn uitgevoerd. Bekijk of deze optie al is aangevinkt!
Het Syntaxvenster:
Wij hebben tot nu toe gewerkt met de Data View, de Variable Viewen de Output. Er is ook
een venster waarin SPSS instructies direct ingetikt kunnen worden, het Syntaxvenster (SPSS
Syntax Editor). Het is je misschien al een keer opgevallen dat er in een menu-optie van een
bepaalde procedure van SPSS ook een [Paste]-knop onder de [OK]-knop staat. Als je inplaats van de [OK]-knop op de [Paste]-knop zou drukken, kom je automatische in het
Syntaxvenster terecht, waarin de instructie van SPSS in geschreven vorm staat. Vanuit het
Syntaxvenster kun je deze instructies laten uitvoeren door in de toolbar op het pijltje te
drukken.Een syntaxvenster is heel handig als je bijvoorbeeld een handeling vaak wil laten
uitvoeren maar telkens voor een andere conditie. Je kunt namelijk in het syntaxvenster
stukjes tekst markeren, kopiren en plakken en kleine veranderingen, al naar gelieve,
aanbrengen.
12.2 We werken met het hearing.sav bestand. Stel je wilt een aantal kruistabellen maken: sexvs hearing1, sex vs hearaid, agegrp1 vs hearaid, hearing1 vs hearaid. Via
krijg je automatische alle mogelijke
combinaties van tabellen van de variabelen die onder Rows(s) staan met de variabelen die
onder Column(s) worden vermeld. Dit betekent dat je een aantal tabellen zou krijgen die je
niet wilt. Of je zou een paar keer de crosstabs procedure moeten uitvoeren met iedere keer
andere combinaties van variabelen. Dit kun je ook anders aanpakken door gewoon de eerste
kruistabel aan te vragen via . Voer dit uit en
geef de variabele sexals rijvariabele op en de variabele hearaidals kolomvariabele.
Klik nu niet op [OK], maar op [Paste].Je komt dan automatische in een venster met als
titel Syntax1-SPSS Syntax Editor:
-
7/25/2019 spss15_stappenplan_08
42/55
Training 2 12. Editen van de Uitvoer, het Syntaxvenster, Files en SPSS 42
De tekst die erin staat beschrijft in syntax taal het commando Crosstabs. Elk commando
eindigt met een punt. Je kunt dit commando selecteren en middels Copy en Paste een aantal
keren plakken. Kopieer de tekst twee keer en pas vervolgens per kopie de
variabelenamen aan zodat er uiteindelijk drie kruistabellen zullen worden gemaakt: sex
tegen hearaid, sex tegenagegrp1 enhearaid tegenagegrp1. Selecteer de gehele tekstmiddels Ctrl-A en klik vervolgens op het driehoekige pijltje () in de toolbar om de
opdracht uit te laten voeren.Dit kan ook via de menukeuze . Alle gewenste
kruistabellen worden nu achter elkaar aangemaakt in het uitvoervenster.
Als je commentaar wilt toevoegen binnen een syntaxfile dan kan dit voorafgaande aan een
commando, tussen twee commandos of na het laatste commando en moet je de regel
beginnen met een * en afsluiten met een punt. Dan weet SPSS dat zon regel alleen
commentaar bevat en niet als een commando beschouwd dient te worden.
Wanneer je bezig bent met een onderzoeksopdracht is het handig om de syntax file op te
slaan voor toekomstig gebruik (File> Save As). Deze file krijgt automatisch .sps als extensie.
Files en SPSS:
In de loop van de practica zijn we een aantal bestandstypen tegengekomen. Om een overzicht
te geven staan ze in onderstaande tabel.
Bestandstype Extensie
Datafile van SPSS *.sav
Outputfile *.spo
Syntaxfile *.sps
-
7/25/2019 spss15_stappenplan_08
43/55
Training 2 13. Oefenen II 43
13. Oefenen II
Net zoals in Stap7 gaan we ook nu weer een aantal SPSS procedures die tot nu toe aan de
orde zijn gekomen toepassen. De uitwerkingen van de opgaven zullen na de laatste sessie van
training 2 beschikbaar zijn op ELEUM (file:uitwerkingen_Stap13.pdf) zodat je je eigenuitvoer en de antwoorden kunt controleren.
Sla alle uitvoer op in n outputfile en schrijf de antwoorden op de vragen hieronder op.
Het kan zijn dat je SPSS trainer vraagt om je uitvoer en de antwoorden te laten zien
voordat je kunt aftekenen, bewaar ze dus beide in elk geval!!!
Open hearing.sav (misschien heb je dit bestand nog openstaan van de vorige Stap, daar kun
je dan ook mee verder werken). Zie Stap3voor een beschrijving van dit bestand.
13.1 Onderzoek alle variabelen middels de procedure Descriptives: Bekijk van alle variabelen
(behalve vanid) de minimum en maximum waarde. Vergelijk deze met de waarden die deze
variabelen kunnen aannemen volgens de beschrijving in Stap3. Zijn er variabelen metwaarden die niet valide zijn? Zo ja, definieer al deze waarden dan als missing values voor
de desbetreffende variabele.
NB: Bij fi_b_ear is naast 999 ook 16,67 een niet valide waarde. In het databestand is deze
waarde ingevoerd als 16,6666666 Om dit op een juiste manier als missing te definieren
kun je in dit geval in het betreffende venster bij missing de derde optie Range plus one
optional discrete valuekiezen en invullen: low 1, high 19, Discrete value 999.
Herhaal vervolgens de opdracht Descriptives en kijk opnieuw naar de minimum en
maximum waarden. Check of je de volgende tabel hebt gekregen:
Descriptive Statistics
99 1 2 1,51 ,503
98 1 3 1,81 ,668
98 1 2 1,98 ,142
99 1 3 2,23 ,831
97 0 1 ,75 ,434
97 25 100 68,61 16,117
97 15 100 64,36 16,379
95 20,00 68,33 40,5263 10,10952
99 56 92 73,43 8,472
88
sex
hearing1
hearaid
agegrp1
hearimp
euroqol
hearscor
fi_b_ear
age
Valid N (listwise)
N Minimum Maximum Mean Std. Deviation
Pas als je bovenstaande tabel hebt gekregen kun je verder gaan met de volgende opdracht!
13.2 Zorg dat de variabelen sex en agegrp1zijn voorzien van de juiste value labels.
13.3 Bereken een nieuwe variabele agemonth die de leeftijd in maanden weergeeft.Bestudeerhiervoor nogmaals Stap 5.Wat is de gemiddelde leeftijd in maanden?.............................
13.4 We willen alleen die mensen analyseren die geen hoorapparaat hebben (hearaid= 2) n eenfletcherindex hebben van groter of gelijk aan 35 (fi-b-ear35), omdat juist deze mensen veel
baat zouden hebben van een hoorapparaat. Selecteer deze mensen.Aanwijzing: Selecteer debetreffende mensen via procedure Select Cases (zie Stap10). Check de instelling bij Select
Cases: unselected cases moetengefilterdworden!
-
7/25/2019 spss15_stappenplan_08
44/55
Training 2 13. Oefenen II 44
Van deze groep mensen willen we onderstaande vragen beantwoorden. Laat SPSS de
daarvoor benodigde analyses uitvoeren.
Wat is de gemiddelde leeftijd van deze groep mensen? .
Wat zijn de percentages mannen en vrouwen in deze groep?..
13.5 Gebruik de procedure Explore om de fletcher index per leeftijdscategorie van alle
cases te bestuderen.
Aanwijzing:Zet eerst Select Cases uit!! Ga hievoor terug naar het Select Cases venster enselecteer onder Select de knop All cases. Kies vervolgens in Explore: Dependent list:fi_b_ear, Factor List: agegrp1!! En niet age!
Bestudeer de kengetallen zoals het gemiddelde, de standaard deviatie, het minimum en
maximum, de range etc. en maak geschikte grafieken. Probeer alle uitvoer te begrijpen.
Wat merk je op als je naar de relatie tussen de fletcher index en de leeftijd
kijkt?...................................................................................................................
13.6 Onderzoek de verschillen in fletcher index tussen de verschillende leeftijdsgroepen,
maar nu zonder gebruik te maken van de procedure Explore (zie Stap 9).
13.7 Maak een nieuwe variabele euroqolcatwaarbij de waarden van euroqol in klassen
ingedeeld worden. De waarden van 0 t/m 50 vaneuroqolmoeten bij de nieuwe variabelewaarde 1 krijgen, 51 t/m 75 waarde 2, en 76 t/m 100 waarde 3, dus het
hercoderingsvoorschrift luidt:
0 euroqol 50 -> euroqolcat =1
51 euroqol 75 -> euroqolcat =2
76 euroqol 100 -> euroqolcat =3
Controleer via de procedure Explore of de hercodering is goed gegaan.
Maak van deze nieuwe variabele een frequentieverdeling.
Beslis welke grafiek (bar chart of histogram) het meest geschikt is voor de variabele
euroqolcat en maak deze grafiek.
-
7/25/2019 spss15_stappenplan_08
45/55
Facultatief 14. Rekenen-2 (rekenen met If) 45
14. Rekenen-2 (rekenen met If)
In Stap5is het rekenen in SPSS behandeld.Bekijk die Stap nog eens. Vaak komt het voor
dat je een rekenvoorschrift wilt laten uitvoeren alleen voor cases die aan een bepaalde
voorwaarde voldoen. We willen bijvoorbeeld een inkomensafhankelijke bijdrage berekenendie niet voor alle inkomens hetzelfde percentage bedraagt. Dit is niet mogelijk middels de
procedures Select Cases of Split File!
14.1 Laat SPSS het bestand stap14.sav lezen en zorg dat via het rekenvenster verschijnt. Stap14.sav bevat drie variabelen: nr, geslachten
inkomen. We willen nu een nieuwe variabele laten berekenen die we bijdragenoemen. Deze
variabele moet worden berekend volgens onderstaand rekenvoorschrift:
Als inkomen 5000 dan bijdrage= 5% * (inkomen-2000)
Als 5000 < inkomen
7500 dan bijdrage= 7.5% * (inkomen-2000)Als inkomen> 7500 dan bijdrage= 10% * (inkomen-2000)
Dit doen we als volgt:
Maak eerst het sommetjebijdrage= (inkomen- 2000) * 0.05:
Gebruik nog niet de [OK]-knop, maar klik onderaan op [If]. Onderstaand venster
verschijnt. Kies voor de optie 'Include if case satisfies condition en vul de voorwaarde in
(hier:inkomen5000):
-
7/25/2019 spss15_stappenplan_08
46/55
Facultatief 14. Rekenen-2 (rekenen met If) 46
Druk vervolgens op [Continue] en in het volgende venster op [OK] om de rekenpartij
uit te laten voeren.Je ziet dat de rekenpartij alleen voor de cases met een inkomen 5000
wordt uitgevoerd, terwijl voor de andere cases de System Missing waarde is ingevuld.
Ga terug naar het Compute Variable venster en voer vervolgens de volgenderekenopdracht uit: bijdrage= (inkomen-2000)* 0.10. Stel middels [If] als voorwaarde de
conditie: inkomen> 7500. Klik op [Continue] en daarna op [OK]. SPSS vraagt nu
toestemming om de bestaande variabele te overschrijven (Change existing variable?). Klik
op [OK],want je wilt natuurlijk een aantal van de System Missing waarden vervangen
(namelijk die waarvoor geldt:inkomen> 7500).
Tenslotte moet bijdrage= (inkomen-2000)* 0.075 nog worden berekend onder de
voorwaarde dat 5000 < inkomen 7500.Hierbij doet zich een probleem voor. Je zou
mogen verwachten dat onder [If ] gewoon '5000 < inkomen7500' ingevuld kan worden. Als
je dat doet begint SPSS inderdaad te rekenen, maar doet dat alleen voor het linker deel van de
ingevulde conditie: '5000 < inkomen' (anders gezegd: voorinkomen > 5000). De gewenste
conditie bestaat echter uit twee delen en die delen moeten apartworden opgegeven en
verbonden door de operators AND ofwel &. Je dient dus in dit geval onder [If] op te
geven:
inkomen > 5000 AND inkomen7500of: inkomen> 5000 & inkomen7500.
Als je nu kijkt naar de waarden die voor bijdragezijn berekend valt het op dat case 7 een
negatieve waarde heeft:
-
7/25/2019 spss15_stappenplan_08
47/55
Facultatief 14. Rekenen-2 (rekenen met If) 47
Rekenkundig klopt dat wel, maar de opdrachtgever wil in het geval van een negatieve waarde
de bijdrage op 0 stellen. Hiervoor staan verschillende methoden ter beschikking, zoals:
RECODE bijdrage: waarden kleiner dan 0 worden 0.
COMPUTE bijdrage: waarden kleiner dan 0 worden 0.
We kunnen echter ook een andere, ingewikkeldere methode gebruiken, waarmee meteen het
gebruik van Functions wordt gedemonstreerd.
14.2 Ga weer naar het Compute Variable venster.De Target Variable is nog steedsbijdrage. In
het veld Numeric Expression maken we gebruik van de functie Max. Deze functie bevindt
zich onder Function group: Statistical, selecteer vervolgens bijFunctions and Special
Variables:Max. Maxzorgt ervoor dat het maximum van een aantal argumenten wordtgekopieerd naar de Target Variable.Selecteer Max en breng die met het pijltje omhoog.
Op de plaats van de ?,? komt achtereenvolgens bijdrageen 0te staan:
-
7/25/2019 spss15_stappenplan_08
48/55
Facultatief 14. Rekenen-2 (rekenen met If) 48
De functie Max bepaalt nu voor elke case het maximum van0en de waarde van de variabele
bijdrageen plaatst dat maximum in bijdrage. Met andere woorden, wanneer de waarde van
bijdragekleiner dan 0 is, zoals het geval bij case 7, wordt deze waarde vervangen door 0. In
alle andere gevallen blijft de eerder berekende waarde van bijdrage gewoon gehandhaafd.
Laat SPSS de rekenpartij uitvoeren voorallecases (dus onder [If] selecteer jeInclude
all cases !).
SPSS kent een groot aantal functies. Het gaat hier te ver om het gebruik ervan te
demonstreren. Blader het lijstje eens door om een indruk te krijgen van demogelijkheden.Via Help zou je nog informatie kunnen krijgen over een specifieke functie en
tijdens je studie zul je meer mogelijkheden vanzelf ontdekken.
-
7/25/2019 spss15_stappenplan_08
49/55
Facultatief 15. Bestanden samenvoegen (Merge Files) 49
15. Bestanden samenvoegen (Merge Files)In de praktijk komt het dikwijls voor dat gegevens, die bij elkaar horen, zijn opgeslagen in
verschillende files. Het kan zijn dat er twee (of meer) files zijn met verschillende cases, het
kan ook zijn dat in twee (of meer) files verschillende variabelen van dezelfde cases zijn
opgeslagen. Vaak moeten die files worden samengevoegd (= merge).
Add Cases
De datafile oef15.sav bevat gegevens omtrent vier toetsuitslagen van een vijftal studenten.
Indien er toetsuitslagen van andere studenten in een andere datafile zijn opgeslagen, is het
natuurlijk wenselijk om op een gegeven moment de twee datafiles te combineren in n file.
Dat kan met de menu-optie onder . Wanneer je op klikt,
moet je kiezen voor .
We willen de gegevens van toets3.sav (data over de vier toetsuitslagen van vijf andere
studenten) toevoegen aan de datafile oef15.sav.
15.1 Open eerst oef15.sav en sluit databestanden van vorige Stappen af.Dit is je actieve
datafile. Kies vervolgens .In het venster dat nu
verschijnt kies je voor an external SPSS data file. Kies toets3.sav middels [Browse]. Nadat
je op [Continue] hebt gekliktverschijnt het volgende venster:
Je ziet dat SPSS meteen begrijpt dat de beide datafiles overeenkomstige variabelen hebben.
Deze gezamenlijke variabelen plaatst SPSS automatisch in de rechter box van het dialoog
venster.
Klik op [OK] en constateer zelf door in het datavenster te kijken hoe de twee datafiles
samengevoegd zijn.
Je kunt de samengevoegde datafile, eventueel onder een nieuwe naam, opslaan. Bedenk een
toepasselijke filenaam en sla de nieuwe datafile op met behulp van .
Uit bovenstaand voorbeeld wordt duidelijk dat het handig is als de twee datafiles die je wilt
samenvoegen dezelfde variabelen(-namen) bevatten. Het kan echter ook voorkomen dat de
-
7/25/2019 spss15_stappenplan_08
50/55
Facultatief 15. Bestanden samenvoegen (Merge Files) 50
ene datafile variabelen bevat die niet in de andere datafile voorkomen. Stel we willen de
cases van de databestanden hearing.sav en geboorte.sav (zie Stap 9) samenvoegen.
Onderstaand dialoogvenster verschijnt:
Een (*) achter de variabelenaam betekent dat de variabele behoort tot het actieve bestand
(hearing.sav), terwijl een (+) betekent dat de variabele alleen tot de toe te voegen file behoort
(geboorte.sav).
De variabelen die in beide bestanden voorkomen worden automatisch opgenomen in de
nieuwe samengevoegde file. De andere (*) en (+) variabelen kunnen in het nieuwe bestand
worden opgenomen door ze met de pijl naar rechts onder Variables in New Active Dataset
te brengen. De (+)-variabelen, die dus niet voorkomen in het actieve bestand, worden daarbij
voor de cases in het actieve bestand aangemaakt en gevuld met de waarde system missing(zie Stap 4). Het omgekeerde kan natuurlijk ook het geval zijn!
15.2 Add VariablesNaast het samenvoegen van twee datafiles met dezelfde variables (Add Cases) is het ook
mogelijk om twee datafiles die dezelfde cases (bijv. personen) betreffen maar die
verschillende variabelen bevatten, aan elkaar te koppelen met .
Stel je beschikt bijvoorbeeld voor de personen in het bestand hearing.sav ook over gegevens
van hun medische consumptie. Die gegevens staan echter in een ander databestand. Het kaninteressant zijn om deze datafiles aan elkaar te koppelen om zodoende bijvoorbeeld te
onderzoeken of medische consumptie verschilt voor de personen met en zonder een
hoortoestel. De datafile met de gegevens over de medische consumptie is medcomp.sav.
Deze bevat 2 variabelen, identificatie nummer (id) en medische consumptie (medcomp). Wewillen de variabelemedcompgaan toevoegen aan hearing.sav.
Van essentieel belang bij zon koppelmanoeuvre is de sleutel ofwel key variable. Dat is
een variabele die in beide bestanden voorkomt en die SPSS laat weten welke cases gekoppeld
moeten worden. Het is overigens heel goed mogelijk, en in de praktijk zelfs meestal het
geval, dat er onderzoekseenheden (hier personen) zijn die niet in beide data sets voorkomen.
In dit voorbeeld is de sleutel het identificatienummer (id). Dit moet uniek zijn voor de
-
7/25/2019 spss15_stappenplan_08
51/55
Facultatief 15. Bestanden samenvoegen (Merge Files) 51
dataset(s). SPSS vereist bovendien dat in beide datafiles de cases geordend zijn in oplopende
waarden voor de sleutel of key variabele.
Open het bestand medcomp.sav en sluit andere databestanden. Zorg dat de cases van
medcomp.sav gesorteerd worden volgens de variabele id. Dit doe je volgens de stappen: in het volgende scherm:
Vul onder Sort by: idin, klik op [OK]. Open naast medcomp.sav de file hearing.sav.
Sorteer ook binnen hearing.sav op id.
Zorg dat je met je muis in hearing.sav staat (dan is dat de actieve file). Klik op
. In het dialoogvenster Add Variables to
hearing.sav selecteer je onder de optieAn open dataset de file medcomp.s