MPO hoorcollege 3

Post on 10-Jul-2015

312 views 4 download

Transcript of MPO hoorcollege 3

Methoden van Publieksonderzoek

Hoorcollege 3: Descriptieve Statistiek

15 – 5 – 2013

Wat komt er vandaag aan bod?DEADLINE: opzetten inleveren!!!

Data invoeren en manipuleren in SPSS

Constructen meten: reliability

Wat is descriptieve statistiek?Measures of tendencyMeasures of dispersionNormaalverdelingHoe kom je bij deze statistieken met SPSS?

Voorbereidingen voor het werkcollege as vrijdag

Data invoer & ‘manipulatie’

Data invoerenData verzamelen

Participant nummers & conditie nummers

Randomiseren?

Databestand klaarmakenAlles moet een nummer (een value) hebben!

Variabelen invoeren & labelen

Ook ‘missing values’ aangeven

Meetniveaus aangeven

Data invoeren

Data ‘manipuleren’Recode

De waardes van je variabelen aanpassen (bijvoorbeeld negatief geformuleerde vragen positief maken zodat SPSS ze op dezelfde manier leest als de andere vragen in hetzelfde construct)

ComputeVariabelen samenvoegen om 1 nieuwe variabele te maken

Select casesTest uitvoeren op een bepaald deel van de participanten (bijvoorbeeld per conditie, of alleen voor de mannen)

Recode Voorbeeld

Construct: begrijpelijkheid

Vragen:Ik kon het verhaal goed begrijpen

Ik kon de rode draad goed volgen

Ik ben niet gestruikeld over moeilijke woorden

Ik vond het lastig om dit verhaal te begrijpen

Schaal van 1 tot 7De schaal moet bij 1 vraag omgedraaid worden (zodat SPSS de vraag goed kan interpreteren)

Recode

Recode

Recode

Compute Voorbeeld

Construct: Transportatie

5 losse vragen:Het voelde alsof ik zelf in de wereld van het verhaal was (T1)

De wereld van het verhaal was dichterbij dan de echte wereld (T3)

Het voelde alsof ik een uitstapje had gemaakt naar het verhaal (T4)

Het voelde alsof ik niet los van het verhaal bestond (T5)

Ik was dichtbij de wereld van het verhaal (T2)

Om tests te kunnen doen (wat is het effect van x op transportatie?) hebben we 1 variabele nodig, niet 5 losse variabelen

Compute

Constructen meten?Reliability testen

Reliability

Reliability

Cronbach’s α

Select Cases Voorbeeld

Wat is de gemiddelde score op transportatie per conditie?

Eerst de gemiddelde score voor conditie 1 opvragen, dan voor conditie 2 en dan voor conditie 3

Deel van je ‘sample’ (participanten) selecteren

Select cases

Select cases

Select cases

Select Cases

Onthouden bij SPSS gebruik-SPSS voert precies uit wat je vraagt

- Maar checkt niet of dat wat je vraagt wel mogelijk is

- Denk bijvoorbeeld aan: correct meetniveau- Altijd zorgvuldig zijn en de tijd nemen om je

databestand goed voor te bereiden!- En: maak aantekeningen, zodat je fouten kunt

herstellen

PAUZE

Descriptieve statistiek- Relevant voor de eerste fase van data analyse

- Beeld krijgen van verdeling- Fouten opsporen- Data bestand klaarmaken voor toetsende statistiek

- Doel: samenvatten- Enorm data bestand in betekenisvolle informatie omzetten:

- Gemiddelden en percentages

Descriptief vs. Inferentieel

Data beschrijven (descriptieve statistiek)Hoeveel mannen en vrouwen in ‘sample’

Wat zijn de gemiddelde scores op absorptie van de mannen en van de vrouwen

Verschillen deze gemiddelde scores van elkaar?

Generaliseren (inferentieel of toetsende statistiek)Scoren mannen toevallig anders dan vrouwen op absorptie

Descriptieve statistiekAlgemene spreiding/tendens

Tendensen van groepen of patronen in een sample

Nodig: Measures of Central Tendency

Reacties van individuele deelnemersRelatie van individuele observaties tot de algemene tendens

Nodig: Measures of Dispersion

Measures of tendency & dispersion kunnen niet zonder elkaar!

Measures of tendencyMean (gemiddelde)

2+6+10+28+104=150/5=30

Meest gebruikt, maar niet erg informatief• Gevoelig voor extreme waarden (outliers)

– Median (mediaan)• 2, 6, 10 ,28, 104• Ligt in het midden van een rangorde, daardoor minder gevoelig voor

outliers

– Mode (modus)• 2, 6, 10, 28, 104, 6, 2, 6• De meest voorkomende waarde• Niet informatief in kleine samples

Voorbeeld: leesgedrag

Measures of dispersion• Range (verspreiding)

– 28, 29, 30, 31, 32 > 32-28=4– Verschil tussen de laagste en hoogste waarde in sample

• Standard Deviation (standaard deviatie)– Gemiddelde afwijking van het gemiddelde– Lage SD geeft een hoge mate van consensus onder participanten aan,

hoge SD geeft lage mate van consensus aan

• Variance (variantie)– Variatie in de spreiding (vergelijkbaar met SD, maar SD wordt vaker

gebruikt)– Ook: Analysis of Variance of ‘x % of variance explained’

Voorbeeld: leesgedrag

Normaalverdeling• Distributie van data rond het gemiddelde

• “Bell Curve”

• ‘Ideale’ verdeling

• Hoe meer observaties, hoe

groter de kans op een

normaal verdeling

• Voorbeelden:– Gewicht– Lengte– IQ

VAR00001

8.07.06.05.04.03.02.01.00.0

80

60

40

20

0

Std. Dev = 1.44

Mean = 4.0

N = 257.00

Normaalverdeling

- Alleen met data op interval of ratio niveau kan er een normaalverdeling op treden

- Voor sommige testen is een normaalverdeling van de data een voorwaarde- SPSS > Normality tests

Descriptive statistics in SPSS -Niet bang zijn voor formules, SPSS lost het op!

-Voor toegang tot testen (descriptief en toetsend) SPSS > Analyze

SPSS > Frequencies

SPSS > Frequencies

SPSS > Tendency & Dispersion

Central Tendency Output

Normaalverdeling?

Normaal verdeling?

Visuele weergave via SPSS

-Grafieken (SPSS > GRAPHS of ‘Charts’ in FREQUENCIES)- Visuele weergave zegt meer in 1 oogopslag!- Gebruiken in je rapportage- Spelen om te leren kennen

-Boxplots (SPSS > GRAPHS > Legacy Dialogs > Boxplots)- Soms te verkiezen omdat het central tendency & dispersion laat zien

Boxplots

Boxplots

Boxplots

Boxplots

Voorbeeld: Waardering

Voorbeeld: Waardering

Normaalverdeling vs. skewedness• Ligt de mediaan ‘boven het midden’: negatief

• Ligt de mediaan ‘onder het midden’: positief

Voorbeeld: Waardering

Voorbeeld: Waardering

Voorbeeld Casus

• Meer deviatie in het verhaal zal leiden tot minder transportatie in de lezer.

• Hoe kan descriptieve statistiek ons helpen?– Gemiddelde scores op transportatie aangeven– Per conditie in 1 verhaal (Bierce)

• Conditie 1: origineel• Conditie 2: lage deviatie• Conditie 3: hoge deviatie

Voorbeeld Casus: Conditie 1

RECODE into SAME variable > Variable 1 to 115 > 0 = 99

(99 = missing value) NB: altijd opslaan voor ‘recode into same var’

- Participant 12: 1 missing value en op de andere 4 vragen een 1- 4/5=0.80 (want: transportation bestaat uit 5 vragen)

Voorbeeld Casus: Conditie 2

- Mean is iets hoger- Maar mode is lager- Wel een hoger maximum- Minder consensus

- 4 mensen meer

- Minder deviatie lijkt meer transportatie op te leveren

Voorbeeld Casus: Conditie 3

- De hoogste mean- Maar: ook de hoogste SD- En: de kleinste groep (8

mensen minder)

- Onze hypothese lijkt niet te kloppen, want in deze conditie zou transportatie het laagst moeten zijn

Vergelijking

Zelfde resultaat in verhaal van Conan Doyle?

Belangrijk om te onthouden:

- Mean, Mode & Median- Standard Deviation- Normaal verdeling - Cronbach’s α

- Zorgvuldig zijn en tijd nemen om je data bestand voor te bereiden

- We gaan in de werkcolleges oefenen met descriptives, boxplots & Cronbach’s (en eventueel met Recode, αCompute & Select Cases), maar oefen zelf thuis ook!!!

Voorbereiden Werkcollege- LET OP:

- Vanaf deze week in een andere zaal werkcollege- (Kromme Nieuwe Gracht 80, zaal 0.12 CLZ)

- Geen aanwezigheidsplicht, maar alleen komen als je je ook echt hebt voorbereid!

- Maak opdrachten uit module 2 van Hoofdstuk 7 & 8