uitleg statistiek 2011

5

Click here to load reader

Transcript of uitleg statistiek 2011

Page 1: uitleg statistiek 2011

Opgave 1: (10+15+10+10+10 = 55 pnt)In een langdurig onderzoek is in twee provincies van België (Brabant en Oost-Vlaanderen) gekeken naar het aantal vlinders in tuinen op verschillende plekken in de provincie (stad, villawijk, dorp of platteland). Gedurende verschillende jaren is in hetzelfde weekend van dat jaar in dezelfde tuinen het aantal vlinders geteld. Zie onderstaande tabel:

a) Maak een SPSS-databestand met alle gegevens uit deze tabel.Geef iedere variabele een variable label en gebruik waar nodig value labels, geef bij iedere variabele het juiste meetniveau (scale/ordinal/nominal). Laat een zinvol aantal decimalen weergeven.

Invullen zoals weergeven. Provincie en ligging zijn nominaal, alle vlinders zijn schaal.

b) Toets met behulp van SPSS of er in 2008 verschil is in gemiddeld aantal vlinders tussen Brabant en Oost-Vlaanderen. Werk met een foutmarge =0,05. Kopieer de tabellen naar Word en geef daar ook goede uitleg van de gevonden resultaten.Als het goed is vind je ergens in de output een Std. Error Difference van 2,917. Leg uit hoe je die getal berekent en maak daarbij gebruik van andere getallen die in de output staan.

Ongepaarde t-toets bij interval / ratio. Analyze, Compare means, Independent-Samples T Test. Test = vlinders2008 en groups = Provincie.

Levene’s test geeft p Sig. =0,317 > 0,05, dus we mogen gelijke varianties veronderstellen. Dus de overschrijdingskans Sig. (2-tailed) is 0,586 > 0,05, dus er is geen verschil in gemiddeld aantal vlinders aangetoond tussen de twee provincies.

Het getal 2,917 vinden we als volgt:

1

Page 2: uitleg statistiek 2011

Bereken eerst de gemiddelde variantie: s2 =

7∗4 ,7042+7∗6 ,7772

14 = 34, 0277

En dan schatten we de standaardfout van het verschil met √34 ,02778+34 ,0277

8 = 2,917

c) Toets met behulp van SPSS of er verschil is in het aantal vlinders per tuin tussen de jaren 2009 en 2008.Werk met een foutmarge =0,05. Kopieer de tabellen naar Word en geef daar ook goede uitleg van de gevonden resultaten.

Gepaarde t toets. Analyse, Compare Means, Paired sample t test. Voer in V2008 en V2009.

P Sig. (2-tailed)=0,000 < , dus er is een significant verschil in gemiddeld aantal vlinders aangetoond tussen 2008 en 2009.

d) Toets met behulp van SPSS of er verschil is in het aantal vlinders* afhankelijk van de ligging van de tuin. Als er verschil is laat SPSS dan ook bepalen tussen welke tweetallen groepen er een significant verschil is. Werk met =0,05. Kopieer de tabellen naar Word en geef daar ook goede uitleg van de gevonden resultaten.

* Onder ‘aantal vlinders’ verstaan we hier het gemiddeld aantal vlinders per tuin over de drie jaren 2008, 2009 en 2010. Laat SPSS eerst per tuin dit gemiddeld aantal vlinders over de drie jaren automatisch uitrekenen. Plak de syntax van deze variabele ook in je Wordbestand.

Eerst moet en een nieuwe kolom met alle gemiddelden gemaakt worden. Doe dit via Transform, Compute Variable. Voer in de code (V_2008 + V_2009 + V_2010)/3.

We rekenen met meerdere groepen met interval/ratio dus Analize, Compare means, One way anova. Dependant=gem vlinders en Factor = ligging. Klik op Post Hoc en vink LSD aan.

One-Way ANOVA geeft p Sig.= 0,000 < 0,05 dus er is minimaal een tweetal met significante verschillen. De LSD tabel zegt ons vervolgens dat er significante verschillen in aantallen vlinders zijn tussen:Stad – dorp: Sig. 0,004<0,05Stad – platteland Sig. 0,00<0,05Villawijk – dorp Sig. 0,008<0,05Villawijk – platteland Sig. 0,00<0,05Platteland – dorp Sig. 0,009<0,05

e) Maak in SPSS een nieuwe variabele die het aantal vlinders in 2008 in twee groepen verdeeld: ‘minder dan 10 vlinders’ en ’10 vlinders of meer’. Toets vervolgens of er onafhankelijkheid of afhankelijkheid is tussen deze nieuwe variabele en de ligging van de tuin. Doe dit met = 0,01. Kopieer de tabellen naar Word en geef daar ook goede uitleg van de gevonden resultaten.Waarom zijn de resultaten van deze toets niet zo betrouwbaar?

Groep splitsen: Gebruik Transform, Recode into diffirent variables. Gebruik Vlinders2008. Voer naam en label in druk op change. Druk op old and dew values. Range 0 trough 9 = 1 add en all other = 2.

2

Page 3: uitleg statistiek 2011

Onafhankelijkheid/afhankelijkheid: Dan Analyze, descriptive statistics, crostabs. Rows = ligging en coloms = nieuw aangemaakte groep. Ga naar statistics en vink chi square aan.

(p) Asymp. Sig. (2-sided) =0,001 < 0,01, dus is er afhankelijkheid aangetoond tussen ligging van de tuin en het aantal vlinders. Dit resultaat is erg onbetrouwbaar omdat de theoretische frequentie allemaal lager zijn dan 5.

Opgave 2: (10 + 5 + 10 + 10 + 10 = 45 pnt)In een onderzoek is gekeken naar de aantasting van paprikaplanten door trips gemeten op de volgende schaal (1=geen aantasting, 2= matige aantasting, 3 = grote aantasting en 4 = volledige aantasting). Dit is gemeten op 2 soorten bladeren (jonge en oudere) en bij planten van verschillende rassen: (Ariane, Monte, Salsa)

De resultaten staan in onderstaand schema:Per plant en ras staat tussen haakjes eerst de aantasting van de jonge bladeren en dan de aantasting van de oudere bladerenZo zien we bijvoorbeeld dat van het ras Ariane bij de eerste plant de jongere bladeren geen aantasting hebben en de oudere bladeren een matige aantasting.

Ariane Monte SalsaPlant1 (1, 2) (3, 4) (2, 4)Plant2 (2, 4) (2, 3) (1, 3)Plant3 (3, 3) (3, 3) (1, 4)Plant4 (1, 1) (4, 3) (2, 2)Plant5 (2, 3) (3, 2) (2, 4)

We willen de volgende hypothesen onderzoeken:1. Op oudere bladeren van een plant komt gemiddeld meer aantasting voor dan op de jongere bladeren

van die plant.

2. Er is tussen de onderzochte rassen een verschil in mate van aantasting bij de jonge bladeren.

3. Er is tussen de onderzochte rassen een verschil in mate van aantasting bij de oudere bladeren.

a) Maak een SPSS-databestand met alle gegevens uit deze tabel. Zorg voor een goede indeling zodat hypothese 1 getoetst kan worden.Geef iedere variabele een variable label en gebruik waar nodig value labels, geef bij iedere variabele het juiste meetniveau (scale/ordinal/nominal). Laat een zinvol aantal decimalen weergeven.

3

Page 4: uitleg statistiek 2011

b) Leg uit waarom voor geen van de drie hypothesen een t-toets, gepaarde t-toets of Oneway ANOVA gebruikt kan worden.

De getallen staan voor rangen en zijn dus allemaal ordinaal. Het is dus een nominaal / ordinale toets.

c) Toets met behulp van het in a) gemaakte bestand of hypothese 1 door dit onderzoek aangetoond is. Werk met =0,05. Kopieer de tabellen naar Word en geef daar ook goede uitleg van de gevonden resultaten.

Per plant de aantasting bekijken dus verschil in 2 situaties bij dezelfde groep. Analyze, nonparametric test, 2 related samples. p Asymp. Sig. (2-tailed)=0,049 < , dus tussen de rassen Ariane en Monte is een significant verschil in aantasting bij jonge bladeren.

d) Toets met behulp van SPSS of hypothese 2 door dit onderzoek is aangetoond. Werk met =0,05. Kopieer de tabellen naar Word en geef daar ook goede uitleg van de gevonden resultaten. Als er verschil gevonden is kies dan een tweetal rassen en toets of er tussen dat tweetal rassen een verschil in aantasting bij de jonge bladeren is.

3 onafhankelijke groepen nominaal/ordinaal dus Analyze, Nonparametric tests, K independent samples.Grouping variable=soort en test = jong.

(P) Asymp. Sig.=0,034 < dus er is verschil in aantasting tussen de drie rassen aangetoond bij jonge bladeren van een plant.

e) Toets met behulp van SPSS of hypothese 3 door dit onderzoek is aangetoond. Werk met =0,05. Kopieer de tabellen naar Word en geef daar ook goede uitleg van de gevonden resultaten. Als er verschil gevonden is kies dan een tweetal rassen en toets of er tussen dat tweetal rassen een verschil in aantasting bij de oudere bladeren is.

Vergelijken 3 gerelateerde variabelen nominaal/ordinaal. Analyze, nonparametric test, 2 independent samples. Groep = soort en test = oud.

p Asymp. Sig.= 0,417> , dus er is geen verschil in aantasting tussen de drie rassen aangetoond bij de oudere bladeren van een plant.

4