Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

39
Deel 3 – Hoe pak ik een kwantitatief onderzoek aan? Marktonderzoek in rechte lijn

description

Uitgeverij De Boeck PowerPoint Marktonderzoek in rechte lijn 2014 Deel 3 hoofdstuk 5 Marc De Laet, Pol Toye

Transcript of Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

Page 1: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

Deel 3 – Hoe pak ik een kwantitatief onderzoek aan?

Marktonderzoek in rechte lijn

Page 2: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

2

Het verwerken van de gegevens

Hoofdstuk 5

Page 3: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

• Editing• Coderen• Meetniveaus• Datamatrix

3

Verwerken van de gegevens

Gegevenscontrole en -bewerking

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 4: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

• Volledigheid• Begrijpelijkheid• Consistentie• Eenvormigheid

4

Verwerken van de gegevens

Editing

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 5: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

• Kwalitatieve of niet-metrische data(aanduidingen en kwalificaties)– nominaal meetniveau– ordinaal meetniveau

• Kwantitatieve of metrische data (verschillen en hoeveelheden)– intervalmeetniveau– ratiomeetniveau

5

Verwerken van de gegevens

Meetniveaus

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 6: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

6

Verwerken van de gegevens

Toegelaten statistische bewerkingenMeetniveau Toegestane bewerkingen Grafische voorstelling

Nominaal procentenfractiesmodus

staafdiagramcirkeldiagram

Ordinaal procentenfractiesmodusmediaankwantielenkwartielschattingkwartielafstandminimummaximumbereik

staafdiagramcirkeldiagram

Interval en ratio procentenfractiesmodusmediaangemiddeldestandaardafwijkingvariantiekwantielenkwartielschattingkwartielafstandminimummaximumbereik

staafdiagramcirkeldiagramlijndiagramhistogramspreidingsdiagram of scatterplotfrequentiepolygoonstem en leaf diagramboxplot (box and whisker diagram)

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 7: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

Vraag 1 Geslacht?Man 1Vrouw 2

Vraag 2 Leeftijd?< 25 jaar 125-44 245-64 3> 65 4

Vraag 3 Belangrijkste vervoermiddel om naar hier te komen?Auto 1Autobus 2Trein 3Vliegtuig 4Schip 5

7

Verwerken van de gegevens

Datamatrix (1)

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 8: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

Vraag 4 Welke streken zult u bezoeken?Kust 1 of 2Grote steden 1 of 2Ardennen 1 of 2Kempen 1 of 2

Vraag 5 Hoe werd uw reis georganiseerd?Ik heb alles zelf geregeld 1Volledig via een reisbureau 2

Vraag 6 Hoe lang zal uw verblijf duren?< 1 week 11 à 2 weken 2> 2 weken 3

8

Verwerken van de gegevens

Datamatrix (2)

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 9: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

Rij/Kolom1 2 3 4 5 6 7 8 910

1 001 2 1 3 1 1 1 2 12

2 002 2 4 2 2 2 1 1 21

3 003 1 3 5 2 1 2 1 13

4 004 1 2 1 1 2 1 2 11

5 005 2 1 4 1 2 1 1 21

...

...

...500 500 2 4 3 2 1 2 2 2

19

Verwerken van de gegevens

Datamatrix (3)

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 10: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

• Vergelijking kenmerken populatiesamenstelling en steekproef

• Criterium moet beschikbaar zijn voor populatie én steekproef

• Samenstelling moet niet exact dezelfde→ steekproefgegevens ‘trillen’

• Objectieve beoordeling→ statistiek: chi-kwadraat test

10

Verwerken van de gegevens

Representativiteitscontrole

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 11: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

• Verschillen tussen twee frequentietabellen samengevat in chi-kwadraat waarde

• Fo = de geobserveerde frequentie Fe = de verwachte frequentie

11

Verwerken van de gegevens

Chi-kwadraat (1)

=

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 12: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

• Twee hypothesen– Ho: de twee frequentieverdelingen verschillen niet werkelijk van elkaar,

het geconstateerde verschil is te wijten aan het toeval van de steekproeftrekking en is dus te verwaarlozenSymbolisch: Fe = Fo

– H1: de waargenomen waarden verschillen zo sterk van de verwachte, dat we vermoeden dat ze uit een andere populatie komenSymbolisch: Fe ≠ Fo.

• Vrijheidsgraden• Overschrijdingskans

12

Verwerken van de gegevens

Chi-kwadraat (2)

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 13: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

Populatiesamenstelling ≠ steekproefsamenstelling …

→ principieel/statistisch: steekproef verwerpen

→ in praktijk: steekproef corrigeren = herwegen

13

Verwerken van de gegevens

Representativiteitscorrectie

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 14: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

• Centrale tendensmaten– rekenkundig gemiddelde– mediaan– modus

• Welke?– nominaal → modus– ordinaal → mediaan– interval of ratio → rekenkundig gemiddelde

14

Verwerken van de gegevens

Samenvatten, verklaren en begrijpen

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 15: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

• Modus→ waarneming die meest voorkomt

• Mediaan→ middelste waarneming (rangschiking!)→ bij continue gegevens:

15

Verwerken van de gegevens

Centrale tendensmaten - formules

× i

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 16: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

• Rekenkundig gemiddelde

16

X=f 1 X1+ f 2X 2+… f k X k

n

X=∑i=1

k

f i X i

n

Verwerken van de gegevens

Centrale tendensmaten - formules

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 17: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

• Spreidingsbreedte, variatiebreedte, ‘range’

• (Inter)kwartielafstand → afstand tussen Q1 en Q3

• Variantie

17

Verwerken van de gegevens

Spreidingsmaten (1)

R=X max− Xmin

s2=f 1 (X 1− X ) ²+ f 2 ( X2−X ) ²+…+ f k (X k−X ) ²

n

=

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 18: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

• Standaardafwijking of -deviatie

• Efficiency− gemiddelde delen door standaardafwijking− hoe groter, hoe ‘efficiënter’− maat voor bruikbaarheid van het gemiddelde

18

Verwerken van de gegevens

Spreidingsmaten (2)

s=√ f 1 (X 1− X )2+ f 2 ( X2− X )2+…+ f k (X k− X ) ²n

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 19: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

19

Verwerken van de gegevens

Vergelijking kengetallen ligging en spreidingVoordelen Nadelen

Gemiddelde Gebruikt alle meetuitkomstenAlleen voor variabelen op interval- of rationiveau

Gevoelig voor extreme waardenNiet te berekenen voor verdelingen met open klassen

Mediaan Ook voor ordinaal geschaalde variabelenOok voor verdelingen met open klassenWeinig gevoelig voor hoge of lage waarden

Informatieverlies: alleen de grootte van de middelste uitkomst speelt een rolHet ordenen van de uitkomsten vergt tijd

Modus Ook voor nominaal geschaalde variabelenOok voor open klassenWeinig rekenwerkGoede maat bij eentoppige en symmetrische verdelingen

Zeer onstabiele maatLigging wordt bepaald door de gekozen klassenindelingEr kan meer dan een modus voorkomenInformatieverliesWeinig gevoelig voor extremen

Variatiebreedte Weinig rekenwerk Ruwe maatstafZeer onstabielGebruikt weinig informatie

Kwartielafstand Stabieler dan variatiebreedteOok voor open klassen en ordinaal geschaalde variabelen

Mist de eenvoud van de variatiebreedteGebruikt minder informatie dan de standaardafwijking

Standaardafwijking & variantie

Gebruikt zoveel mogelijk infoVerandert niet als alle getallen met een vast bedrag worden verhoogd of verlaagdBelangrijkste maatstaf

Veel (manueel) rekenwerkAlleen voor interval- of ratioschaalNiet te berekenen voor verdelingen met open klassen

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 20: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

‘Hoe lang zal uw verblijf in België duren?’ (n=500)

Code Aantal %(absolute freq.) (relatieve freq.)

1 (minder dan 1 week) 308 62 2 (1 à 2 weken) 160 32 3 (meer dan 2 weken) 32 6 Totaal 500 100

gemiddelde waarde → modusgrafische voorstelling → staafdiagram

20

Verwerken van de gegevens

Frequentietabellen

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 21: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

• Frequenties volgens verschillend criteria gesplitst in kolommen

• Gebruikelijk– vermoedelijke oorzaak = hoofding kolommen– vermoedelijk gevolg = titel rij– % berekenen in richting oorzaak

21

Verwerken van de gegevens

Kruistabellen

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 22: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

Oorzaak en gevolgEffect van de reclame op de merkbekendheid - absolute frequenties

voor campagne na campagnetestmarkt

recall 450 320geen recall 300 80totaal 750 400

controlemarktrecall 150 160geen recall 350 340totaal 500 500

22

Verwerken van de gegevens

Kruistabellen – voorbeeld (1)

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 23: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

Effect van de reclame op de merkbekendheid - relatieve frequenties (%)

voor campagne na campagne

testmarktrecall 60 80geen recall 40 20totaal 100 100

controlemarktrecall 30 32geen recall 70 68totaal 100 100

23

Verwerken van de gegevens

Kruistabellen – voorbeeld (2)

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 24: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

24

Verwerken van de gegevens

Toetsen van onderzoeksuitkomsten

1 Formuleer de nulhypotheses↓

2 Specificeer (naar keuze) het significantieniveau

3 Bepaal de te gebruiken significantietest

4 Bereken de waarde van de toetsingsgrootheid

5 Bepaal de overschrijdingskans voor de waargenomen data

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 25: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

25

Verwerken van de gegevens

Overzicht significantietests

Onafhankelijke variabele Nominaal Ordinaal Interval of ratio

Nominaal (dichotomisch)

Kruistabel + -test Mann-Whitney t-toets*

Nominaal (niet-dichotomisch)

Kruistabel + -test Kruskal-Wallis ANOVA**

Ordinaal Rangcorrelatie Rangcorrelatie

Interval of ratio Pearsons correlatie***

Afhankelijke variabele

* Hier kun je ook de ANOVA gebruiken, maar de t-test is speciaal ontworpen voor het vergelijken van twee groepen. Als het een kleine steekproef is en de afhankelijke variabele niet normaal verdeeld is, dan wordt de Mann-Whitney-test toegepast.** Als het een kleine steekproef is en de afhankelijke variabele niet normaal verdeeld is, dan gebruiken we de Kruskal-Wallis-test.*** Als het een kleine steekproef is en één van de variabelen niet normaal verdeeld is, dan gebruiken we rangcorrelatie.

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 26: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

26

Verwerken van de gegevens

Kritische waarden, acceptatie- en verwerpingsgebied

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 27: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

• Representativiteitscontrole– verschilt de waargenomen frequentieverdeling

significant van de theoretisch verwachte?• Significante verbanden

– toetsen van het potentieel verband tussen 2 niet-metrische variabelen

27

Verwerken van de gegevens

Chi-kwadraattest

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 28: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

28

Verwerken van de gegevens

Chi-kwadraattafel

Vrijheids-graden

Kans op voorkomen

.10 .5 .02 .011 2.706 3.841 5.412 6.6352 4.605 5.991 7.824 9.2103 6.251 7.815 9.837 11.3454 7.779 9.488 11.688 13.2775 9.236 11.070 13.388 15.0866 10.345 12.592 15.033 16.8127 12.017 14.067 16.622 18.4758 13.362 15.507 18.168 20.0909 14.684 16.919 19.679 21.66610 15.987 18.307 21.161 23.20911 17.275 19.657 22.618 24.725

Kritische waarden

12 18.549 21.026 24.054 26.217

13 19.812 22.362 25.472 27.688

14 21.064 23.685 26.873 29.141

15 22.307 24.996 28.259 30.578

16 23.542 26.296 29.633 32.000

17 24.769 27.587 30.995 33.409

18 25.989 28.869 32.346 34.805

19 27.204 30.144 33.687 36.191

20 28.412 31.410 35.020 37.566

21 29.615 32.671 36.343 38.932

22 30.813 33.924 37.659 40.289

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 29: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

29

Verwerken van de gegevens

Crossingvariabelen

Variabele I: Geslacht

Code 1Man

Code 2Vrouw

Totaal

Variabele II: Organisatie

Code 1Zelfstandig

247(88,2 %)

53(24,1 %)

300

Code 2Via reisbureau

33(11,8 %)

167(75,9 %)

200

Totaal 280 220 500

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 30: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

30

Verwerken van de gegevens

Normaalverdeling/z-waarden

z tussen –z en +z rechts van z+

0,8 57,62 21,19

1 68,26 15,87

1,2 76,98 11,51

1,28 80 10

1,4 83,84 8,08

1,6 89,04 5,48

1,645 90 5

1,8 92,82 3,59

1,96 95 2,5

2,0 95,44 2,28

2,1 96,42 1,79

2,2 94,22 1,39

2,3 97,86 1,07

Aantal waarnemingen op 100 tussen –z en +z in de normaalverdeling (tussen –z en +z) en rechts van +z

2,4 98,36 0,82

2,5 98,76 0,62

2,575 99 0,5

2,6 99,06 0,47

2,7 99,30 0,35

2,8 99,48 0,26

2,9 99,62 0,19

3 99,72 0,14

3,1 99,80 0,1

3,2 99,86 0,07

3,3 99,9 0,05

3,4 99,94 0,03

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 31: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

31

Verwerken van de gegevens

z-toets met 2 waargenomen %

=

sd=√ s12n1+ s22

n2

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 32: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

n = aantal waarnemingenmin (r-1, k-1) = minimum van r-1 en k-1r = aantal rijenk = aantal kolommen

32

Verwerken van de gegevens

Samenhand –V (Cramér)

V=√ X2

n×min(r−1 , k−1)

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 33: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

33

Verwerken van de gegevens

Correlatiecoëfficiënt

𝑟= ∑ 𝑥 ′ 𝑦 ′

∑ 𝑥 ′ ²∑ 𝑦 ′ ²

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 34: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

Regressierechte: y = a + bx

waarbij a = constante factor, interceptb = regressiecoëfficienty = afhankelijke variabelex = onafhankelijke variabele

34

Verwerken van de gegevens

Regressie

a=Y −b X b=∑ x ′ y ′

∑ x ′ ²

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 35: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

35

Verwerken van de gegevens

Regressie – voorbeeld (1)

Meting van het aantal verkooppunten en de opbrengst/hoofd per district

Tijdstip Prijs Volume (x 1 000)

1 35 7,4

2 37 6,8

3 35 7,3

4 50 4,6

5 42 5,3

6 48 4,8

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 36: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

36

Verwerken van de gegevens

Regressie – voorbeeld (2)

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 37: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

37

Verwerken van de gegevens

Regressie – voorbeeld (3)

Berekeningen volgens de methode van de kleinste kwadraten

Tijdstip Prijs Volume x’ y’ x’² y’² x’y’

A (X 1000) ( (1 35 7,4 -6,17 1,37 38,03 1,87 -8,43

2 37 6,8 -4,17 0,77 17,36 0,59 -3,19

3 35 7,3 -6,17 1,27 38,03 1,60 -7,81

4 50 4,6 8,83 -1,43 78,03 2,05 -12,66

5 42 5,3 0,83 -0,73 0,69 0,54 -0,61

6 48 4,8 6,83 -1,23 46,69 1,52 -8,43

Gemiddelde 41,17 6,03 Sommatie

218,83 8,17 -41,13

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 38: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

Regressiecoëfficient:

Regressieconstante:

Regressierechte: y = 13,77128 – 0,18796xCorrelatiecoëfficient:

Determinatiecoëfficient: r2 = (-0,97260)2 = 0,94596538

Verwerken van de gegevens

Regressie – voorbeeld (4)

=

= 6,03 – (-0,18796) × 41,17 = 13,77128

= -0,9726

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©

Page 39: Marktonderzoek in rechte lijn deel 3 hoofdstuk 5_2014

• Titelblad• Samenvatting/Manager report/Executive summary• Introductie • Methodologie/onderzoeksopzet• Resultaten: rapportering van de data, van de gevonden

informatie• Besluit• Bijlagen

39

Verwerken van de gegevens

Het rapport – structuur

Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©