Deel 3 – Hoe pak ik een kwantitatief onderzoek aan?
Marktonderzoek in rechte lijn
2
Het verwerken van de gegevens
Hoofdstuk 5
• Editing• Coderen• Meetniveaus• Datamatrix
3
Verwerken van de gegevens
Gegevenscontrole en -bewerking
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
• Volledigheid• Begrijpelijkheid• Consistentie• Eenvormigheid
4
Verwerken van de gegevens
Editing
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
• Kwalitatieve of niet-metrische data(aanduidingen en kwalificaties)– nominaal meetniveau– ordinaal meetniveau
• Kwantitatieve of metrische data (verschillen en hoeveelheden)– intervalmeetniveau– ratiomeetniveau
5
Verwerken van de gegevens
Meetniveaus
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
6
Verwerken van de gegevens
Toegelaten statistische bewerkingenMeetniveau Toegestane bewerkingen Grafische voorstelling
Nominaal procentenfractiesmodus
staafdiagramcirkeldiagram
Ordinaal procentenfractiesmodusmediaankwantielenkwartielschattingkwartielafstandminimummaximumbereik
staafdiagramcirkeldiagram
Interval en ratio procentenfractiesmodusmediaangemiddeldestandaardafwijkingvariantiekwantielenkwartielschattingkwartielafstandminimummaximumbereik
staafdiagramcirkeldiagramlijndiagramhistogramspreidingsdiagram of scatterplotfrequentiepolygoonstem en leaf diagramboxplot (box and whisker diagram)
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
Vraag 1 Geslacht?Man 1Vrouw 2
Vraag 2 Leeftijd?< 25 jaar 125-44 245-64 3> 65 4
Vraag 3 Belangrijkste vervoermiddel om naar hier te komen?Auto 1Autobus 2Trein 3Vliegtuig 4Schip 5
7
Verwerken van de gegevens
Datamatrix (1)
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
Vraag 4 Welke streken zult u bezoeken?Kust 1 of 2Grote steden 1 of 2Ardennen 1 of 2Kempen 1 of 2
Vraag 5 Hoe werd uw reis georganiseerd?Ik heb alles zelf geregeld 1Volledig via een reisbureau 2
Vraag 6 Hoe lang zal uw verblijf duren?< 1 week 11 à 2 weken 2> 2 weken 3
8
Verwerken van de gegevens
Datamatrix (2)
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
Rij/Kolom1 2 3 4 5 6 7 8 910
1 001 2 1 3 1 1 1 2 12
2 002 2 4 2 2 2 1 1 21
3 003 1 3 5 2 1 2 1 13
4 004 1 2 1 1 2 1 2 11
5 005 2 1 4 1 2 1 1 21
...
...
...500 500 2 4 3 2 1 2 2 2
19
Verwerken van de gegevens
Datamatrix (3)
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
• Vergelijking kenmerken populatiesamenstelling en steekproef
• Criterium moet beschikbaar zijn voor populatie én steekproef
• Samenstelling moet niet exact dezelfde→ steekproefgegevens ‘trillen’
• Objectieve beoordeling→ statistiek: chi-kwadraat test
10
Verwerken van de gegevens
Representativiteitscontrole
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
• Verschillen tussen twee frequentietabellen samengevat in chi-kwadraat waarde
• Fo = de geobserveerde frequentie Fe = de verwachte frequentie
11
Verwerken van de gegevens
Chi-kwadraat (1)
=
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
• Twee hypothesen– Ho: de twee frequentieverdelingen verschillen niet werkelijk van elkaar,
het geconstateerde verschil is te wijten aan het toeval van de steekproeftrekking en is dus te verwaarlozenSymbolisch: Fe = Fo
– H1: de waargenomen waarden verschillen zo sterk van de verwachte, dat we vermoeden dat ze uit een andere populatie komenSymbolisch: Fe ≠ Fo.
• Vrijheidsgraden• Overschrijdingskans
12
Verwerken van de gegevens
Chi-kwadraat (2)
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
Populatiesamenstelling ≠ steekproefsamenstelling …
→ principieel/statistisch: steekproef verwerpen
→ in praktijk: steekproef corrigeren = herwegen
13
Verwerken van de gegevens
Representativiteitscorrectie
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
• Centrale tendensmaten– rekenkundig gemiddelde– mediaan– modus
• Welke?– nominaal → modus– ordinaal → mediaan– interval of ratio → rekenkundig gemiddelde
14
Verwerken van de gegevens
Samenvatten, verklaren en begrijpen
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
• Modus→ waarneming die meest voorkomt
• Mediaan→ middelste waarneming (rangschiking!)→ bij continue gegevens:
15
Verwerken van de gegevens
Centrale tendensmaten - formules
× i
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
• Rekenkundig gemiddelde
16
X=f 1 X1+ f 2X 2+… f k X k
n
X=∑i=1
k
f i X i
n
Verwerken van de gegevens
Centrale tendensmaten - formules
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
• Spreidingsbreedte, variatiebreedte, ‘range’
• (Inter)kwartielafstand → afstand tussen Q1 en Q3
• Variantie
17
Verwerken van de gegevens
Spreidingsmaten (1)
R=X max− Xmin
s2=f 1 (X 1− X ) ²+ f 2 ( X2−X ) ²+…+ f k (X k−X ) ²
n
=
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
• Standaardafwijking of -deviatie
• Efficiency− gemiddelde delen door standaardafwijking− hoe groter, hoe ‘efficiënter’− maat voor bruikbaarheid van het gemiddelde
18
Verwerken van de gegevens
Spreidingsmaten (2)
s=√ f 1 (X 1− X )2+ f 2 ( X2− X )2+…+ f k (X k− X ) ²n
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
19
Verwerken van de gegevens
Vergelijking kengetallen ligging en spreidingVoordelen Nadelen
Gemiddelde Gebruikt alle meetuitkomstenAlleen voor variabelen op interval- of rationiveau
Gevoelig voor extreme waardenNiet te berekenen voor verdelingen met open klassen
Mediaan Ook voor ordinaal geschaalde variabelenOok voor verdelingen met open klassenWeinig gevoelig voor hoge of lage waarden
Informatieverlies: alleen de grootte van de middelste uitkomst speelt een rolHet ordenen van de uitkomsten vergt tijd
Modus Ook voor nominaal geschaalde variabelenOok voor open klassenWeinig rekenwerkGoede maat bij eentoppige en symmetrische verdelingen
Zeer onstabiele maatLigging wordt bepaald door de gekozen klassenindelingEr kan meer dan een modus voorkomenInformatieverliesWeinig gevoelig voor extremen
Variatiebreedte Weinig rekenwerk Ruwe maatstafZeer onstabielGebruikt weinig informatie
Kwartielafstand Stabieler dan variatiebreedteOok voor open klassen en ordinaal geschaalde variabelen
Mist de eenvoud van de variatiebreedteGebruikt minder informatie dan de standaardafwijking
Standaardafwijking & variantie
Gebruikt zoveel mogelijk infoVerandert niet als alle getallen met een vast bedrag worden verhoogd of verlaagdBelangrijkste maatstaf
Veel (manueel) rekenwerkAlleen voor interval- of ratioschaalNiet te berekenen voor verdelingen met open klassen
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
‘Hoe lang zal uw verblijf in België duren?’ (n=500)
Code Aantal %(absolute freq.) (relatieve freq.)
1 (minder dan 1 week) 308 62 2 (1 à 2 weken) 160 32 3 (meer dan 2 weken) 32 6 Totaal 500 100
gemiddelde waarde → modusgrafische voorstelling → staafdiagram
20
Verwerken van de gegevens
Frequentietabellen
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
• Frequenties volgens verschillend criteria gesplitst in kolommen
• Gebruikelijk– vermoedelijke oorzaak = hoofding kolommen– vermoedelijk gevolg = titel rij– % berekenen in richting oorzaak
21
Verwerken van de gegevens
Kruistabellen
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
Oorzaak en gevolgEffect van de reclame op de merkbekendheid - absolute frequenties
voor campagne na campagnetestmarkt
recall 450 320geen recall 300 80totaal 750 400
controlemarktrecall 150 160geen recall 350 340totaal 500 500
22
Verwerken van de gegevens
Kruistabellen – voorbeeld (1)
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
Effect van de reclame op de merkbekendheid - relatieve frequenties (%)
voor campagne na campagne
testmarktrecall 60 80geen recall 40 20totaal 100 100
controlemarktrecall 30 32geen recall 70 68totaal 100 100
23
Verwerken van de gegevens
Kruistabellen – voorbeeld (2)
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
24
Verwerken van de gegevens
Toetsen van onderzoeksuitkomsten
1 Formuleer de nulhypotheses↓
2 Specificeer (naar keuze) het significantieniveau
↓
3 Bepaal de te gebruiken significantietest
↓
4 Bereken de waarde van de toetsingsgrootheid
↓
5 Bepaal de overschrijdingskans voor de waargenomen data
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
25
Verwerken van de gegevens
Overzicht significantietests
Onafhankelijke variabele Nominaal Ordinaal Interval of ratio
Nominaal (dichotomisch)
Kruistabel + -test Mann-Whitney t-toets*
Nominaal (niet-dichotomisch)
Kruistabel + -test Kruskal-Wallis ANOVA**
Ordinaal Rangcorrelatie Rangcorrelatie
Interval of ratio Pearsons correlatie***
Afhankelijke variabele
* Hier kun je ook de ANOVA gebruiken, maar de t-test is speciaal ontworpen voor het vergelijken van twee groepen. Als het een kleine steekproef is en de afhankelijke variabele niet normaal verdeeld is, dan wordt de Mann-Whitney-test toegepast.** Als het een kleine steekproef is en de afhankelijke variabele niet normaal verdeeld is, dan gebruiken we de Kruskal-Wallis-test.*** Als het een kleine steekproef is en één van de variabelen niet normaal verdeeld is, dan gebruiken we rangcorrelatie.
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
26
Verwerken van de gegevens
Kritische waarden, acceptatie- en verwerpingsgebied
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
• Representativiteitscontrole– verschilt de waargenomen frequentieverdeling
significant van de theoretisch verwachte?• Significante verbanden
– toetsen van het potentieel verband tussen 2 niet-metrische variabelen
27
Verwerken van de gegevens
Chi-kwadraattest
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
28
Verwerken van de gegevens
Chi-kwadraattafel
Vrijheids-graden
Kans op voorkomen
.10 .5 .02 .011 2.706 3.841 5.412 6.6352 4.605 5.991 7.824 9.2103 6.251 7.815 9.837 11.3454 7.779 9.488 11.688 13.2775 9.236 11.070 13.388 15.0866 10.345 12.592 15.033 16.8127 12.017 14.067 16.622 18.4758 13.362 15.507 18.168 20.0909 14.684 16.919 19.679 21.66610 15.987 18.307 21.161 23.20911 17.275 19.657 22.618 24.725
Kritische waarden
12 18.549 21.026 24.054 26.217
13 19.812 22.362 25.472 27.688
14 21.064 23.685 26.873 29.141
15 22.307 24.996 28.259 30.578
16 23.542 26.296 29.633 32.000
17 24.769 27.587 30.995 33.409
18 25.989 28.869 32.346 34.805
19 27.204 30.144 33.687 36.191
20 28.412 31.410 35.020 37.566
21 29.615 32.671 36.343 38.932
22 30.813 33.924 37.659 40.289
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
29
Verwerken van de gegevens
Crossingvariabelen
Variabele I: Geslacht
Code 1Man
Code 2Vrouw
Totaal
Variabele II: Organisatie
Code 1Zelfstandig
247(88,2 %)
53(24,1 %)
300
Code 2Via reisbureau
33(11,8 %)
167(75,9 %)
200
Totaal 280 220 500
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
30
Verwerken van de gegevens
Normaalverdeling/z-waarden
z tussen –z en +z rechts van z+
0,8 57,62 21,19
1 68,26 15,87
1,2 76,98 11,51
1,28 80 10
1,4 83,84 8,08
1,6 89,04 5,48
1,645 90 5
1,8 92,82 3,59
1,96 95 2,5
2,0 95,44 2,28
2,1 96,42 1,79
2,2 94,22 1,39
2,3 97,86 1,07
Aantal waarnemingen op 100 tussen –z en +z in de normaalverdeling (tussen –z en +z) en rechts van +z
2,4 98,36 0,82
2,5 98,76 0,62
2,575 99 0,5
2,6 99,06 0,47
2,7 99,30 0,35
2,8 99,48 0,26
2,9 99,62 0,19
3 99,72 0,14
3,1 99,80 0,1
3,2 99,86 0,07
3,3 99,9 0,05
3,4 99,94 0,03
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
31
Verwerken van de gegevens
z-toets met 2 waargenomen %
=
sd=√ s12n1+ s22
n2
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
n = aantal waarnemingenmin (r-1, k-1) = minimum van r-1 en k-1r = aantal rijenk = aantal kolommen
32
Verwerken van de gegevens
Samenhand –V (Cramér)
V=√ X2
n×min(r−1 , k−1)
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
33
Verwerken van de gegevens
Correlatiecoëfficiënt
𝑟= ∑ 𝑥 ′ 𝑦 ′
∑ 𝑥 ′ ²∑ 𝑦 ′ ²
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
Regressierechte: y = a + bx
waarbij a = constante factor, interceptb = regressiecoëfficienty = afhankelijke variabelex = onafhankelijke variabele
34
Verwerken van de gegevens
Regressie
a=Y −b X b=∑ x ′ y ′
∑ x ′ ²
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
35
Verwerken van de gegevens
Regressie – voorbeeld (1)
Meting van het aantal verkooppunten en de opbrengst/hoofd per district
Tijdstip Prijs Volume (x 1 000)
1 35 7,4
2 37 6,8
3 35 7,3
4 50 4,6
5 42 5,3
6 48 4,8
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
36
Verwerken van de gegevens
Regressie – voorbeeld (2)
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
37
Verwerken van de gegevens
Regressie – voorbeeld (3)
Berekeningen volgens de methode van de kleinste kwadraten
Tijdstip Prijs Volume x’ y’ x’² y’² x’y’
A (X 1000) ( (1 35 7,4 -6,17 1,37 38,03 1,87 -8,43
2 37 6,8 -4,17 0,77 17,36 0,59 -3,19
3 35 7,3 -6,17 1,27 38,03 1,60 -7,81
4 50 4,6 8,83 -1,43 78,03 2,05 -12,66
5 42 5,3 0,83 -0,73 0,69 0,54 -0,61
6 48 4,8 6,83 -1,23 46,69 1,52 -8,43
Gemiddelde 41,17 6,03 Sommatie
218,83 8,17 -41,13
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
Regressiecoëfficient:
Regressieconstante:
Regressierechte: y = 13,77128 – 0,18796xCorrelatiecoëfficient:
Determinatiecoëfficient: r2 = (-0,97260)2 = 0,94596538
Verwerken van de gegevens
Regressie – voorbeeld (4)
=
= 6,03 – (-0,18796) × 41,17 = 13,77128
= -0,9726
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
• Titelblad• Samenvatting/Manager report/Executive summary• Introductie • Methodologie/onderzoeksopzet• Resultaten: rapportering van de data, van de gevonden
informatie• Besluit• Bijlagen
39
Verwerken van de gegevens
Het rapport – structuur
Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB ©
Top Related