Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op...

46
Statistiek: Samenvatting Hoofdstuk 1: Doel van de statistiek 1.2 Verzamelen van gegevens Variabelen= de verschillende eigenschappen die worden gemeten 1.3 Classificatie van gegevens Uitkomstenverzameling= de aard en omvang van de uitkomsten die gemeten kunnen worden 1.3.1 Kwalitatieve en kwantitatieve gegevens Kwalitatieve - Nominaal: de niveaus zijn ne te interpreteren in termen van meer en minder. Ze kunnen wel gebruikt worden om te bepalen of de elementen al dan niet gelijk zijn. - Ordinaal: de elementen van de uitkomstenverzameling kunnen geordend worden volgens een bepaald ordeningscriterium. Kwantitatief - Metrisch: het is mogelijk om verschillen aan te duiden in termen van meer of minder maar ook om aan te geven hoeveel meer of minder. 1.3.2 Discrete en continue gegevens Discrete gegevens - Het is niet mogelijk om tussen om het even welke twee opeenvolgende waarden van de uitkomstenverzameling een derde te denken. Bij een discreet kenmerk is het aantal elementen eindig. - Kwalitatieve gegevens zijn steeds discreet Continue gegevens - Het is mogelijk om voor elke twee willekeurige waarden uit de uitkomstenverzameling een derde mogelijke uitkomst te vinden. Het aantal elementen van de uitkomstenverzameling is oneindig 1.4 Van steekproef naar populatie Het steekproefgemiddelde is slechts een benadering voor het populatiegemiddelde. Om een uitspraak te doen over het populatiegemiddelde moeten we daarom een idee hebben an de maximale afwijking die kan optreden tussen het steekproefgemiddelde en het echte populatiegemiddelde.

Transcript of Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op...

Page 1: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters

Statistiek: Samenvatting Hoofdstuk 1: Doel van de statistiek 1.2 Verzamelen van gegevens Variabelen= de verschillende eigenschappen die worden gemeten 1.3 Classificatie van gegevens Uitkomstenverzameling= de aard en omvang van de uitkomsten die gemeten kunnen worden1.3.1 Kwalitatieve en kwantitatieve gegevens Kwalitatieve

- Nominaal: de niveaus zijn ne te interpreteren in termen van meer en minder. Ze kunnen wel gebruikt worden om te bepalen of de elementen al dan niet gelijk zijn.

- Ordinaal: de elementen van de uitkomstenverzameling kunnen geordend worden volgens een bepaald ordeningscriterium.

Kwantitatief - Metrisch: het is mogelijk om verschillen aan te duiden in termen van meer of minder

maar ook om aan te geven hoeveel meer of minder. 1.3.2 Discrete en continue gegevens Discrete gegevens

- Het is niet mogelijk om tussen om het even welke twee opeenvolgende waarden van de uitkomstenverzameling een derde te denken. Bij een discreet kenmerk is het aantal elementen eindig.

- Kwalitatieve gegevens zijn steeds discreetContinue gegevens

- Het is mogelijk om voor elke twee willekeurige waarden uit de uitkomstenverzameling een derde mogelijke uitkomst te vinden. Het aantal elementen van de uitkomstenverzameling is oneindig

1.4 Van steekproef naar populatie Het steekproefgemiddelde is slechts een benadering voor het populatiegemiddelde. Om een uitspraak te doen over het populatiegemiddelde moeten we daarom een idee hebben an de maximale afwijking die kan optreden tussen het steekproefgemiddelde en het echte populatiegemiddelde.

Page 2: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters

Hoofdstuk 2: Beschrijvende statistiek 2.1 Absolute en relatieve frequenties2.1.1 Staafdiagram voor een kwalitatieve variabele Absolute frequentie: het aantal uitkomsten in de steekproef tellen Relatieve frequentie= de absolute frequentie die op eenzelfde schaal gezet wordt.

- Worden ook wel de steekproefproporties genoemd Een frequentietabel kan grafisch worden weergegeven met een staafdiagram. 2.1.2 Histogram voor een kwantitatieve variabele Bij kwantitatieve gegevens kan de uitkomstenverzameling ofwel een eindig aantal, ofwel een oneindig aantal elementen bevatten. Bij gegevens die horen bij een continue variabele of een discrete variabele met een oneindig aantal elementen in de uitkomstenverzameling, kunnen we niet meer op deze manier te werk gaan Het histogram is de continue tegenhanger van het staafdiagram. Vaste regels voor het vastleggen van het aantal klassen en het klassenmidden bestaan niet. Als vuistregel hanteert men dat men een compromis moet vinden tussen te veel of te weinig klassen. Histogrammen gebaseerd op frequentiedichtheden stellen relatieve frequenties voor door middel van oppervlaktes, niet in termen van hoogtes. 2.2 Vormen van verdelingenHet patroon in een histogram is een weerspiegeling van de verdeling van de beschikbare steekproefgetallen. 2.2.1 Symmetrische verdelingen Symmetrische verdelingen gedragen zich op dezelfde wijze aan de linkse en rechtse zijde van de figuur. Het histogram gaat over in zichzelf indien men de figuur horizontaal spiegelt om het midden. Een dergelijke perfectie bij resultaten van toeval experimenten kan men niet verwachten. 2.2.2 Normale verdelingsvormEr bestaan verschillende type van symmetrische verdelingen

- Vlakke- Minimum in het midden - Maximum in het midden

Een bijkomend kenmerk van deze vorm is da ze langs beide zijden van de top in verschillende stapjes afneemt. En naarmate de steekpoefgrootte toeneemt begint het histogram meer en meer op een klokcurve te lijken. Dat is de normale verdeling. 2.2.3 Andere verdelingsvormen

- Scheve verdelingen o Indien een verdeling aan één zijde trager neervalt of afzwakt spreken we van

een scheve verdeling - Verdelingen met zware staarten

o Een verdeling kan symmetrisch zijn maar toch niet normaal - Verdelingen met licht staarten - Bimodale verdelingen (2 toppen)

Page 3: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters

- Uitschieters o Te kleine of te grote waarden voor de meerderheid van de getallen

2.3 Cumulatieve frequenties en kwantielen 2.3.1 Cumulatieve verdelingsfunctie In het algemeen bepalen we de cumulatieve verdelingsfunctie in een waarde x als het relatief aantal steekproefuitkomsten xi die niet groter zijn dan x. Dit wordt genoteerd als:

-o N= steekproefgrootte

Indien er geen samenvallende waarden zijn:

-Dit betekent dat de verdelingsfunctie aan elke observatie de rang ervan toekent, gedeeld door de steekproefomvang. 2.3.2 Kwantielfunctie Terwijl Fn voor elk reëel getal x een relatieve frequentie of percentage p oplevert, kunnen we ons ook de omgekeerde vraag stellen. Dit betekent dat we de inverse functie van de cumulatieve verdelingsfunctie willen bepalen= de kwantielfunctie Qn.

-

2.4 Centrumkenmerken 2.4.1 Steekproefgemiddelde

-

-o K= aantal mogelijke uitkomsten o Mj= de mogelijke uitkomsten o Nj= absolute frequentie van mj

o Fj,n= de relatieve frequentie - Het gemiddelde is erg gevoelig aan uitschieters

2.4.2 Mediaan Als robuust alternatief voor het gemiddelde kan de steekproefmediaan gebruikt worden. Deze maat geeft de middelste. Waarde van de geordende steekproef aan. Preciezer geformuleerd komt dit neer op het punt waar evenveel steekproefelementen links en rechts ervan te vinden zijn.

-- Voor symmetrische verdelingen is het gemiddelde en de mediaan ongeveer gelijk - Voor asymmetrische verdelingen gaat dit niet op. - Minder gevoelig voor uitschieters

Page 4: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters

2.4.3 Getrimd gemiddelde Als tussenoplossing stelt met het getrimde gemiddelde voor. Men neemt een vast percentage van de kleinste en de grootste gegevens weg uit de gegevensverzameling en men berekent het gemiddelde van de resterende gegevens. Er is dan nog een beïnvloeding door de punten in de buurt van het centrum van e puntenverdeling, maar de vaak negatieve rol die door uitschieters wordt gespeeld, wordt tenietgedaan. Een nadeel van deze methode is dan weer dat we op voorhand het trimmingspercentage moeten vastleggen.

2.4.4 Modus De modus is het element uit de uitkomstenverzameling dat het meest voorkomt in de steekproef.

2.5 Spreidingskenmerken Een centrummaat alleen verschafte weinig informatie omtrent de verdeling van de steekproefgegevens. 2.5.1 BereikHet bereik geeft de afstand weer tussen de grootste en de kleinste waarneming

-Het bereik maakt enkel gebruik van twee waarnemingen, de grootste en de kleinste. Het bereik is dat ook weinig informatief en erg gevoelig aan uitschieters. 2.5.2 Standaardafwijking en variantie Uitgaande van een zekere centrummaat kan men globale spreidingskenmerken verkrijgen door de afstand tussen elke meetwaarde en die centrummaat te bepalen en vervolgens een centrumkenmerk te beschouwen van al die afstanden. Zo zou men de gemiddelde afstand tot het gemiddelde kunnen gebruiken.

-In de praktijk wordt dit echter niet gebruikt. In plaats daarvan kwadrateert men eerst de verschillen ( ) om ze nadien uit te middelen en de vierkantswortel van dit gemiddelde te berekenen

- = Steekproefafwijking

- = Variatie In geval van discrete gegevens kan s ook berekend worden als:

-Z-Score:

-- += waarde boven het gemiddelde

Page 5: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters

- -= waarde onder het gemiddelde

2.5.3 InterkwartielafstandEen spreidingsmaat die behoorlijk minder gevoelig is aan uitschieters, is de interkwartielafstand.

- - Niet gevoelig voor uitschieters

Als n voldoende groot is, is de IQR/s= 1.34 bij een normale verdeling 2.5.4 Median Absolute Deviation Men berekent eerst de afstand van elke observatie tot de mediaan en beschouwt dan de mediaan van al deze afstanden. Bij symmetrisch verdelingen blijkt de IQR ongeveer het dubbele te zijn van de MAD. Bij een normale verdeling van voor een n die voldoende groot is, is de MAD/s= 0,67

-

2.6 Boxplot Overzicht van de belangrijkste kenmerken van een verdeling De Box start bij het eerste kwartiel en loopt tot het derde kwartiel

- Lengte van de doos is dus IQR - Bevat de waarde van de mediaan

2.7 Transformaties 2.7.1 Lineaire transformaties Een lineaire transformatie is van de vorm:

- Met dit soort transformatie worden de gegevens verschoven over een afstand a en herschaald met een factor b. Het verschuiven van gegevens heeft geen effect op spreidingsmaten.

2.8 Verbanden tussen twee variabelen 2.8.1 Twee kwalitatieve variabelen Het verband tussen twee kwalitatieve variabelen kan worden weergegeven in een kruitabel. Zo’n tabel wordt opgebouwd door te tellen hoe vaak elke combinatie van twee variabele in de steekproef voorkomt. Dit zijn absolute frequenties. Bovendien worden er rij- en kolomtotalen aan de tabel toegevoegd.

Page 6: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters

-2.8.2 en kwantitatieve en een kwalitatieve variabele Wanneer we een kwalitatieve en een kwantitatieve variabele met eindige uitkomstenverzameling beschouwen, kunnen we opnieuw de technieken uit de vorige sectie hanteren. Beschouwen we een kwalitatieve en een kwantitatieve variabele met een oneindige uitkomstenverzameling gebruiken we dezelfde technieken. 2.8.3 Twee kwantitatieve variabelen Wanneer we een verband tussen twee kwantitatieve variabelen willen visualiseren kunnen we een histogram in drie dimensies maken. Hiervoor worden de twee variabelen opgedeeld in klassen en geven we voor elke combinatie van klassen aan het vaak die voorkomt met behulp van frequenties. Een bivariaat histogram beschrijft dus de verdeling van uitkomsten van twee variabelen samen 2.8.4 Covariantie en correlatiecoëfficiënt Naast de voorstelling met een histogram kunnen we metrische variabelen ook in twee dimensies weergeven dankzij een puntenwolk of spreidingsdiagram. Voor elke observatie plaatsen we op de horizontale as de meting voor de ene variabele en op de verticale as de meting voor de andere variabele.

- Richting van de samenhang o Positief: puntenwolk stijgt naar rechts o Negatief: puntenwolk daalt

- Sterkte van de samenhang o Zwakke associatie: ronde puntenwolk o Sterke associatie: duidelijk lineair patroon in de puntenwolk

Steekproefcovariantie drukt uit in welke mate twee kwantitatieve kenmerken gezamenlijk variëren.

-- Eigenschappen

o Symmetrische maat voor samenhang o De covariantie van x met zichzelf is de variantie van x o Teken van de covariantie heeft informatie over de richting

Positief: positieve samenhang (laag-laag, hoog-hoog) Negatief: negatieve samenhang (laag-hoog, hoog-laag)

o Absolute waarde is weinig informatief over de sterkte van de samenhang Hangt af van meeteenheid

Page 7: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters

o Oplossing interpretatieprobleem Covariantie herschalen: delen door de standaarddeviatie van x en y Deviatiescores worden uitgedrukt in aantallen standaarddeviaties Pearson correlatiecoëfficiënt

Eigenschappen

o Ligt in interval -1,1 o Positieve waarden= positieve samenhang o Negatieve waardne= negatieve samenhang o Hoe sterker de lineaire samenhang hoe dichter bij -1 of

1 o Correlatiecoëfficiënt tussen X en Y is gelijk aan die

tussen Y en X o Perfect positieve samenhang: r=1 o Perfect lineaire samenhang: r= -1 o Indien geen lineaire samenhang r=0o Correlatie tussen lineaire getransformeerde variabelen

is gelijk aan de oorspronkelijke correlatie 2.8.5 Spearman correlatiecoëfficiënt De Pearson correlatie steunt op gemiddeldes en standaarddeviaties

- Enkel metrische kenmerken - Gevoeliger voor uitschieters

Spearman biedt dan volgend alternatief - Metingen van X en Y vervangen door hun rangnummers - Beide variabelen ordenen en kleinste meting krijgt rang 1 - Twee gelijke metingen: knoop: krijgen gemiddeldes van de rangen - Spearman rangcorrelatie coëfficiënt= Pearson coëfficiënt op de rangen - Rangen delen door n heeft geen invloed - Ordinale variabelen

Eigenschappen - Waarden in -1,1 - De mate waarin twee variabelen een stijgende curve tonen wanneer ze worden

uitgezet in een puntenwolk o Geen lineaire stijging

- Transformatie die geen impact hebben op de rangordes hebben geen impact op Rs - Als r dicht bij 1 of -1 ligt zal Rs ook groot en respectievelijk klein zijn

o Lineariteit impliceert sterke samenhang van rangen maar sterke samenhang van rangen impliceert geen lineariteit

2.9 Lineaire regressie De correlatiecoëfficiënt is een maat om het lineair verband tussen twee kwantitatieve variabelen aan te duiden. Nu willen we dit lineair verband ook expliciet opstellen. We introduceren hiervoor de kleinstekwadratenmethode, die een regressierechte door de gegevens zal opleveren.

Page 8: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters

2.9.1 Kleinste kwadratenmethode De vergelijking van de rechte

-X en y stellen de veranderlijke voor. Waarbij x de verklarende of onafhankelijke variabele is en y de responsvariabele. De parameter b stelt de richtingscoëfficiënt voor van de rechte en a het intercept. De richtingscoëfficiënt geeft aan hoe y wijzigt indien x met één eenheid toeneemt. Het intercept a levert de waarde voor y bij x=0.

-

Hoofdstuk 3: Kansen en toevalsvariabelen 3.1 Kansen en kansregelsDe relatieve frequentie van een gebeurtenis A onder een groot aantal proeven stabiliseert naar een getal, de kans op die gebeurtenis.

Page 9: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters

3.2 Voorwaardelijke kansen 3.2.1 Onafhankelijkheid van gebeurtenissen Twee gebeurtenissen A en B zijn onafhankelijk als de kans op het voorkomen van de en e gebeurtenis A niet beïnvloed wordt door het al dan niet optreden van de andere gebeurtenis B, en omgekeerd. Als een lukraak experiment met teruglegging gebeurt, dan zijn de trekkingen onafhankelijk. Zonder teruglegging zijn de trekkingen afhankelijk. Definitie van voorwaardelijke kans:

-

3.3 Toevalsvariabele Een reële toevalsvariabele neemt numerieke waarden aan die overeenstemmen met de uitkomsten van een experiment dat onderhevig is aan het toeval.

3.4 Dichtheidsfunctie 3.4.1 Dichtheidsfunctie van een discrete toevalsvariabele Een dichtheidsfunctie van een discrete toevalsvariabele definieert alle mogelijke uitkomsten van de variabele en de bijhorende kansen. Bij een discrete toevalsvariabele kunnen we een opsomming maken van alle waarden in de uitkomstenverzameling. In het algemene geval, waarbij er k verschillende uitkomsten mogelijk zijn voor een toevalsvariabele X, stel m1,m2,….,mk, zal de verdeling van de variabele X volledig bekend zijn door de kennis van de kansen

Page 10: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters

3.4.2 Dichtheid van een continue toevalsvariabele Ook voor een continue toevalsvariabele zal de dichtheid gebruikt worden om aan te geven hoe waarschijnlijk elke uitkomst uit de uitkomstenverzameling binnen de populatie is. Een continue toevalsvariabele heeft een oneindig, continu verspreid, aantal mogelijke waarden op een interval. De kansdichtheid van een continue toevalsvariabele X is gedefinieerd door en curve, waarbij de kans dat X waarden aanneemt in een bepaald interval gegeven wordt door de oppervlakte onder de curve.

3.5 Verdelings- en kwantielfunctie 3.5.1 verdelings- en kwantielfunctie voor een discrete variabeleDefinitie verdelingsfunctie F(x):

- 3.5.2 Verdelings- en kwantielfunctie voor een continue variabele Ook voor een continue variabele wordt de verdelingsfunctie gedefinieerd als de kans dat een toevalsvariabele X een waarde aanneemt kleiner dan of gelijk aan een gegeven getal x:

-

3.6 Centrum- en spreidingskenmerken 3.6.1 Verwachtingswaarde

- 3.6.2 Mediaan Med(X)= Q(0.5) Deze definitie wordt zowel gebruikt voor discrete als continue toevalsvariabele. In tegenstelling tot de verwachtingswaarde bestaat de mediaan altijd! In het continue val is de kans op een waarde voor X die kleiner is dan de mediaan exact 50%, evenals de kans op een waarde die groter is dan de mediaan. 3.6.3 Modus Bij een uniforme verdeling bijvoorbeeld is de dichtheid constant en kan er geen modus gedefinieerd worden. Indien de modus bestaat, is deze bij symmetrische verdelingen gelijk aan de mediaan. Bij rechtsscheve verdelingen is de modus kleiner dan de mediaan.

-3.6.4 Variantie en standaardafwijking De standaarddeviatie van een toevalsvariabele, genoteerd met de parameter , is een maat voor de spreiding van de mogelijke uitkomsten.

Page 11: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters

3.6.5 Interkwartielafstand

3.7 Transformaties 3.7.1 Verwachtingswaarde bij een algemene transformatie 3.7.2 Lineaire transformaties In geval van een lineaire functie g(X)= a+ bX kan men eenvoudig de verwachtingswaarde en variantie van g(X) bepalen. Ook de mediaan en kwantielen kunnen eenvoudig bepaald worden.

3.8 covariantie, correlatie en onafhankelijkheid van twee variabelen 3.8.1 Covariantie en correlatie

3.8.2 onafhankelijkheid We noemen X en Y onafhankelijk indien bij het uitvoeren van een experiment de uitkomst van X geen invloed heeft op de uitkomst van Y en omgekeerd.

Page 12: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters

3.9 Lineaire combinaties van toevalsvariabelen

Page 13: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters

Hoofdstuk 4: univariate kansmodellen 4.1 Bernoulli verdeling Twee mogelijke uitkomsten 0 of 1 Kans op succes=p Kans op mislukking= 1-p E(x)= p Var(X)= p(1-p)

4.2 Binomiaalverdeling Wanneer een aantal identieke en onafhankelijke Bernoulli experimenten worden uitgevoerd, is het aantal keer dat de uitkomst 1 wordt geobserveerd binomiaal verdeeld.

- Elk experiment wordt een aantal keer (n) herhaald. - Elk experiment heeft twee mogelijke uitkomsten: “succes” (1) of “mislukking” (0)

(Bernoulli-experiment). - De kans op succes (p) is even groot in elk experiment. De experimenten zijn

onafhankelijk van elkaar. - We zijn geïnteresseerd in het aantal successen na n experimenten

Page 14: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters

4.3 Poisson verdeling Het berekenen van kansen volgens de binomiaalverdeling wordt dan echter problematisch wegens het optreden van zeer grot een zeer kleine getallen in de formule van de dichtheid. Met behulp van de Poisson verdeling zal deze kansberekening echter zeer eenvoudig zijn.

Page 15: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters

4.4 Normale verdeling 4.4.1 Definitie en kenmerken De curve van een normale verdeling is symmetrisch, klokvormig, enkan volledig worden bepaald door zijn gemiddelde µ ∈ R en zijnstandaarddeviatie σ > 0.

Page 16: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters

Hoofdstuk 5: Schatters en hun verdeling 5.1 Steekproefgemiddelde als toevalsvariabele Omdat de geobserveerde waarden in de steekproef onderhevig zijn aan het toeval, is ook de waarde van het steekproefgemiddelde onderhevig aan het toeval.

-

5.2 Verdeling van het steekproefgemiddelde De steekproefverdeling van een schatter is de kansverdeling van deze schatter.

Hoe groter n is, hoe kleiner de variantie

Page 17: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters

5.3 Centrale limietstelling

Vanaf n>30 is de CLT vrij accuraat

5.4 Normale benadering voor binomiaal kansen

Page 18: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters
Page 19: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters

Hoofdstuk 6: Univariate inferentie 6.1 Betrouwbaarheidsinterval voor het gemiddelde van een normale variabele

Page 20: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters

6.1.1 De variantie is bekend

6.1.2 De variantie is niet bekend

Page 21: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters

6.2 Testen omtrent het gemiddelde van een normale variabele 6.2.1 Rechtseenzijdige test

Page 22: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters

ALGEMEEN

Page 23: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters
Page 24: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters

Rechtseenzijdige test voor het gemiddelde van een variabele, onbekend Veronderstellingen/ voorwaarden nagaan

- Steekproef is willekeurig - Variabel eis kwantitatief - Steekproefgegevens komen uit een normale verdeling - De steekproef bevat geen uitschieters

Hypotheses opstellen

-Teststatistiek en verdeling ervan onder H0 bepalen

-Testwaarde berekenen

-P-Waarde berekenen

-Besluit formuleren

- Als P-waarde < alfa, dan H0 verwerpen op het alfa-significantieniveau en dus de alternatieve hypothese aanvaarden: je mag besluiten dat >0

- Als P-waarde > alfa, dan H0 niet verwerpen op het alfa-significantieniveau: je mag niet verwerpen dat < 0

6.2.3 Linkseenzijdige test

Page 25: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters

6.2.4 Tweezijdige test

Teststatistiek blijft dezelfde enkel de P-waarde dient verdubbelt te worden

Page 26: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters

6.2.6 De variantie is bekend

6.2.5 Type I fout en type II fout

Page 27: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters
Page 28: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters

6.3 Inferentie omtrent een proportie 6.3.1 Betrouwbaarheidsinterval voor een proportie

6.3.2 Testen omtrent een proportie

Page 29: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters

6.4 Testen van de verdeling van een discrete variabele

Page 30: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters
Page 31: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters

Hoofdstuk 7: Bivariate inferentie

7.1 Twee kwalitatieve variabelen 7.1.1 Inferentie omtrent twee proporties

Page 32: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters
Page 33: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters

7.1.2 Onafhankelijkheid van twee variabelen testen

Page 34: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters
Page 35: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters

7.2 Een kwantitatieve en een kwalitatieve variabele 7.2.1 Het gemiddelde van een variabele vergelijken voor twee groepen

Page 36: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters
Page 37: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters
Page 38: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters

7.2.2 De variantie van een variabele vergelijken voor twee groepen

Page 39: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters

7.3 Twee kwantitatieve variabelen 7.3.1 Het verschil van twee variabelen vergelijken

Page 40: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters
Page 41: Facultair Overlegorgaan Sociale Wetenschappen (FOSO) · Web viewDe Pearson correlatie steunt op gemiddeldes en standaarddeviaties Enkel metrische kenmerken Gevoeliger voor uitschieters