Methodologie & Statistiek I

Post on 17-Jan-2016

54 views 0 download

description

Methodologie & Statistiek I. Verband tussen twee variabelen. 3.2. miscellaneous. U kunt deze presentatie ook op uw eigen PC afspelen!. Gebruikmaken van internet: http://www.unimaas.nl/~stat. Education Health sciences Presentations of lectures. “op dit moment ……. beschikbaar Opening - PowerPoint PPT Presentation

Transcript of Methodologie & Statistiek I

Methodologie &

Statistiek I

Verband tussen twee variabelen

3.2

miscellaneous

U kunt deze presentatie ook op uw eigen PC afspelen!

Gebruikmaken van internet:http://www.unimaas.nl/~stat

EducationHealth sciences

Presentations of lectures

“op dit moment ……. beschikbaarOpening---Hoofdstuk 3 (Verband tussen …)---Powerpointviewer downloaden”

Deze diapresentatie werd vervaardigd door Michel Janssenvan de Capaciteitsgroep Methodologie en Statistiek.

De presentatie mag alleen worden gecopieerd voor eigen gebruik door studenten en medewerkers van de Universiteit Limburg in Maastricht.

Met eventuele op- en aanmerkingen kunt u terecht bij:

Universiteit MaastrichtCapaciteitsgroep M&SMichel JanssenPostbus 6166200 MD Maastricht michel.janssen@stat.unimaas.nl

Methodologie &

Statistiek I

Verband tussen twee variabelen

3.2

miscellaneous22 januari 2001

CIJFERS WEZEN OPEEN SIGNIFICANT POSITIEF VERBAND TUSSEN:

Aantal ooievaarsnesten en aantal geboortenin een bepaalde streek over een aantal jaren

Aantal jonge politie-agenten en aantal ongehuwde moeders in Londen over een aantaljaren

Aantal brandweerlieden en de totale waarde van de gefikte objecten in een regio over een aantal jaren

Kwaliteit handschrift en maat schoenen van50 kinderen

In 51 regio’s werd gekeken naar het aantalziekenhuisbedden per 1000 inwoners (=BED)en het aantal Ziekenfonds-opnamen per 1000Inwoners (ZF_OPN).

Er wordt een puntenwolk gemaaktvan BED tegen ZF_OPN

BED

987654321

ZF

_O

PN

160

140

120

100

80

60

40

De regressie-lijn wordt berekend:

ZF_OPN = 37.9 + 13.1BED

Hoeveel ZF_OPN mogen worden verwachtin een regio met BED = 5 ?????

103.40

De regressie-lijn wordt berekend:

ZF_OPN = 37.9 + 13.1BED

Hoeveel ZF_OPN mogen worden verwachtin een regio met BED = 0 ?????

37.9COMMENTAAR???

Populatie A (X en Y)steekproeven van n stuks:r, b0 en b1

r, b0 en b1

r, b0 en b1

r, b0 en b1

r, b0 en b1

………………

Kijken naar de verdeling vanr (schatter van b0 (schatter van 0)b1 (schatter van 1)

Populatie A (X en Y)steekproef: rA= 0.80

Populatie B (X en Y)steekproef: rB= 0.50

Samenhang X en Y in populatie: A en B

A > B

Populatie A (X en Y)steekproef: rA= 0.80

Populatie B (X en Y)steekproef: rB= 0.50

Samenhang X en Y in populatie: A en B

A > B

Zelfde antwoord als na= 10 en nb=10000

tekenvan b1 en r

sd(x) is altijd positiefsd(y) is altijd positief

Dus: ri-coeff sd-lijn is altijd POSITIEF?????

richtings-coefficient sd-lijn is positiefcorrelatiecoefficient is negatief

ri-coeff regressielijn= r * ri-coeff sd-lijn

Dus: ri-coeff regressielijn is NEGATIEF ??????

Bereken r uit r2

r is positief of negatief ????

regressielijn Y= b0 + b1X

teken van correlatiecoefficient is teken van b1 !!!!!

Scatterplot van uitgebrachte stemmenop Gore en Buchanan

in de67 kiesdistricten van Florida

GORE

4000003000002000001000000

BU

CH

AN

AN

4000

3000

2000

1000

0

50

GORE

4000003000002000001000000

BU

CH

AN

AN

4000

3000

2000

1000

0

50Palmbeach…………

Model R R SquareAdjustedR Square

Std Error of the

Estimate

1 0.913 0.833 0.830 23.5341

Predictors: (Constant), Gore_TH

Model

ModelSum ofSquares df

MeanSquare F Sig.

RegressionResidualTotal

179620.036000.6

215620.6

16566

179620.0

553.9

324.31

0.000

ANOVA

Predictors: (Constant), Gore_THDependent Variable: Bush_TH

Model

UnstandardizedCoefficients

StandardizedCoefficients

B Std. Error Beta t Sig.

ConstantGore_TH

13.2200.696

3.3290.039 0.913

3.97118.01

0.0000.000

Dependent Variable: Bush_TH

Coefficients

ModelSum ofSquares df

MeanSquare F Sig.

RegressionResidualTotal

179620.036000.6

215620.6

16566

179620.0

553.9

324.31

0.000

ANOVA

r2 var(y)

ModelSum ofSquares df

MeanSquare F Sig.

RegressionResidualTotal

179620.036000.6

215620.6

16566

179620.0

553.9

324.31

0.000

ANOVA

r2 = 179620.0/215620.6= 0.83var(y) = 215620.6/66= 3266.98

Voor de echte puzzelaars:

Bereken uit de totale regressie-uitvoer devariantie van X

Voor de echte puzzelaars:

Bereken uit de totale regressie-uitvoer devariantie van X

b1= r * sd(y) / sd(x)

Het leek ons interessant de scores van de eerste toets (januari)te vergelijken met descores van de tweede toets (mei)

alle eerste jaars (jaargang 1999)

MS11

121086420-2

MS

12

10

8

6

4

2

0

-2Commentaar?

1546

14 139

(listwise deletion)

Eerste toets Tweede toets

lager dan 5.0groter/gelijk 5.0gemiddelde

34313

7.49

163171

5.00

Correlatie-coefficient 0.30

Regressie-lijn: MS12= 2.91 + 0.27*MS11

Commentaar?