臨床心理統計研究法 第13-15回講義 -...

25
臨床心理統計研究法 13-15回講義 兵庫教育大学 20191130() 2-41

Transcript of 臨床心理統計研究法 第13-15回講義 -...

Page 1: 臨床心理統計研究法 第13-15回講義 - yu-yake.comnishidak.yu-yake.com/file/CPSTAT.05.pdf · 一元配置分散分析の計算手順 H 01 2 3: 0αα α= = = 手順. 0: 仮説を立てる.

臨床心理統計研究法第13-15回講義

兵庫教育大学

2019年11月30日(土) 第2-4限

1

Page 2: 臨床心理統計研究法 第13-15回講義 - yu-yake.comnishidak.yu-yake.com/file/CPSTAT.05.pdf · 一元配置分散分析の計算手順 H 01 2 3: 0αα α= = = 手順. 0: 仮説を立てる.

2

分散分析(ANOVA)

【例】生徒の学習形態の違いが, 課題の達成に影響するかどうかを調べるために, あらかじめ学力の等しい生徒をランダムにわけて, 3つのグループを構成した.グループ1では一斉指導, グループ2では体験学習, グループ3では仲間による討議学習を行った.授業終了後, 課題の到達度テストを実施したところ, 次の得点が得られた.三つの学習形態の間に有意差はあるか.

Analysis of Variance = ANOVA

Page 3: 臨床心理統計研究法 第13-15回講義 - yu-yake.comnishidak.yu-yake.com/file/CPSTAT.05.pdf · 一元配置分散分析の計算手順 H 01 2 3: 0αα α= = = 手順. 0: 仮説を立てる.

3

学習形態

一斉指導

グループ1

体験学習

グループ2

討議学習

グループ3

5 8 7

4 4 6

6 3 8

3 3 9

3 7 10

7 9 9

6 8 8

5 7 9

3 3 7

5 4 8平均 4.7 5.8 8.1サイズ 10 10 10

1要因

• 要因:学習形態の一つ

• 水準:一斉指導, 体験学習, 討論学習の三つ

• 水準間にデータの対応無し

• 各水準で標本サイズ(繰り返し数)は等しい

全平均 6.1

3水準

1 2 3

1, 2,3, , .α α α

グループ の母平均をそれぞれ

とする

Page 4: 臨床心理統計研究法 第13-15回講義 - yu-yake.comnishidak.yu-yake.com/file/CPSTAT.05.pdf · 一元配置分散分析の計算手順 H 01 2 3: 0αα α= = = 手順. 0: 仮説を立てる.

4

■問題を3つに分割し, 各問題でt検定を行う方法は間違いである.

問題1: 一斉指導と体験学習の間に, 得点の違いはあるか.

問題2: 体験学習と討議学習の間に, 得点の違いはあるか.

問題3: 討議学習と一斉指導の間に, 得点の違いはあるか.

0 1 2:H α α=

0 2 3:H α α=

0 3 1:H α α=

3

0.05 3

1 1 0.05 0.14 0.05 .− − =

理由:有意水準を とすると,検定を 回繰り返すうち,

どれか一つの検定結果に過誤が含まれる確率は,

( ) となり, より大きくなるから

Page 5: 臨床心理統計研究法 第13-15回講義 - yu-yake.comnishidak.yu-yake.com/file/CPSTAT.05.pdf · 一元配置分散分析の計算手順 H 01 2 3: 0αα α= = = 手順. 0: 仮説を立てる.

5

・一般の場合. 水準の数pが増えると, p分割した問題のどれか一つに過誤が含まれる確率は1に近づいていく.

( )Pr( )

lim 1 0.95 1p

p

p

→∞ = − =

分割した問題のどれか一つに過誤が含まれる

・分散分析:

3種類の学習形態の間に, 得点の違いはあるかという問題について検定を行う.ただし, 3種類のうち, どの形態の間に得点の差があるかどうかは, この方法では検出できない.

・多重比較法:どの水準の間に差があるのか検定を行う方法.

0 1 2 3

1 0

::

HH H

α α α= =

=の「 」が少なくとも一箇所で成り立たない

Page 6: 臨床心理統計研究法 第13-15回講義 - yu-yake.comnishidak.yu-yake.com/file/CPSTAT.05.pdf · 一元配置分散分析の計算手順 H 01 2 3: 0αα α= = = 手順. 0: 仮説を立てる.

6

• 分散分析の種類

• 一元配置法• 要因の数が1つ

• 二元配置法(繰り返しのない場合)• 要因の数が2つ• 各水準の組み合わせでデータが1つだけ得られる場合

• 交互作用の検定は不可能

• 二元配置法(繰り返しのある場合)• 要因の数が2つ• 各水準の組み合わせでデータが複数得られる場合

• 交互作用の検定が可能

交互作用 : ある水準の組み合わせで特有に生じる効果のこと

Page 7: 臨床心理統計研究法 第13-15回講義 - yu-yake.comnishidak.yu-yake.com/file/CPSTAT.05.pdf · 一元配置分散分析の計算手順 H 01 2 3: 0αα α= = = 手順. 0: 仮説を立てる.

要因 A

- -

平均 全平均

繰返し数 (各群内のサ

ンプルサイズ)

7

■分散分析(一次元配置)

11x

21x

31x

11nx

1A水準 2A水準 pA水準

12x

22x

32x

2 2nx

1px

2 px

3 px

2pnx

X ⋅⋅1X ⋅ 2X ⋅ pX ⋅

1n 2n pn

1

p

jj

n n=

=∑サンプルサイズ

1, 1, 2,..., ,

jn

j iji

X x j p⋅

=

= =∑

各水準の平均

1

1 jnp

ijj i

X xn

⋅⋅

=

= ∑∑

全平均

Page 8: 臨床心理統計研究法 第13-15回講義 - yu-yake.comnishidak.yu-yake.com/file/CPSTAT.05.pdf · 一元配置分散分析の計算手順 H 01 2 3: 0αα α= = = 手順. 0: 仮説を立てる.

■母集団のモデル化

第j水準の第i番目観測値を以下の確率モデルで表現する.

8

, 1,..., , 1,...,ij j ij jX i n j pµ α ε= + + = =

2

::

: 0,j

ij E

j jµα

ε σ

全体の母平均

第 水準の母平均(第 水準の効果)

平均 分散 の正規分布に従う誤差

1 2 3 0α α α= = =もし, 水準の効果がなかったならば, となり, 要因分散が0になるはずである. 分散分析は, 要因分散が誤差分散よりも有意に大きいかどうか検定することによって, 水準間の有意差を検定する方法である.

2 2

2

, ,ij T j A

ij E

X σ α σ

ε σ

の分散を全分散 の分散を要因分散

の分散を誤差分散

Page 9: 臨床心理統計研究法 第13-15回講義 - yu-yake.comnishidak.yu-yake.com/file/CPSTAT.05.pdf · 一元配置分散分析の計算手順 H 01 2 3: 0αα α= = = 手順. 0: 仮説を立てる.

■標本(確率モデルの実現値)

9

( ) ( ) ( ) , 1,..., , 1,...,j jij ij jx X X X x X i n j p⋅⋅ ⋅ ⋅⋅ ⋅− = − + − = =

ij ijX x確率変数 の実現値 は以下のように分解できる.

全変動 第j水準の効果 誤差

( ) ( ) ( )2 2 2

1 1 1 1 1

j jn np p p

j jij j ijj i j j i

x X n X X x X⋅⋅ ⋅ ⋅⋅ ⋅

= = = = =

− = − + −∑∑ ∑ ∑∑

全変動の偏差平方和

群間変動の偏差平方和

誤差(群内)変動の偏差平方和

両辺を二乗して総和を取ると以下を得る.

2TS 2

AS 2ES

Page 10: 臨床心理統計研究法 第13-15回講義 - yu-yake.comnishidak.yu-yake.com/file/CPSTAT.05.pdf · 一元配置分散分析の計算手順 H 01 2 3: 0αα α= = = 手順. 0: 仮説を立てる.

■自由度について

10

, .平方和の自由度について 以下の関係が成立する

11 1

p

jj

n n=

= − = −∑全変動の自由度 1p= −群間変動の自由度

1( 1)

p

ii

n n p=

= − = −∑群内変動の自由度

+全変動の自由度=群間変動の自由度 群内変動の自由度

, ,, .

分解された偏差平方和を 対応する自由度で割ったものを

平均平方と呼び 以下で定義する

( )22

1 1

11

jnp

T ijj i

S x Xn

⋅⋅

= =

= −− ∑∑ ( )22

1

11

p

jA jj

S n X Xp

⋅ ⋅⋅

=

= −− ∑

( )22

1 1

1 jnp

jE ijj i

S x Xn p

= =

= −− ∑∑

Page 11: 臨床心理統計研究法 第13-15回講義 - yu-yake.comnishidak.yu-yake.com/file/CPSTAT.05.pdf · 一元配置分散分析の計算手順 H 01 2 3: 0αα α= = = 手順. 0: 仮説を立てる.

11

■分散分析の計算

群間変動(要因変動)が群内変動(誤差変動)と比べて, 有意に差があるかどうかを検定すればよい.

2A

0 2 ,E

SF FS

=検定統計量 は 分布に従うことを利用する.

2A

0 2 1 ,

, .E

SFS

= =・ ならば 群間変動が群内変動と同程度の大きさ

と考えられ 水準間の差はないと判断される

2A

0 2 1 ,

.E

SFS

= >・ ならば 群間変動>群内変動と考えられ,

水準間に差はあると判断される

Page 12: 臨床心理統計研究法 第13-15回講義 - yu-yake.comnishidak.yu-yake.com/file/CPSTAT.05.pdf · 一元配置分散分析の計算手順 H 01 2 3: 0αα α= = = 手順. 0: 仮説を立てる.

12

■一元配置分散分析の計算手順

0 1 2 3: 0H α α α= = =

手順0: 仮説を立てる.

1 0:H H の否定

手順1: 得られたデータより, を計算する.2A

0 2E

SFS

=

手順2: 有意水準αを決め, F分布表より, となる

点を求める. 1 2( , ; )F m m α

1 2,m m= =分子の自由度 分母の自由度

手順3: 1 2 0( , ; )F m m Fα < ならば帰無仮説棄却.つまり異なる水準間で統計的有意差がある.

ならば帰無仮説棄却できない.1 2 0( , ; )F m m Fα >

Page 13: 臨床心理統計研究法 第13-15回講義 - yu-yake.comnishidak.yu-yake.com/file/CPSTAT.05.pdf · 一元配置分散分析の計算手順 H 01 2 3: 0αα α= = = 手順. 0: 仮説を立てる.

【例の解答】

13

1 2 3

2 2

0 1 2 32

0 2

0.05

,3 1 2,30 3 27

6.1, 4.7, 7.8, 8.131.08, 3.08

( )( )

: 0

31.08 1

.

,

0.09 (2,27,0.05) 3.353.08

,

,

A E

A

E

X X X XS S

HSF FS

α α α

⋅⋅ ⋅ ⋅ ⋅= = = =

= =

= = =

= =

= − =

= − =

= > =

有意水準 とする.

群間変動 分子の自由度

誤差変動 分母 の自由度 である

指導法に有意差があるか検定を行う場合は

に対して

より

有意差を

仮説

確認できる.

Page 14: 臨床心理統計研究法 第13-15回講義 - yu-yake.comnishidak.yu-yake.com/file/CPSTAT.05.pdf · 一元配置分散分析の計算手順 H 01 2 3: 0αα α= = = 手順. 0: 仮説を立てる.

14

■多重比較法:

どのグループ間に差があるかを検定する方法. 比較の数が増加する(=2群ずつの検定を繰り返す)ことによる第一種の過誤の増大を調整するために, 危険率の補正方法が異なる種々の検定がある

• テューキー・クレマー(Tukey-Kramer)の方法 : 最も一般的

• ボンフェローニ(Bonferroni)の方法 : 保守的な方法

• ダネットの方法(Dunnet)の方法 : 一つの群とその他の群を比較

• スティール・ドゥワス(Steel-Dwass)の方法 :テューキー・クレマー法のノンパラメトリック版

他多数. 以下のサイトが詳しい

http://www.shiga-med.ac.jp/~koyama/stat/com-ph.html

Page 15: 臨床心理統計研究法 第13-15回講義 - yu-yake.comnishidak.yu-yake.com/file/CPSTAT.05.pdf · 一元配置分散分析の計算手順 H 01 2 3: 0αα α= = = 手順. 0: 仮説を立てる.

15

カテゴリカルデータ(質的データ)は,Rでは因子型データとして扱う.

z=c(1,1,1,2,2,2)z=as.factor(z)z

”1”, “2”はもはや数値としての意味を持たず,単に「1」「2」を表す記号となった.

Page 16: 臨床心理統計研究法 第13-15回講義 - yu-yake.comnishidak.yu-yake.com/file/CPSTAT.05.pdf · 一元配置分散分析の計算手順 H 01 2 3: 0αα α= = = 手順. 0: 仮説を立てる.

16

gaku <- read.table("gaku.tst.csv", header=TRUE, sep=",", na.strings="NA", dec=".", strip.white=TRUE)attach(gaku)treatment <- as.factor(treatment)

平均の集計by(score, treatment, mean)標準偏差の集計by(score, treatment, sd)

boxplot(score~treatment)library(gplots)plotmeans(score~treatment)

ANOVAsummary(aov(score~treatment))

Tukey-Kramer方法TukeyHSD(aov(score~treatment))

require(graphics)plot(TukeyHSD(aov(score~treatment), "treatment"))

Page 17: 臨床心理統計研究法 第13-15回講義 - yu-yake.comnishidak.yu-yake.com/file/CPSTAT.05.pdf · 一元配置分散分析の計算手順 H 01 2 3: 0αα α= = = 手順. 0: 仮説を立てる.

17

平均±標準偏差のプロット水準ごとのバラツキ

Page 18: 臨床心理統計研究法 第13-15回講義 - yu-yake.comnishidak.yu-yake.com/file/CPSTAT.05.pdf · 一元配置分散分析の計算手順 H 01 2 3: 0αα α= = = 手順. 0: 仮説を立てる.

18

ANOVA 結果

多重比較結果(Tukey法) 結果

信頼区間にゼロが含まれない場合,

有意差があることを示す.

Page 19: 臨床心理統計研究法 第13-15回講義 - yu-yake.comnishidak.yu-yake.com/file/CPSTAT.05.pdf · 一元配置分散分析の計算手順 H 01 2 3: 0αα α= = = 手順. 0: 仮説を立てる.

19

多重比較結果(Bonferroni 法) 結果

pairwise.t.test(score, treatment, p.adjust.method="bonferroni")

帰無仮説:二群間の平均値には差が無い

Page 20: 臨床心理統計研究法 第13-15回講義 - yu-yake.comnishidak.yu-yake.com/file/CPSTAT.05.pdf · 一元配置分散分析の計算手順 H 01 2 3: 0αα α= = = 手順. 0: 仮説を立てる.

20

【例】二元配置法(繰り返しのない場合) : ある作物の収量を肥料と温度を変えて得られたものが下表である. は肥料, は温度を表している. このとき, 肥料の間, もしくは温度の間に, 収量の差があるかどうか調べたい.

B(温度)

A(肥料)

1.09 1.22 1.87 2.53

1.38 1.99 2.55 2.94

1.78 2.51 2.88 3.52

平均 全平均

1A水準

2A水準

3A水準

1B水準 2B水準 3B水準 4B水準

X ⋅⋅

1X ⋅

2X ⋅

3X ⋅

1X ⋅ 2X ⋅ 3X ⋅ 4X ⋅

iA iB

要因数=2, Aの水準数=3, Bの水準数=4

Page 21: 臨床心理統計研究法 第13-15回講義 - yu-yake.comnishidak.yu-yake.com/file/CPSTAT.05.pdf · 一元配置分散分析の計算手順 H 01 2 3: 0αα α= = = 手順. 0: 仮説を立てる.

B(温度)

A(肥料)

42, 39, 39 37, 40, 40 41, 43, 41

45, 44, 45 42, 43, 43 39, 40, 40

35, 36, 36 36, 37, 36 40, 38, 37

41, 39, 40 38, 39, 41 40, 37, 39

平均 全平均

21

【例】二元配置法(繰り返しのある場合) :ある作物の4種を とし, 3種類の肥料 を

施して, 以下の収量を得た. また水準との各組み合わせで, 3個の標本を得ることが出来た. このとき, 作物間, 肥料間および交互作用について, 収量の差があるかどうかしらべたい.

1A水準

2A水準

3A水準

1B水準 2B水準

X ⋅⋅⋅

1X ⋅⋅

2X ⋅⋅

3X ⋅⋅

1X ⋅ ⋅ 2X ⋅ ⋅ 3X ⋅ ⋅

4A水準

3B水準

4X ⋅⋅

1 2 3 4, , ,A A A A 1 2 3, ,B B B

交互作用 : たとえば, の組み合わせで特有に収量が大きくなる効果

1 2A Bと要因数=2, Aの水準数=4, Bの水準数=3

Page 22: 臨床心理統計研究法 第13-15回講義 - yu-yake.comnishidak.yu-yake.com/file/CPSTAT.05.pdf · 一元配置分散分析の計算手順 H 01 2 3: 0αα α= = = 手順. 0: 仮説を立てる.

22

cropyields <- c(42, 39, 39, 45, 44, 45, 35, 36, 36, 41, 39, 40, 37, 40, 40, 42, 43, 43, 36, 37, 36, 38, 39, 41, 41, 43, 41, 39, 40, 40, 40, 38, 37, 40, 37, 39)temparature <- factor(c(rep("B1",12), rep("B2",12), rep("B3",12)))fertilizer <- factor(rep(c(rep("A1", 3), rep("A2", 3), rep("A3", 3), rep("A4", 3)), 3))

summary(aov(cropyields~temparature + fertilizer + temparature:fertilizer))以下でもよいsummary(aov(cropyields~temparature * fertilizer))

A 肥料の種類、B 温度

Page 23: 臨床心理統計研究法 第13-15回講義 - yu-yake.comnishidak.yu-yake.com/file/CPSTAT.05.pdf · 一元配置分散分析の計算手順 H 01 2 3: 0αα α= = = 手順. 0: 仮説を立てる.

23

interaction.plot(temparature, fertilizer, cropyields)

Page 24: 臨床心理統計研究法 第13-15回講義 - yu-yake.comnishidak.yu-yake.com/file/CPSTAT.05.pdf · 一元配置分散分析の計算手順 H 01 2 3: 0αα α= = = 手順. 0: 仮説を立てる.

24

interaction.plot(fertilizer, temparature, cropyields)

Page 25: 臨床心理統計研究法 第13-15回講義 - yu-yake.comnishidak.yu-yake.com/file/CPSTAT.05.pdf · 一元配置分散分析の計算手順 H 01 2 3: 0αα α= = = 手順. 0: 仮説を立てる.

25

TukeyHSD(aov(cropyields ~ fertilizer*temparature))