ANOVA - การวิเคราะห์ความแปรปรวน

advertisement
Analysis of Variance: ANOVA
การวิเคราะห์ ความแปรปรวน
Wipa Sae-Sia, PhD., RN
Surgical Nursing Dept.
Faculty of Nursing
Prince of Songkla University
ANOVA (F-test): Analysis of Variance
ใช้ในการทดสอบความแตกต่างของค่าเฉลี่ยเมื่อมี
จานวนกลุ่ม (ตัวแปรต้น) เท่ากับหรือมากกว่า 2
กลุ่มขึ้ นไป
สามารถใช้ F-test แทน t-test ได้ในกรณีมีกลุ่ม
ตัวอย่าง 2 กลุ่ม
t2 = F
ข้อตกลงเบื้ องต้นเหมือน t-test
ANOVA (F-test)
ฐานการคิดเหมือน t-test เพียงแต่มีการ
เปลี่ยนแปลงไปใช้ค่า variance ในการคานวณ
แทน
สูตรคานวณคือ
F = ค่าเฉลี่ยความแปรปรวนระหว่างกลุ่ม = MSB
ค่าเฉลี่ยความแปรปรวนภายในกลุ่ม
MSW
ANOVA (F-test): ฐานการคิด
ดูตวั อย่างต่อไปนี้ : ผูว้ จิ ยั ต้องการทดสอบผลการ
ทดลอง 3 แบบ คือ ดนตรี (กลุ่ม 1) ดนตรีและ
นวด (กลุ่ม 2) และการพยาบาลตามปกติ (กลุ่ม
3) ต่อคะแนนความวิตกกังวล ผูว้ จิ ย
ั ทาการศึกษา
กลุ่มตัวอย่าง กลุ่มละ 5 ราย และมีค่าคะแนน
เกิดขึ้ นดังนี้
ANOVA (F-test): ฐานการคิด
กลุ่ม 1
กลุ่ม 2
กลุ่ม 3
0
1
3
1
0
1
2
2
0
0
4
3
6
3
4
X1= 1
X2 = 1
X3 = 4
การกาหนดสมมติฐานการวิจยั
H0: u1 =u2 =u3
H1: u1≠ u2≠ u3 อย่ างน้ อย 1 คู่
ANOVA (F-test): ฐานการคิด
จะเห็นว่าค่าตัวเลขในกลุ่มตัวอย่างทั้งหมด
15 รายนี้ มีการกระจายและเราสามารถ
คานวณค่าการกระจายของข้อมูลทั้งชุดนี้ ได้
ตัวเลขที่คานวณได้บอกถึง “ความ
แปรปรวนทัง้ หมด” ของกลุ่มตัวอย่าง (ทุก
คน) หรือเรียกว่า total variance
ANOVA (F-test): ฐานการคิด
เมื่อสามารถหาค่า “ความแปรปรวน
ทัง้ หมด” แล้ว เราสามารถนามาแตกย่อย
ออกเป็ น 2 ส่วนคือ
ความแปรปรวนระหว่างกลุ่ม (betweensubjects variance) และ
ความแปรปรวนภายในกลุ่ม (withinsubjects variance)
ANOVA (F-test): ฐานการคิด
ความแปรปรวนระหว่างกลุ่ม (between-subjects
variance)
ดูคะแนนในตาราง จะเห็นความแตกต่างของ
คะแนนชัดเจนในกลุ่มที่แตกต่างกัน โดยกลุ่ม 3
มีคะแนนความวิตกกังสูงกว่า
(x = 4) อีก 2 กลุ่ม (x = x = 1) ดังนั้ นเรา
สามารถคานวณความแปรปรวนระหว่างกลุ่มที่
จะบอกถึงความแตกต่างระหว่างกลุ่มนี้ ได้
3
1
2
ANOVA (F-test): ฐานการคิด
ความแปรปรวนภายในกลุ่ม (within-subjects
variance)
นอกจากนี้ กลุ่มตัวอย่างแต่ละคน ยังมีความ
แตกต่างกันอันเนื่ องมาจากความเป็ นปั จเจก
บุคคล (individual difference) ดูตวั อย่างใน
ตารางเดิม จะเห็นว่าคะแนนในแต่ละกลุ่ม
เอง ก็มีความแตกต่างกัน
ด้วยฐานการคิดแบบนี้ เราก็สามารถค้นหา
ได้วา่ ความแตกต่างที่เกิดขึ้ นมาจากไหน
ANOVA (F-test): ฐานการคิด
Total Variance
Between-Groups
Variance
1. Group/treatment effect
2. Individual difference
3. Experimental error
Within-Groups
Variance
1. Individual difference
2. Experimental error
ANOVA (F-test): ฐานการคิด
F = variance between treatments
variance within treatments
F = treatment effects+ind. diff.+error
ind.diff.+error (error variance)
เพราะฉะนั้นถ้า H0 เป็ นจริง treatment effect
= 0 ดังนั้ น F ratio = ??
ถ้า treatment effect มากขึ้ น F ratio จะ.........
ถ้า error variance มากขึ้ น F ratio จะ............
Standard Deviation & Variance
สรุปว่า ในการหาค่า standard deviation (SD) ต้อง
คานวณค่า sum of the squared deviations ก่อน
เรียกย่อๆ ว่า sum of the squared (SS)
SS = ∑(X-µ)2
or SS = ∑X2 - (∑X)2
N
คานวณค่า variance = SS/N หรือ SS/df (n-1)
คานวณค่า SD = SS/n-1
ANOVA (F-test): ที่มาของสูตรคานวณ
SS Total
SS between
Variance
Between =
treatments
SS within
SS between
df between
Mean squared
= MS between
(MSB)
df Total
df between
Variance
Within
=
treatments
F = MSB
MSW
df within
SS within
df within
Mean squared
= MS within
(MSW)
ANOVA (F-test): ที่มาของสูตรคานวณ
∑X2 – G2/N
SS Total
SS between
∑T2 – G2/N
SS within
G
T
= ∑T
= ∑ X ของแต่ละกลุ่ม
N
= จานวนตัวอย่างทั้งหมด
∑SS inside each treatment
ANOVA (F-test): ที่มาของสูตรคานวณ
n-1
SS Total
SS between
SS within
df
k -1
between = (k = จานวนกลุม
่ )
treatments
df Total
df between
df within
df
n-k
within
=
(n = จานวนตัวอย่าง)
treatments
df ของ F = k-1
n-k
ANOVA (F-test): ตัวอย่างการคานวณ
กลุ่ม 1
กลุ่ม 2
กลุ่ม 3
0
1
3
1
0
1
2
2
0
0
4
3
6
3
4
∑X=T1= 5
SS1 = 6
n1
=5
X1
=1
∑X=T2= 5
SS2 = 4
n2
=5
X2
=1
∑X=T3= 20
SS3 = 6
n3
=5
X3
=4
∑X2
G
N
K
= 106
= 30
= 15
=3
ANOVA (F-test): นาเสนอผลการวิเคราะห์
แหล่งความแปรปรวน
SS
df
MS
F
ระหว่างกลุ่ม
ภายในกลุ่ม
รวมทั้งหมด
30
2
15
11.28*
16
12
1.33
46
14
* P < .01
ผลการศึกษาพบว่ากลุม่ ตัวอย่างทัง้ 3 กลุม่ มีคะแนนความวิตก
กังวลแตกต่างกันอย่างมีนัยสาคัญ (F (2,12) = 11.28, p < .01)
ANOVA (F-test): Post Hoc Tests
การ run ANOVA ที่ผ่านมา เป็ นการทดสอบ
H0: µ1 =µ2 =µ3 =…… =µk
ถ้าเราปฏิเสธ H0 เราทราบว่ากลุ่มตัวอย่าง k กลุ่ม มี
ความแตกต่างกันระหว่างกลุ่ม แต่ยงั ไม่ทราบว่ากลุ่ม
ไหนที่ต่างไปจากกลุ่มอื่นๆ อย่างมีนัยสาคัญ
จึงต้องทาการวิเคราะห์ต่อไปโดยการวิเคราะห์ทีละคู่
(pairwise comparisons)
ANOVA (F-test): การทดสอบเป็ นรายคู่
Post Hoc Tests
สถิติที่ใช้ในการทดสอบ pairwise comparisons
มีหลายตัว เช่น Tukey’s HSD test, LSD test
และ Scheffe test
หลักการคือการวิเคราะห์ความแตกต่างของ
ค่าเฉลี่ยเป็ นคูๆ่ โดยพยายามควบคุมไม่ให้เกิด
Type I error (α) มากขึ้น
ANOVA
PAIN
Between Groups
Within Groups
Total
Sum of
Squares
30.000
16.000
46.000
df
2
12
14
Mean Square
15.000
1.333
F
11.280
Sig.
.002
Multiple Com parisons
Dependent Variable: ANXIETY
Scheffe
(I) GR
music
massage
control
4.5
(J) GR
massage
control
music
control
music
massage
Mean
Difference
(I-J)
Std. Error
.0000
.73030
-3.0000*
.73030
.0000
.73030
-3.0000*
.73030
3.0000*
.73030
3.0000*
.73030
Sig.
1.000
.005
1.000
.005
.005
.005
*. The mean difference is significant at the .05 level.
4.0
3.5
3.0
2.5
2.0
1.5
1.0
.5
music
GR
massage
control
95% Confidence Interval
Lower Bound
Upper Bound
-2.0358
2.0358
-5.0358
-.9642
-2.0358
2.0358
-5.0358
-.9642
.9642
5.0358
.9642
5.0358
Overall F--Non-significant
คือไม่พบความแตกต่าง
ไม่ตอ้ งวิเคราะห์ต่อ
ANOVA (F-test): ตัวอย่าง
ศึกษาตัวอย่างการใช้ one-way ANOVA จาก
งานวิจยั เรื่อง “พฤติกรรมการดูแลผูป้ ่ วยตามการ
รับรูข้ องพยาบาลและผูใ้ ช้บริการ” ของคุณอิชยา
และคุณนงนุ ช 1999
และช่วยกันคิดตอบคาถามร่วมกันว่า
เป็ นการทดสอบตัวแปรต้นจานวนกี่กลุ่ม
ผลการทดสอบ omnibus F test เป็ นอย่างไร
ผลที่ได้น่าเชื่อถือหรือไม่ เพราะอะไร
ผูว้ จิ ยั วิเคราะห์ post hoc analysis หรือไม่ ใช้สถิติอะไร
ในการทดสอบ
การวิเคราะห์ ความแปรปรวนแบบวัดซ้าRepeated
Measures ANOVA
เป็ นสถิติที่ขยายจาก paired t-test
ทดสอบความแตกต่างของค่าเฉลี่ยในกลุ่มตัวอย่างกลุ่ม
เดียวกันที่มีการวัดซ้า≥ 3 ครั้งขึ้ นไป
Repeated Measures ANOVA:
Assumptions
การกระจายข้อมูลของตัวแปรตามเป็ นโค้ งปกติ
ความแปรปรวนภายในกลุ่ม(การวัดแต่ละครั้ง) ไม่แตกต่าง
กัน นัน่ variance 1=variance 2= variance 3
ค่าสหสัมพันธ์ของตัวแปรที่วดั ซ้ าไม่แตกต่างกัน
r12= r13=r23
Ex
Single-factor repeated measures
design
Two- factor repeated measures design with
repeated measures on one factor
treatment
Sub
Treatment or time
A
B
C
Gender
Sub
Male
1
2
D
3
1
4
5
2
Female
1
3
2
4
3
5
4
5
A
B
C
D
Ex:
นักวิจยั ต้องการทดสอบผลของโยคะต่อการลดปวดใน
ผูป้ ่ วยหลังผ่าตัดช่องท้องในวันที่ 1 2 และ 3 หลังผ่าตัด สุ่ ม
ตัวอย่างมี 25 ราย
H0:
H1:
Descriptive Statistics
N
sensory pain day 1
evening after yoga 2 gr
sensory pain day 2
evening after yoga 2 gr
sensory pain day 3
evening after yoga 2 gr
Valid N (listwise)
Minimum
Maximum
Mean
Std. Deviation
25
7
72
43.08
14.312
25
8
50
30.60
11.431
25
0
37
17.00
8.520
25
Tests of Within-Subjects Effects
Measure: MEASURE_1
Source
TIME
Error(TIME)
Sphericity Assumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
Sphericity Assumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
Type III Sum
of Squares
8507.307
8507.307
8507.307
8507.307
2232.693
2232.693
2232.693
2232.693
สรุ ปผลว่าอย่างไร?
df
2
1.556
1.644
1.000
48
37.332
39.444
24.000
Mean Square
4253.653
5469.120
5176.278
8507.307
46.514
59.806
56.604
93.029
F
91.448
91.448
91.448
91.448
Sig.
.000
.000
.000
.000
Estimated Marginal Means of MEASURE_1
50
40
30
20
10
1
TIME
2
3
การทดสอบความแตกต่ างเป็ นรายคู่
Post-hoc analysis
Multiple Comparisons
Dependent Variable: sensory pain day 1 evening after yoga
Scheffe
(I) VAR00005
1.00
2.00
3.00
(J) VAR00005
2.00
3.00
1.00
3.00
1.00
2.00
Mean
Difference
(I-J)
Std. Error
12.48*
3.299
26.08*
3.299
-12.48*
3.299
13.60*
3.299
-26.08*
3.299
-13.60*
3.299
2 gr
Sig.
.001
.000
.001
.000
.000
.000
95% Confidence Interval
Lower Bound
Upper Bound
4.23
20.73
17.83
34.33
-20.73
-4.23
5.35
21.85
-34.33
-17.83
-21.85
-5.35
*. The mean difference is significant at the .05 level.
สรุ ปผลว่าอย่างไร?
มีความแตกต่างของค่าเฉลี่ยของความปวดหลังผ่าตัดวันที่ 1 2 และ 3 อย่างมีนยั สาคัญทางสถิติ
ภายหลังการฝึ กโยคะในผูป้ ่ วยหลังผ่าตัดช่องท้อง ค่าเฉลี่ยความปวดหลังผ่าตัดลดลงในวันที่ 2 และ 3
อย่างมีนยั สาคัญทางสถิติ (F2,48 = 91.45, p <.01)
การวิเคราะห์ ตัวแปรร่ วม
Analysis of Covariance
เป็ นสถิตทิ ี่ขยายขอบเขตของการวิเคราะห์ค่าความ
แปรปรวน
เปรียบเทียบค่าเฉลี่ยของตัวแปรตัง้ แต่ 2 กลุม่ ขึ้นไป โดยมี
การควบคุมตัวแปรบางตัวที่สง่ ผลต่อตัวแปรตาม หรืออีก
นัยหนึ่งคือ ขจัดอิทธิพลของตัวแปรกลุม่ หนึ่งที่สง่ ผลต่อตัว
แปรออก ก่อนทาการเปรียบเทียบค่าเฉลี่ยของตัวแปรที่
นักวิจยั สนใจเพื่อให้ผลลัพธ์การเปรียบเทียบมีความ
น่าเชื่อถือมากที่สุด
Ex:
นักวิจยั ต้องการศึกษาผลของสื่อวิดีทศั น์เรื่องการบริหาร
ข้อเข่าต่อทักษะในการบริหารข้อเข่าในผูป้ ่ วยหลังผ่าตัด
เปลี่ยนข้อเข่าเทียม โดยเก็บข้อมูลในกลุ่มทดลองและ
ควบคุมกลุ่มละ 20 ราย
H0:
H1:
Gr oup S t at i s t i c s
Std. Error
ก่อนผาตั
่ ด
าหน่า ย
กอนจ
่
GROUP
ทดล อง
Mean
Std. Deviation
Mean
N
20
9.0375
1.01963
.22800
ควบคุม
19
7.3553
1.38398
.31751
ทดล อง
20
8.8250
1.59378
.35638
ควบคุม
19
6.6776
2.46268
.56498
Independent t-test
I ndep enden t S ampl es T es t
Levene' s Test for
Equality of Variances
t-test for Equality of Means
95% Confidence
Interval of the
F
กอนผ
าตั
่
่ ด
Equal variances assumed
Sig.
.504
.482
Equal variances not
assumed
กอนจ
าหน่า ย
่
Equal variances assumed
Equal variances not
assumed
3.908
.056
t
df
Mean
Std. Error
Sig. (2-tailed)
Difference
Difference
Difference
Lower
Upper
4.337
37
.000
1.6822
.38785
.89639
2.46809
4.304
33.029
.000
1.6822
.39089
.88700
2.47747
3.250
37
.002
2.1474
.66082
.80843
3.48631
3.215
30.586
.003
2.1474
.66799
.78425
3.51048
D e s c r ip t iv e S ta t is t ic s
GR OU P
Dependent Variable: ก่อนจำ หน่า ย
GROUP
ทดล อง
Mean
Dependent Variable: ก่อนจำ หน่ า ย
Std. Deviation
8.8250
N
1.59378
95% Confidence Interval
20
ควบคุม
6.6776
2.46268
19
Total
7.7788
2.30764
39
GROUP
ทดล อง
Mean
ควบคุม
a.
Std. Error
Lower Bound
Upper Bound
8.289a
.482
7.311
9.267
7.242a
.497
6.234
8.251
Covariates appearing in the model are evaluated at the
following values: ก่อนผ่าตัด = 8 .2179.
a
Lev ene' s T es t of Equal i t y of Er r or Va r i anc es
Ancova
Dependent Variable: ก่อนจำหน่าย
F
df1
.983
df2
1
Sig.
37
.328
Tests the null hypothesis that the error variance of
the dependent variable is equal across groups.
a. Design: Intercept+รว ม_ A+GROUP
T es t s of B et w een- S ubj ec t s E f f ec t s
Dependent Variable: ก่อนจำ หน่า ย
Type III Sum
Source
Corrected Model
df
Mean Square
F
Sig.
Noncent.
Observed
Squared
Parameter
Power
a
68.162b
2
34.081
9.143
.001
.337
18.285
.965
4.505
1
4.505
1.208
.279
.032
1.208
.188
23.232
1
23.232
6.232
.017
.148
6.232
.681
7.071
1
7.071
1.897
.177
.050
1.897
.268
Error
134.197
36
3.728
Total
2562.266
39
202.358
38
Intercept
รวม_ A
GROUP
สรุปผลการวิจัยว่ าอย่ างไร?
of Squares
Partial Eta
Corrected Total
a.
b.
Computed using alpha = .05
R Squared = .337 (Adjusted R Squared = .300)
สหสัมพันธ์ Correlation
วัตถุประสงค์ การใช้ สถิตสิ หสั มพันธ์
o เพื่อศึกษาความสัมพันธ์ของตัวแปรที่ศึกษา
o สถิตสิ หสัมพันธ์ไม่สามารถบอกว่าตัวแปรใดเป็ นเหตุ
ของตัวแปรใด
ลักษณะทีส่ าคัญของสถิติสหสั มพันธ์
• บอกความสัมพันธ์ของตัวแปรว่ามีมากน้อยเพียงใด
Indicate strength of the relationship
• บอกทิศทางของความสัมพันธ์ว่าเป็ นไปในทิศทาง
เดียวกัน หรือทิศทางตรงกันข้ามกัน
Tell direction of the relationship (+ or -)
Correlation coefficients (r)
o Munro ( 2001 )
0.00 - .25
: little if any
0.26 - 0.49 : low
0.50 - 0.69 : moderate
0.70 - 0.89 : high
0.90 - 1.00 : very high
o Correlation will not be excess ±1
ลักษณะของความสั มพันธ์
o 2 variables: Bivariate simple
correlation or zero-order correlation
o > 2 variables or multivariate
correlation
ลักษณะของข้ อมูล
o at least 2 variables
o Interval level variables
o Normal distribution of each
variable
Correlation
Y
X
Simple correlation
Y
X
Z
Multiple correlation
Ex
ศึกษาความสัมพันธ์ระหว่างอายุกบั คุณภาพชีวิตในผูป้ ่ วยที่มารักษาที่หน่วย
โรคหัวใจ จานวน 200 คน
H0:
H1:
C o r r el at i ons
Subject's age
Subject's age
Pearson Correlation
Sig. (2-tailed)
TOTAL
**.
1
TOTAL
.980**
.
.000
N
200
200
Pearson Correlation
.980**
Sig. (2-tailed)
.000
.
N
200
200
Correlation is significant at the 0.01 level (2-tailed).
จะสรุปผลว่ าอย่ างไร?
1
Variable scales
Statistic
Nominal scale
Chi-square test
Ordinal scale
Spearman rank-order
correlation coefficient
Interval scale
Pearson productmoment
correlation coefficient
Ratio scale
แบบฝึ กหัด
จงแปลผลงานวิจยั เรื่ องความสัมพันธ์ของความเชื่ออานาจภายในภายนอกตนเองและความเชื่อด้านสุ ขภาพกับการดูแลตนเองของ
ผูป้ ่ วยวัยรุ่ น
(นันทิดา, บัวทอง, สุ รินทร์ , 2009)
แบบทดสอบ
1. เปรียบเทียบระดับความปวดในระยะคลอดในผู้ป่วยที่
ได้ รับยาแก้ ปวด ผู้ป่วยทีไ่ ด้ รับยาแก้ ปวดร่ วมกับการฝึ ก
การผ่ อนคลายและผู้ป่วยทีไ่ ด้ รับยาแก้ ปวดร่ วมกับการฟัง
ดนตรี
2. ผลของการจัดกลุ่มอารมณ์ ขนั ต่ อระดับความเครียดและ
ความวิตกกังวลในผู้ป่วยจิตเวช
3. ความสั มพันธ์ ของพฤติกรรมการรับประทานอาหารกับ
ระดับไขมันในเลือด
Download