การวิเคราะห์ข้อสอบ MCQ

advertisement
ทำไมจึงต้องวิเครำะห์ขอ้ สอบ
1. ปรับปรุงข้อสอบ
•
•
•
•
•
ภำษำ
คำตอบที่ถูกต้อง
ควำมยำกง่ำย
อำนำจจำแนก
ประสิทธิภำพของตัวลวง
2. ปรับปรุงวิธีจดั กำรเรียนกำรสอน
3. ค้นหำข้อบกพร่องในกำรเรียน
อรุณี วชิ ราพรทิ พย์
วิเครำะห์อะไร
1. เชิงคุณภำพ
• ครอบคลุมเนื้อหำและวัตถุประสงค์(Content
Validity)
• คำตอบที่ถูกเป็ นที่ยอมรับ(Objectivity)
• เกณฑ์กำรให้คะแนน(Objectivity)
• ควำมยำกง่ำย (Difficulty)
• ภำษำที่ใช้ (Comprehensiveness)
อรุณี วชิ ราพรทิ พย์
วิเครำะห์อะไร
2. เชิงปริมำณ
• รำยข้อ
• มีคนตอบถูกหรือไม่ เท่ำไหร่ (p)
• คนเก่งและอ่อนตอบถูกแตกต่ำงกันหรือไม่ (r)
• ตัวลวงแต่ละตัวมีคนตอบหรือไม่
• ทั้งฉบับ
• กำรกระจำยของคะแนนรวมเป็ นอย่ำงไร
• ผลกำรสอบเชื่อถือได้แค่ไหน(Reliability)
• มีขอ้ ผิดพลำดจำกำรวัดเท่ำใด(Error of Measurement)
อรุณี วชิ ราพรทิ พย์
ลักษณะข้อสอบที่ดี

Validity

Reliability

Objectivity

Comprehensiveness

Practicability

Good level of difficulty

Good discrimination power
กำรวิเครำะห์ขอ้ สอบ
1. กำรวิเครำะห์ขอ้ สอบทั้งฉบับ
2. กำรวิเครำะห์ขอ้ สอบรำยข้อ
กำรวิเครำะห์ขอ้ สอบทั้งฉบับ

Mean, SD

Median

Mode

Range : Max - Min

Standard error of measurement ( SEM )

Reliability ( rtt : KR-21, KR- 20 )

Difficulty index ( p )

Discrimination power ( r )

MPL =  (AI )
n
Reliability
Validity v.s Reliability
not Valid,
not Reliable
not Valid,
Reliable

Valid, Reliable
Reliability ( rtt )
K-R 21
K-R 20
=
n
x
(n-x)
1nSx2
n-1
=
n

piqi
1Sx2
n-1
2
n

S
1
1
Cronbach’ s coefficient -  =
S2x
n-1
ปั จจัยที่มีผลต่อค่ำควำมเชื่อถือได้
ควำมยำวของแบบทดสอบ
( คำถำมมำกข้อ ควำมเชื่อได้สูง )
กำรกระจำยของคะแนน
( กระจำยมำก ควำมเชื่อได้สูง )
ควำมเชื่อถือได้
ควำมยำกง่ำยของข้อสอบ
( ยำกง่ำยปำนกลำง ควำมเชื่อได้สูง )
กำรตรวจให้ คะแนน
( ข้อสอบ MCQ ควำมเชื่อได้สูงกว่ำ Essay )
กำรแปลผลค่ำ Reliability ( KR-20 )
National Board of Medical Examiner ( NBME ) :



Reliability ต ่ำกว่ำ 0.70 ไม่ควรใช้ในกำรประเมินผล
ทั้งรำยบุคคลและรำยกลุ่ม
ถ้ำต้องกำรเปรียบเทียบ performance ของกลุ่ม

้
้
Reliability จะต้องมีค่ำตังแต่ 0.70 ขึนไป
ถ้ำต้องกำรจำแนกควำมแตกต่ำงระหว่ำงบุคคล
Reliability จะต้องมีค่ำตัง้ แต่ 0.90 ขึ้นไป
Standard Error of Measurement ( SEM )
ตัวอย่ำง : ในกำรสอบ MCQ วิชำกุมำรเวชศำสตร์ กำรวิเครำะห์
ทำงสถิติ พบว่ำค่ำ Mean = 58, SD = 6.67 และ rtt = 0.64
SEM = SD  1 – rtt
= 6.67  1 - 0.64 = 4
นศพ. ก. สอบได้ 48 คะแนน (Obtained Score)
คะแนนจริง (True Score)
True Score = Obtained Score  t α.05 x SEM
= 48  (1.96 x 4) = 40 - 56
2. กำรวิเครำะห์ขอ้ สอบรำยข้อ
( Item Analysis )
กำรวิเครำะห์ก่อนสอบ
Criterion - referenced[MPL]
Pretest Analysis
The task should be done by the teachers
to evaluate the test to be used in term of :
 Validity
 Difficulty factor (DF) / Acceptability index (AI)
 Minimum pass index (AI)
Angoff Method
• กำรตัดสินใช้พิจำรณำ performance ของนักศึกษำที่
กำรเรียนอยูใ่ นระดับคำบเส้น (marginal)
• หำ probability ทีน่ กั ศึกษำคำบเส้นจะตอบข้อสอบแต่
•
ละข้อได้ถูกต้อง
รวบรวมคะแนน probability จำกกรรมกำรหลำยๆคน
แล้วนำมำหำค่ำเฉลี่ยเป็ น MPL
Modified Angoff Method
กลุม่ ที่คำบเส้นควรจะตอบข้อสอบแต่ละข้อได้อย่ำงน้อยร้อยละเท่ำใดของ
คะแนนเต็ม 1.00
Question
1
2
3
4
5
6
7
8
9
10
Expected passing score = 60%
Probability for Correct Answer
.75
.75
.60
.60
.50
.40
.75
.75
.50
.40

Sum 6.00
กำรวิเครำะห์ขอ้ สอบหลังสอบ
(Posttest Analysis)
Item analysis
base on student,
at one point in the time,
reflecting some characteristics
of the item
กำรวิเครำะห์ขอ้ สอบรำยข้อ (Item Analysis)

ดัชนีควำมยำก (Difficulty Index, p)

อำนำจจำแนก (Discrimination Index , r)

ประสิทธิภำพของตัวลวง (Distracters)
แบ่ งกลุ่ม
สูง
ต่ำ
87
83
81
80
80
80
80
79
79
78
76
76
75
73
73
73
73
.
72
.
72
.
71
.
.
.
.
.
47
46
46
45
45
45
45
44
42
42
42
41
39
39
39
39
38
37
33
31
H 27%
H 33%
H 50%
L 50%
L 33%
L 27%
อรุณี วชิ ราพรทิ พย์
กำรคำนวณค่ำ p และ r
Item # 41
A
High 13
( n = 53 )
Low
( n = 53 )
P
=
H+L
2n
r
=
H–L
n
3
6
0.08
- 0.06
B
C

D
** E
4
3
3
40
1
9
8
29
0.04
0.11
0.10
0.65
0.05
- 0.12
- 0.09
0.20
Item Discrimination Index
Point BIserial Correlation( rpbs )
What does the point biserial measure ?
The relationship between two variables, a categorical variable
(i.e., the student either answered the test item correctly or
incorrectly), with a continuous variable(i.e., percent score on the
examination).
How do you interpret a point biserial correlation?
As with all correlation indices, the point biserial ranges
from –1.00 to +1.00.
A positive point biserial tells us that those scoring higher on
the exam were more likely to have better item “discriminates”
between high-scoring and low-scoring students).
www.som.tulane.edu.
To calculate the rpbi for each item, use the following formula:
rpbi
= Mp–Mq
St
 pq
rpbi = point-biserial correlation coefficient
Mp = whole-test mean for students answering item correctly
(i.e., those coded as 1s)
Mq = whole-test mean for students answering item incorrectly
(i.e., those coded as 0s)
St =
standard deviation for whole test
p=
proportion of students answering correctly (i.e., those
coded as 1s)
q=
proportion of students answering incorrectly (i.e., those
coded as 0s)
Uses of Indices : Review of Question
Difficulty Index (p) = R / T x 100
(20)30
40
Difficult
50
60
Recommended
Acceptable
70(80)
Easy
Uses of Indices : Review of Question
Discrimination Index (r) = H-L x 100
N

0
0.05
0.15
0.25 0.35
(0.20)
Discard
(most likely)
Revise
Good
Excellent
ต ัวอย่างการวิเคราะห์ขอ
้ สอบ
II. Mechanisms of Disease
หญิงอำยุ 50 ปี อำชีพทำสวน มำด้วยอำกำรคันและปวดเล็กน้อย ที่
บริเวณข้อเท้ำซ้ำยด้ำนหลัง ตรวจพบว่ำมีรอยแดง ๆ เป็ นเส้นคดเคี้ยว ยำว
ประมำณ 7 ซม.
อำกำรของผูป้ ่ วยเกิดจำกพยำธิชนิดใด
เฉลยผิด ???
A.
Toxocara canii
B.
Trichinella spiralis
ยากมาก ตอบตาม
C. Strongyloides stercoralis
ทีเ่ คยเรียน
D. Gnathostoma spinigerum
E. Angiostrongylus cantonensis
Group
Upper
Middle
Low
P
R
A
3
3
3
0.06
0.00
B
4
4
4
0.07
0.00
*C
4
4
6
0.09
- 0.04
D
38
38
34
0.67
0.07
E
5
6
7
0.11
- 0.04
ข้อควรระวังในกำรแปลผลกำรวิเครำะห์ขอ้ สอบ (r)
1.ค่ำอำนำจจำแนกข้อสอบ(r) ไม่ได้บ่งชี้ item validity
2.ข้อสอบที่มี r ต ่ำไม่ได้บอกว่ำเป็ นข้อสอบที่ดอ้ ย
คุณภำพ
ปั จจัยที่มีผล
• ควำมยำกง่ำยของข้อสอบ
• ลักษณะของกลุม่
3. ผลวิเครำะห์ขอ้ สอบจำกกลุม่ ตัวอย่ำงขนำดเล็กจะ
ไม่น่ำเชื่อถือ
อรุณี วชิ ราพรทิ พย์
สรุป
1. ค่ำสถิตทิ ี่ได้จำกกำรวิเครำะห์ขอ้ สอบเป็ นผล ซึ่งจะ
นำไปหำเหตุ
2. ค่ำ p ที่บอกว่ำข้อสอบนั้น ยำกหรือง่ำย มิได้บอกว่ำ
ข้อสอบนั้น ดี หรือ เลว
3. ค่ำ p เท่ำใดจึงเหมำะสม ขึ้นอยูก่ บั วัตถุประสงค์ของ
กำรสอบ
4. แบบสอบอิงเกณฑ์ p สำคัญกว่ำ r ค่ำ p ควรจะสูง
5. แบบสอบอิงกลุ่ม r สำคัญกว่ำ p ค่ำ p ต้องพอเหมำะ
6. สิ่งที่สำคัญที่สุดของข้อสอบคือ Validity
อรุณี วชิ ราพรทิ พย์
จุดเด่นและจุดอ่อนของ MCQ
ข้อสอบปรนัย (MCQ)
จุดเด่น






ครอบคลุมเนื้อหำได้ทั ่วถึง
ไม่ตอ้ งอ่ำนลำยมือของนักศึกษำ
ตรวจและให้คะแนนได้ง่ำย
ให้คะแนนได้อย่ำงยุติธรรม
มีควำมเชื่อถือได้สูง
สำมำรถเก็บเข้ำคลังข้อสอบได้ง่ำย
ข้อสอบปรนัย (MCQ)
จุดอ่อน






ไม่สำมำรถทดสอบวิธีกำรคิดอย่ำงเป็ นระบบได้
ไม่สำมำรถวัดควำมสำมำรถในกำรหำข้อมูลได้
มีแนวคำตอบให้เลือกอยูแ่ ล้ว
เปิ ดโอกำสให้เดำได้มำก
เสียเวลำมำกในกำรสร้ำงข้อสอบที่ดี
นักศึกษำมักพยำยำมจำข้อสอบ
Download