ทำไมจึงต้องวิเครำะห์ขอ้ สอบ 1. ปรับปรุงข้อสอบ • • • • • ภำษำ คำตอบที่ถูกต้อง ควำมยำกง่ำย อำนำจจำแนก ประสิทธิภำพของตัวลวง 2. ปรับปรุงวิธีจดั กำรเรียนกำรสอน 3. ค้นหำข้อบกพร่องในกำรเรียน อรุณี วชิ ราพรทิ พย์ วิเครำะห์อะไร 1. เชิงคุณภำพ • ครอบคลุมเนื้อหำและวัตถุประสงค์(Content Validity) • คำตอบที่ถูกเป็ นที่ยอมรับ(Objectivity) • เกณฑ์กำรให้คะแนน(Objectivity) • ควำมยำกง่ำย (Difficulty) • ภำษำที่ใช้ (Comprehensiveness) อรุณี วชิ ราพรทิ พย์ วิเครำะห์อะไร 2. เชิงปริมำณ • รำยข้อ • มีคนตอบถูกหรือไม่ เท่ำไหร่ (p) • คนเก่งและอ่อนตอบถูกแตกต่ำงกันหรือไม่ (r) • ตัวลวงแต่ละตัวมีคนตอบหรือไม่ • ทั้งฉบับ • กำรกระจำยของคะแนนรวมเป็ นอย่ำงไร • ผลกำรสอบเชื่อถือได้แค่ไหน(Reliability) • มีขอ้ ผิดพลำดจำกำรวัดเท่ำใด(Error of Measurement) อรุณี วชิ ราพรทิ พย์ ลักษณะข้อสอบที่ดี Validity Reliability Objectivity Comprehensiveness Practicability Good level of difficulty Good discrimination power กำรวิเครำะห์ขอ้ สอบ 1. กำรวิเครำะห์ขอ้ สอบทั้งฉบับ 2. กำรวิเครำะห์ขอ้ สอบรำยข้อ กำรวิเครำะห์ขอ้ สอบทั้งฉบับ Mean, SD Median Mode Range : Max - Min Standard error of measurement ( SEM ) Reliability ( rtt : KR-21, KR- 20 ) Difficulty index ( p ) Discrimination power ( r ) MPL = (AI ) n Reliability Validity v.s Reliability not Valid, not Reliable not Valid, Reliable Valid, Reliable Reliability ( rtt ) K-R 21 K-R 20 = n x (n-x) 1nSx2 n-1 = n piqi 1Sx2 n-1 2 n S 1 1 Cronbach’ s coefficient - = S2x n-1 ปั จจัยที่มีผลต่อค่ำควำมเชื่อถือได้ ควำมยำวของแบบทดสอบ ( คำถำมมำกข้อ ควำมเชื่อได้สูง ) กำรกระจำยของคะแนน ( กระจำยมำก ควำมเชื่อได้สูง ) ควำมเชื่อถือได้ ควำมยำกง่ำยของข้อสอบ ( ยำกง่ำยปำนกลำง ควำมเชื่อได้สูง ) กำรตรวจให้ คะแนน ( ข้อสอบ MCQ ควำมเชื่อได้สูงกว่ำ Essay ) กำรแปลผลค่ำ Reliability ( KR-20 ) National Board of Medical Examiner ( NBME ) : Reliability ต ่ำกว่ำ 0.70 ไม่ควรใช้ในกำรประเมินผล ทั้งรำยบุคคลและรำยกลุ่ม ถ้ำต้องกำรเปรียบเทียบ performance ของกลุ่ม ้ ้ Reliability จะต้องมีค่ำตังแต่ 0.70 ขึนไป ถ้ำต้องกำรจำแนกควำมแตกต่ำงระหว่ำงบุคคล Reliability จะต้องมีค่ำตัง้ แต่ 0.90 ขึ้นไป Standard Error of Measurement ( SEM ) ตัวอย่ำง : ในกำรสอบ MCQ วิชำกุมำรเวชศำสตร์ กำรวิเครำะห์ ทำงสถิติ พบว่ำค่ำ Mean = 58, SD = 6.67 และ rtt = 0.64 SEM = SD 1 – rtt = 6.67 1 - 0.64 = 4 นศพ. ก. สอบได้ 48 คะแนน (Obtained Score) คะแนนจริง (True Score) True Score = Obtained Score t α.05 x SEM = 48 (1.96 x 4) = 40 - 56 2. กำรวิเครำะห์ขอ้ สอบรำยข้อ ( Item Analysis ) กำรวิเครำะห์ก่อนสอบ Criterion - referenced[MPL] Pretest Analysis The task should be done by the teachers to evaluate the test to be used in term of : Validity Difficulty factor (DF) / Acceptability index (AI) Minimum pass index (AI) Angoff Method • กำรตัดสินใช้พิจำรณำ performance ของนักศึกษำที่ กำรเรียนอยูใ่ นระดับคำบเส้น (marginal) • หำ probability ทีน่ กั ศึกษำคำบเส้นจะตอบข้อสอบแต่ • ละข้อได้ถูกต้อง รวบรวมคะแนน probability จำกกรรมกำรหลำยๆคน แล้วนำมำหำค่ำเฉลี่ยเป็ น MPL Modified Angoff Method กลุม่ ที่คำบเส้นควรจะตอบข้อสอบแต่ละข้อได้อย่ำงน้อยร้อยละเท่ำใดของ คะแนนเต็ม 1.00 Question 1 2 3 4 5 6 7 8 9 10 Expected passing score = 60% Probability for Correct Answer .75 .75 .60 .60 .50 .40 .75 .75 .50 .40 Sum 6.00 กำรวิเครำะห์ขอ้ สอบหลังสอบ (Posttest Analysis) Item analysis base on student, at one point in the time, reflecting some characteristics of the item กำรวิเครำะห์ขอ้ สอบรำยข้อ (Item Analysis) ดัชนีควำมยำก (Difficulty Index, p) อำนำจจำแนก (Discrimination Index , r) ประสิทธิภำพของตัวลวง (Distracters) แบ่ งกลุ่ม สูง ต่ำ 87 83 81 80 80 80 80 79 79 78 76 76 75 73 73 73 73 . 72 . 72 . 71 . . . . . 47 46 46 45 45 45 45 44 42 42 42 41 39 39 39 39 38 37 33 31 H 27% H 33% H 50% L 50% L 33% L 27% อรุณี วชิ ราพรทิ พย์ กำรคำนวณค่ำ p และ r Item # 41 A High 13 ( n = 53 ) Low ( n = 53 ) P = H+L 2n r = H–L n 3 6 0.08 - 0.06 B C D ** E 4 3 3 40 1 9 8 29 0.04 0.11 0.10 0.65 0.05 - 0.12 - 0.09 0.20 Item Discrimination Index Point BIserial Correlation( rpbs ) What does the point biserial measure ? The relationship between two variables, a categorical variable (i.e., the student either answered the test item correctly or incorrectly), with a continuous variable(i.e., percent score on the examination). How do you interpret a point biserial correlation? As with all correlation indices, the point biserial ranges from –1.00 to +1.00. A positive point biserial tells us that those scoring higher on the exam were more likely to have better item “discriminates” between high-scoring and low-scoring students). www.som.tulane.edu. To calculate the rpbi for each item, use the following formula: rpbi = Mp–Mq St pq rpbi = point-biserial correlation coefficient Mp = whole-test mean for students answering item correctly (i.e., those coded as 1s) Mq = whole-test mean for students answering item incorrectly (i.e., those coded as 0s) St = standard deviation for whole test p= proportion of students answering correctly (i.e., those coded as 1s) q= proportion of students answering incorrectly (i.e., those coded as 0s) Uses of Indices : Review of Question Difficulty Index (p) = R / T x 100 (20)30 40 Difficult 50 60 Recommended Acceptable 70(80) Easy Uses of Indices : Review of Question Discrimination Index (r) = H-L x 100 N 0 0.05 0.15 0.25 0.35 (0.20) Discard (most likely) Revise Good Excellent ต ัวอย่างการวิเคราะห์ขอ ้ สอบ II. Mechanisms of Disease หญิงอำยุ 50 ปี อำชีพทำสวน มำด้วยอำกำรคันและปวดเล็กน้อย ที่ บริเวณข้อเท้ำซ้ำยด้ำนหลัง ตรวจพบว่ำมีรอยแดง ๆ เป็ นเส้นคดเคี้ยว ยำว ประมำณ 7 ซม. อำกำรของผูป้ ่ วยเกิดจำกพยำธิชนิดใด เฉลยผิด ??? A. Toxocara canii B. Trichinella spiralis ยากมาก ตอบตาม C. Strongyloides stercoralis ทีเ่ คยเรียน D. Gnathostoma spinigerum E. Angiostrongylus cantonensis Group Upper Middle Low P R A 3 3 3 0.06 0.00 B 4 4 4 0.07 0.00 *C 4 4 6 0.09 - 0.04 D 38 38 34 0.67 0.07 E 5 6 7 0.11 - 0.04 ข้อควรระวังในกำรแปลผลกำรวิเครำะห์ขอ้ สอบ (r) 1.ค่ำอำนำจจำแนกข้อสอบ(r) ไม่ได้บ่งชี้ item validity 2.ข้อสอบที่มี r ต ่ำไม่ได้บอกว่ำเป็ นข้อสอบที่ดอ้ ย คุณภำพ ปั จจัยที่มีผล • ควำมยำกง่ำยของข้อสอบ • ลักษณะของกลุม่ 3. ผลวิเครำะห์ขอ้ สอบจำกกลุม่ ตัวอย่ำงขนำดเล็กจะ ไม่น่ำเชื่อถือ อรุณี วชิ ราพรทิ พย์ สรุป 1. ค่ำสถิตทิ ี่ได้จำกกำรวิเครำะห์ขอ้ สอบเป็ นผล ซึ่งจะ นำไปหำเหตุ 2. ค่ำ p ที่บอกว่ำข้อสอบนั้น ยำกหรือง่ำย มิได้บอกว่ำ ข้อสอบนั้น ดี หรือ เลว 3. ค่ำ p เท่ำใดจึงเหมำะสม ขึ้นอยูก่ บั วัตถุประสงค์ของ กำรสอบ 4. แบบสอบอิงเกณฑ์ p สำคัญกว่ำ r ค่ำ p ควรจะสูง 5. แบบสอบอิงกลุ่ม r สำคัญกว่ำ p ค่ำ p ต้องพอเหมำะ 6. สิ่งที่สำคัญที่สุดของข้อสอบคือ Validity อรุณี วชิ ราพรทิ พย์ จุดเด่นและจุดอ่อนของ MCQ ข้อสอบปรนัย (MCQ) จุดเด่น ครอบคลุมเนื้อหำได้ทั ่วถึง ไม่ตอ้ งอ่ำนลำยมือของนักศึกษำ ตรวจและให้คะแนนได้ง่ำย ให้คะแนนได้อย่ำงยุติธรรม มีควำมเชื่อถือได้สูง สำมำรถเก็บเข้ำคลังข้อสอบได้ง่ำย ข้อสอบปรนัย (MCQ) จุดอ่อน ไม่สำมำรถทดสอบวิธีกำรคิดอย่ำงเป็ นระบบได้ ไม่สำมำรถวัดควำมสำมำรถในกำรหำข้อมูลได้ มีแนวคำตอบให้เลือกอยูแ่ ล้ว เปิ ดโอกำสให้เดำได้มำก เสียเวลำมำกในกำรสร้ำงข้อสอบที่ดี นักศึกษำมักพยำยำมจำข้อสอบ