วันเสาร์ที่ 4 มิถุนายน พ.ศ. 2559

การตรวจคุณภาพของเครื่องมือ : ข้อสอบ



                                     การตรวจคุณภาพของเครื่องมือ : ข้อสอบ

เรียบเรียงโดย ว่าที่ ร.ต. ดร. ประสิทธิ์  รัตนสุภา

ข้อสอบแบบเลือกตอบ (ทำถูก ได้ 1 คะแนน ทำผิด ได้ 0 คะแนน )
          งานวิจัยจะมีความน่าเชื่อถือเพียงใดจะขึ้นอยู่กับเครื่องมือที่ใช้ในการเก็บรวบรวมข้อมูล    ถ้าเครื่องมือไม่มีความตรง ก็ทำให้งานวิจัยขาดความเชื่อถือไปด้วย ข้อสอบเป็นเครื่องมือตัวหนึ่งในการเก็บข้อมูล การที่จะเป็นข้อสอบที่ดีนั้นควรเป็นข้อสอบที่มีการตรวจคุณภาพ อย่างน้อย  4 ประการ คือ 1. ความตรง (Validity) 2. ความเชื่อมั่น (Reliability) 3. ความยาก (Difficulty) และ    4. อำนาจจำแนก (Discrimination)
1. ความตรง (Validity)
 ความตรง เป็นความสอดคล้องหรือความเหมาะสมของผลการวัดกับเนื้อเรื่อง หรือเกณฑ์ หรือทฤษฏีที่เกี่ยวกับลักษณะที่มุ่งวัดซึ่งมีหลายประเภท เช่น ความตรงเชิงเนื้อหา(Content Validity) ความตรงเชิงเกณฑ์สัมพันธ์ (Criterion-related Validity) ความตรงเชิงพยากรณ์(Predictive Validity) ในการตรวจคุณภาพของข้อสอบ ขอเสนอ ความตรงเชิงเนื้อหา(Content Validity)
ความตรงเชิงเนื้อหา (Content Validity) ขอนำเสนอวิธีการที่คุ้นเคยและสะดวกคือ จากการพิจารณาของผู้เชี่ยวชาญในศาสตร์นั้น ๆ จำนวน 3-5 คนเพื่อลงสรุป โดยใช้ดัชนีความสอดคล้องระหว่างข้อคำถามกับจุดประสงค์ (Index of Item-Objective Congruence : IOC) ที่มีเกณฑ์ในการพิจารณาให้คะแนน ดังนี้ ให้ +1 เมื่อแน่ใจว่าข้อคำถามมีความสอดคล้องกับจุดประสงค์  ให้ 0 เมื่อไม่แน่ใจว่าข้อคำถามมีความสอดคล้องกับจุดประสงค์ และให้-1 เมื่อแน่ใจว่าข้อคำถามไม่สอดคล้องกับจุดประสงค์หลังจากนั้นนำคะแนนของผู้เชี่ยวชาญมาหาค่าดัชนีความสอดคล้อง ฯ โดยใช้สูตรของ โรวิเนลลี และแฮมเบิลตัน มีสูตรการคำนวณ (Rovinelli and Hambleton, 1977 : 49-60) ซึ่งมีค่าเท่ากับผลรวมของคะแนนผู้เชี่ยวชาญแต่ละคน หารด้วยจำนวนผู้เชี่ยวชาญ (ดูสูตรจากต้นฉบับ)
                    เกณฑ์การพิจารณาระดับค่าดัชนีความสอดคล้องฯ (IOC)  ตั้งแต่ 0.5 ขึ้นไป คัดเลือกข้อสอบข้อนั้นไว้ใช้ได้

 ตารางที่ 1 ตัวอย่างรูปแบบแบบสอบถามในการส่งให้ผู้ทรงคุณวุฒิพิจารณาด้วยดัชนี IOC

แบบประเมินความสอดคล้องระหว่างจุดประสงค์กับข้อคำถาม
คำชี้แจง : 1.ประเมินความสอดคล้องระหว่างจุดประสงค์กับข้อคำถามโดยให้คะแนน ดังนี้
                  +1 เมื่อแน่ใจว่าข้อคำถามมีความสอดคล้องกับจุดประสงค์ 
                    0 เมื่อไม่แน่ใจว่าข้อคำถามมีความสอดคล้องกับจุดประสงค์   
                   -1 เมื่อแน่ใจว่าข้อคำถามไม่สอดคล้องกับจุดประสงค์

จุดประสงค์

              ข้อคำถาม

  ผลการพิจารณา

   ข้อเสนอแนะ

+1
0
-1
1.บอกองค์ประกอบ
ของระบบคอมพิวเตอร์

1.  ระบบคอมพิวเตอร์จัดแบ่งออกเป็น
     องค์ประกอบอะไรบ้าง
     ก.  hardware, software, people
     ข.  hardware, software
     ค.  hardware, people
     ง.  hardware, softwnw, internet




2.






2. ……………………
3.




4.




5.





 
ตารางที่ 2 ตัวอย่างการนำเสนอผลการหาความสอดคล้องระหว่างข้อคำถามกับจุดประสงค์ของ
                ข้อสอบ โดยผู้เชี่ยวชาญจำนวน 3 คนในการพิจารณาข้อคำถามข้อที่ 1-4 กับจุดประสงค์  
                 ดังนี้

ข้อที่
คะแนนจากผู้เชี่ยวชาญ คนที่
ผลรวม
IOC
ผลการวิเคราะห์
1
2
3
1
+1
+1
+1
+3
1.00
นำไปใช้ได้
2
0
0
0
0
0.00
ใช้ไม่ได้
3
+1
-1
-1
-1
-0.33
ใช้ไม่ได้
4
+1
+1
0
+2
0.67
นำไปใช้ได้

2. ความเชื่อมั่น (Reliability)
คุณภาพของเครื่องมือในการรวบรวมข้อมูลที่สำคัญอีกประการก็คือ ผลของการวัดจากเครื่องมือนั้นมีความคงเส้นคงวาในการวัดหรือไม่ นั่นคือ หากมีการใช้เครื่องมือวัดซ้ำกับคนกลุ่มเดิมอีก ผลการวัดแต่ละครั้งควรใกล้เคียงกัน ซึ่งหาได้หลายวิธี เช่น 1. วิธีการสอบซ้ำ (Test-Retest Method) 2. วิธีการใช้เครื่องมือคู่ขนาน (Parallel forms Method) 3. วิธีการแบ่งครึ่ง (Split-Half Method) 4. วิธีการหาความเป็นเอกพันธ์ภายใน (Internal Consistency Method)
          ในการหาความเชื่อมั่น(Reliability) ของข้อสอบ ขอเลือก วิธีที่ 4 วิธีการหาความเป็นเอกพันธ์ภายใน (Internal Consistency Method) วิธีการหาความเป็นเอกพันธ์ภายใน วิธีนี้ใช้การเก็บข้อมูลครั้งเดียวแล้วหาความเชื่อมั่นไว้เลย การคำนวณอาจหาได้หลายวิธี คือ1) สูตร Kuder-Richardson 2) สูตรสัมประสิทธิ์แอลฟา (Coefficient Alpha) ในที่นี้ขอนำเสนอหาความเชื่อมั่น(Reliability) ของข้อสอบ จากสูตร Kuder-Richardson
สูตร Kuder-Richardson วิธีนี้สูตรที่ใช้มี 2 สูตร คือ 1) KR-20 และ 2) KR-21  โดย สูตร KR-20 สูตรของคูเดอร์-ริชาร์ดสัน 20 (KR-20) ข้อสอบแต่ละข้อไม่จำเป็นต้องมีความยากเท่ากันแต่ควรมีจำนวนข้อสอบอย่างน้อย 20 ข้อ   ส่วน สูตร KR-21 เป็นสูตรการคำนวณค่าสัมประสิทธิ์ความเชื่อมั่นที่มี ข้อตกลงเบื้องต้นว่าข้อสอบแต่ละข้อต้องมีความยากเท่ากัน ทำให้สูตรการคำนวณมีความซับซ้อน น้อยลงแต่สูตรการคำนวณ KR-21 จะให้ค่าความเชื่อมั่นที่ต่ำกว่าการคำนวณด้วยสูตร KR-20 (Mehrens and Lehmann,1984 : 276) ในการหาความเชื่อมั่น(Reliability) ของข้อสอบ โดยทั่วไป ควรใช้ สูตร KR-20
เกณฑ์พิจารณาค่าความเชื่อมั่นของเครื่องมือวิจัย ค่าความเชื่อมั่นของเครื่องมือในการวิจัย มีเกณฑ์สาหรับพิจารณาว่าเป็นความเชื่อมั่น ที่ใช้ได้ในการนำเครื่องมือนั้น ๆ ไปใช้ มีดังนี้ (Burns and Grove,1997 : 327)  ดังนี้
1. เครื่องมือที่ใช้วัดการทำหน้าที่ของอวัยวะต่าง ๆ ในร่างกายของมนุษย์ควรมีความเชื่อมั่น 0.95 ขึ้นไป
2.  เครื่องมือที่มีมาตรฐานทั่ว ๆ ไปควรมีความเชื่อมั่นเท่ากับ 0.8 แต่ถ้าเป็นเครื่องมือที่สร้างและพัฒนาขึ้นควรมีความเชื่อมั่นอย่างน้อย 0.70
3. เครื่องมือที่ใช้วัดเจตคติ ความรู้สึก ควรมีความเชื่อมั่นตั้งแต่ 0.70 ขึ้นไป
4. เครื่องมือที่ใช้ในการสังเกต ควรมีค่าความเชื่อมั่นตั้งแต่ 0.80 ขึ้นไป

ข้อสอบเป็นเป็นเครื่องมือที่สร้างและพัฒนาขึ้นควรมีความเชื่อมั่นอย่างน้อย 0.70 (ค่ารวมทั้งฉบับ)
3. ความยาก (Difficulty: p)
ความยาก(Difficulty: p) หมายถึง เป็นคุณภาพของเครื่องมือที่เป็นแบบทดสอบ ที่แสดง สัดส่วนของผู้สอบที่ตอบข้อนั้นได้ถูกต้องต่อผู้สอบทั้งหมด ตามความมุ่งหมายและหลักเกณฑ์ เป็นการหาค่ารายข้อ
ข้อสอบที่ดีควรมีความยากง่ายพอเหมาะ ไม่ยากหรือง่ายเกินไป ข้อสอบฉบับหนึ่ง ควรมีผู้ตอบถูก
ไม่ต่ำกว่า 20 คนและไม่เกิน 80 คนจากผู้สอบ 100 คน นั่นคือค่า P อยู่ระหว่าง.20-.80 จึงถือว่าเป็น
ข้อสอบที่มีค่าความยากง่ายพอเหมาะ เกณฑ์พิจารณาค่าความยาก โดยที่ข้อสอบที่จะสามารถนาไปใช้ในการวัดผลที่มีประสิทธิภาพจะมีค่าความยากอยู่ ระหว่าง
0.20 ถึง 0.80

 4. อำนาจจำแนก (Discrimination: r)
อำนาจจำแนก (Discrimination: r) หมายถึง คุณภาพของเครื่องมือที่สร้างขึ้นแล้วสามารถจำแนกกลุ่ม/บุคคลแยกออกจากกันเป็นกลุ่มตามลักษณะที่ตนเองเป็นอยู่/เกณฑ์ของความรอบรู้ได้อย่างมีประสิทธิภาพ (บุญเชิด ภิญโญอนันต์พงษ์. มปป.135-139) เป็นการหาค่ารายข้อ
เกณฑ์ในการพิจารณาอำนาจจำแนกของข้อสอบ  r อย่างน้อย  0.20

ตารางที่ 3 ตัวอย่าง  การนำเสนอข้อสอบที่คัดเลือกใช้เป็นเครื่องมือในงานวิจัยนี้

 ข้อที่
IOC
p
r
หมายเหตุ
1




2





หมายเหตุ 1.ข้อสอบทั้งฉบับมีความเชื่อมั่น (Reliability) อย่างน้อย 0.70
                2. Index of Item-Objective Congruence (IOC)  มีค่าอย่างน้อย 0.5
                3. ความยาก (Difficulty: p) มีค่าระหว่าง 0.20 ถึง 0.80
                4. อำนาจจำแนก (Discrimination: r) มีค่าอย่างน้อย 0.20              

               5. ดาวน์โหลดโปรแกรมวิเคราะห์ข้อสอบ KR 20   คลิกที่นี่


                        โปรแกรมวิเคราะห์ข้อสอบ KR 20 (ลิงก์ 2) คลิกที่นี่

----------------------------------

เอกสารอ้างอิง

บุญเชิด ภิญโญอนันตพงษ์.(มปป). การวัดและประเมินผลการศึกษา ทฤษฎีและการประยุกต์.
กรุงเทพฯ:คณะศึกษาศาสตร์ มหาวิทยาลัยศรีนครินทรวิโรฒ ประสานมิตร.
Burns,N. and Grove,S.K. (1997). The practiceof nursing research : Conduct critique
&utilization (3thed). Pensylvania: Saunders.
Mehrens, W. A. & Lehmann, I. J. (1984). Measurement and education in evaluation and
psyschology.  New York: Holt, Rinehart and Winston.
Rovinelli, R. J., & Hambleton, R. K. (1977). On the use of content specialists in the assessment of
criterion-referenced test item validity. Dutch Journal of Educational Research, 

ไม่มีความคิดเห็น:

แสดงความคิดเห็น