การตรวจคุณภาพของเครื่องมือ : ข้อสอบ
เรียบเรียงโดย
ว่าที่ ร.ต. ดร. ประสิทธิ์ รัตนสุภา
ข้อสอบแบบเลือกตอบ (ทำถูก ได้ 1 คะแนน ทำผิด ได้ 0 คะแนน )
งานวิจัยจะมีความน่าเชื่อถือเพียงใดจะขึ้นอยู่กับเครื่องมือที่ใช้ในการเก็บรวบรวมข้อมูล
ถ้าเครื่องมือไม่มีความตรง
ก็ทำให้งานวิจัยขาดความเชื่อถือไปด้วย
ข้อสอบเป็นเครื่องมือตัวหนึ่งในการเก็บข้อมูล
การที่จะเป็นข้อสอบที่ดีนั้นควรเป็นข้อสอบที่มีการตรวจคุณภาพ อย่างน้อย 4 ประการ คือ 1. ความตรง (Validity) 2. ความเชื่อมั่น
(Reliability) 3. ความยาก (Difficulty) และ 4. อำนาจจำแนก
(Discrimination)
1. ความตรง (Validity)
ความตรง เป็นความสอดคล้องหรือความเหมาะสมของผลการวัดกับเนื้อเรื่อง
หรือเกณฑ์ หรือทฤษฏีที่เกี่ยวกับลักษณะที่มุ่งวัดซึ่งมีหลายประเภท
เช่น
ความตรงเชิงเนื้อหา(Content
Validity) ความตรงเชิงเกณฑ์สัมพันธ์ (Criterion-related
Validity) ความตรงเชิงพยากรณ์(Predictive Validity) ในการตรวจคุณภาพของข้อสอบ ขอเสนอ ความตรงเชิงเนื้อหา(Content
Validity)
ความตรงเชิงเนื้อหา
(Content
Validity) ขอนำเสนอวิธีการที่คุ้นเคยและสะดวกคือ
จากการพิจารณาของผู้เชี่ยวชาญในศาสตร์นั้น ๆ จำนวน 3-5 คนเพื่อลงสรุป
โดยใช้ดัชนีความสอดคล้องระหว่างข้อคำถามกับจุดประสงค์ (Index of
Item-Objective Congruence : IOC) ที่มีเกณฑ์ในการพิจารณาให้คะแนน ดังนี้
ให้ +1 เมื่อแน่ใจว่าข้อคำถามมีความสอดคล้องกับจุดประสงค์ ให้ 0 เมื่อไม่แน่ใจว่าข้อคำถามมีความสอดคล้องกับจุดประสงค์
และให้-1 เมื่อแน่ใจว่าข้อคำถามไม่สอดคล้องกับจุดประสงค์หลังจากนั้นนำคะแนนของผู้เชี่ยวชาญมาหาค่าดัชนีความสอดคล้อง
ฯ โดยใช้สูตรของ โรวิเนลลี และแฮมเบิลตัน มีสูตรการคำนวณ (Rovinelli and
Hambleton, 1977 : 49-60) ซึ่งมีค่าเท่ากับผลรวมของคะแนนผู้เชี่ยวชาญแต่ละคน
หารด้วยจำนวนผู้เชี่ยวชาญ (ดูสูตรจากต้นฉบับ)
เกณฑ์การพิจารณาระดับค่าดัชนีความสอดคล้องฯ
(IOC) ตั้งแต่ 0.5 ขึ้นไป คัดเลือกข้อสอบข้อนั้นไว้ใช้ได้
ตารางที่ 1 ตัวอย่างรูปแบบแบบสอบถามในการส่งให้ผู้ทรงคุณวุฒิพิจารณาด้วยดัชนี
IOC
แบบประเมินความสอดคล้องระหว่างจุดประสงค์กับข้อคำถาม
คำชี้แจง
:
1.ประเมินความสอดคล้องระหว่างจุดประสงค์กับข้อคำถามโดยให้คะแนน ดังนี้
+1 เมื่อแน่ใจว่าข้อคำถามมีความสอดคล้องกับจุดประสงค์
0 เมื่อไม่แน่ใจว่าข้อคำถามมีความสอดคล้องกับจุดประสงค์
-1 เมื่อแน่ใจว่าข้อคำถามไม่สอดคล้องกับจุดประสงค์
จุดประสงค์ |
ข้อคำถาม |
ผลการพิจารณา |
ข้อเสนอแนะ |
||
+1
|
0
|
-1
|
|||
1.บอกองค์ประกอบ
ของระบบคอมพิวเตอร์
|
1. ระบบคอมพิวเตอร์จัดแบ่งออกเป็น
องค์ประกอบอะไรบ้าง
ก.
hardware, software, people
ข.
hardware, software
ค.
hardware, people
ง.
hardware, softwnw, internet
|
||||
2.
|
|||||
2. ……………………
|
3.
|
||||
4.
|
|||||
5.
|
ตารางที่
2 ตัวอย่างการนำเสนอผลการหาความสอดคล้องระหว่างข้อคำถามกับจุดประสงค์ของ
ข้อสอบ โดยผู้เชี่ยวชาญจำนวน 3 คนในการพิจารณาข้อคำถามข้อที่ 1-4 กับจุดประสงค์
ดังนี้
ข้อที่
|
คะแนนจากผู้เชี่ยวชาญ คนที่
|
ผลรวม
|
IOC
|
ผลการวิเคราะห์
|
||
1
|
2
|
3
|
||||
1
|
+1
|
+1
|
+1
|
+3
|
1.00
|
นำไปใช้ได้
|
2
|
0
|
0
|
0
|
0
|
0.00
|
ใช้ไม่ได้
|
3
|
+1
|
-1
|
-1
|
-1
|
-0.33
|
ใช้ไม่ได้
|
4
|
+1
|
+1
|
0
|
+2
|
0.67
|
นำไปใช้ได้
|
2. ความเชื่อมั่น (Reliability)
คุณภาพของเครื่องมือในการรวบรวมข้อมูลที่สำคัญอีกประการก็คือ
ผลของการวัดจากเครื่องมือนั้นมีความคงเส้นคงวาในการวัดหรือไม่ นั่นคือ หากมีการใช้เครื่องมือวัดซ้ำกับคนกลุ่มเดิมอีก
ผลการวัดแต่ละครั้งควรใกล้เคียงกัน ซึ่งหาได้หลายวิธี เช่น 1. วิธีการสอบซ้ำ (Test-Retest Method) 2. วิธีการใช้เครื่องมือคู่ขนาน (Parallel forms Method) 3. วิธีการแบ่งครึ่ง (Split-Half Method) 4. วิธีการหาความเป็นเอกพันธ์ภายใน
(Internal Consistency Method)
ในการหาความเชื่อมั่น(Reliability) ของข้อสอบ ขอเลือก วิธีที่ 4 วิธีการหาความเป็นเอกพันธ์ภายใน (Internal Consistency Method) วิธีการหาความเป็นเอกพันธ์ภายใน วิธีนี้ใช้การเก็บข้อมูลครั้งเดียวแล้วหาความเชื่อมั่นไว้เลย
การคำนวณอาจหาได้หลายวิธี คือ1) สูตร
Kuder-Richardson 2) สูตรสัมประสิทธิ์แอลฟา (Coefficient
Alpha) ในที่นี้ขอนำเสนอหาความเชื่อมั่น(Reliability) ของข้อสอบ
จากสูตร Kuder-Richardson
สูตร Kuder-Richardson
วิธีนี้สูตรที่ใช้มี 2 สูตร คือ 1)
KR-20 และ 2) KR-21 โดย สูตร KR-20 สูตรของคูเดอร์-ริชาร์ดสัน 20
(KR-20) ข้อสอบแต่ละข้อไม่จำเป็นต้องมีความยากเท่ากันแต่ควรมีจำนวนข้อสอบอย่างน้อย
20 ข้อ ส่วน สูตร KR-21 เป็นสูตรการคำนวณค่าสัมประสิทธิ์ความเชื่อมั่นที่มี
ข้อตกลงเบื้องต้นว่าข้อสอบแต่ละข้อต้องมีความยากเท่ากัน ทำให้สูตรการคำนวณมีความซับซ้อน
น้อยลงแต่สูตรการคำนวณ KR-21 จะให้ค่าความเชื่อมั่นที่ต่ำกว่าการคำนวณด้วยสูตร
KR-20 (Mehrens and Lehmann,1984 : 276) ในการหาความเชื่อมั่น(Reliability) ของข้อสอบ โดยทั่วไป
ควรใช้ สูตร KR-20
เกณฑ์พิจารณาค่าความเชื่อมั่นของเครื่องมือวิจัย
ค่าความเชื่อมั่นของเครื่องมือในการวิจัย มีเกณฑ์สาหรับพิจารณาว่าเป็นความเชื่อมั่น
ที่ใช้ได้ในการนำเครื่องมือนั้น ๆ ไปใช้ มีดังนี้ (Burns and Grove,1997 :
327) ดังนี้
1. เครื่องมือที่ใช้วัดการทำหน้าที่ของอวัยวะต่าง ๆ ในร่างกายของมนุษย์ควรมีความเชื่อมั่น
0.95 ขึ้นไป
2. เครื่องมือที่มีมาตรฐานทั่ว ๆ ไปควรมีความเชื่อมั่นเท่ากับ
0.8 แต่ถ้าเป็นเครื่องมือที่สร้างและพัฒนาขึ้นควรมีความเชื่อมั่นอย่างน้อย
0.70
3. เครื่องมือที่ใช้วัดเจตคติ ความรู้สึก ควรมีความเชื่อมั่นตั้งแต่
0.70 ขึ้นไป
4.
เครื่องมือที่ใช้ในการสังเกต ควรมีค่าความเชื่อมั่นตั้งแต่
0.80 ขึ้นไป
ข้อสอบเป็นเป็นเครื่องมือที่สร้างและพัฒนาขึ้นควรมีความเชื่อมั่นอย่างน้อย 0.70 (ค่ารวมทั้งฉบับ)
3. ความยาก (Difficulty: p)
ความยาก(Difficulty: p) หมายถึง เป็นคุณภาพของเครื่องมือที่เป็นแบบทดสอบ ที่แสดง สัดส่วนของผู้สอบที่ตอบข้อนั้นได้ถูกต้องต่อผู้สอบทั้งหมด
ตามความมุ่งหมายและหลักเกณฑ์ เป็นการหาค่ารายข้อ
ข้อสอบที่ดีควรมีความยากง่ายพอเหมาะ ไม่ยากหรือง่ายเกินไป ข้อสอบฉบับหนึ่ง ควรมีผู้ตอบถูก
ไม่ต่ำกว่า 20 คนและไม่เกิน 80 คนจากผู้สอบ 100 คน นั่นคือค่า P อยู่ระหว่าง.20-.80 จึงถือว่าเป็น
ข้อสอบที่มีค่าความยากง่ายพอเหมาะ เกณฑ์พิจารณาค่าความยาก โดยที่ข้อสอบที่จะสามารถนาไปใช้ในการวัดผลที่มีประสิทธิภาพจะมีค่าความยากอยู่ ระหว่าง 0.20 ถึง 0.80
ไม่ต่ำกว่า 20 คนและไม่เกิน 80 คนจากผู้สอบ 100 คน นั่นคือค่า P อยู่ระหว่าง.20-.80 จึงถือว่าเป็น
ข้อสอบที่มีค่าความยากง่ายพอเหมาะ เกณฑ์พิจารณาค่าความยาก โดยที่ข้อสอบที่จะสามารถนาไปใช้ในการวัดผลที่มีประสิทธิภาพจะมีค่าความยากอยู่ ระหว่าง 0.20 ถึง 0.80
4. อำนาจจำแนก (Discrimination: r)
อำนาจจำแนก (Discrimination: r) หมายถึง คุณภาพของเครื่องมือที่สร้างขึ้นแล้วสามารถจำแนกกลุ่ม/บุคคลแยกออกจากกันเป็นกลุ่มตามลักษณะที่ตนเองเป็นอยู่/เกณฑ์ของความรอบรู้ได้อย่างมีประสิทธิภาพ
(บุญเชิด ภิญโญอนันต์พงษ์. มปป.135-139)
เป็นการหาค่ารายข้อ
เกณฑ์ในการพิจารณาอำนาจจำแนกของข้อสอบ r อย่างน้อย 0.20
ตารางที่
3 ตัวอย่าง การนำเสนอข้อสอบที่คัดเลือกใช้เป็นเครื่องมือในงานวิจัยนี้
ข้อที่
|
IOC
|
p
|
r
|
หมายเหตุ
|
1
|
||||
2
|
หมายเหตุ 1.ข้อสอบทั้งฉบับมีความเชื่อมั่น
(Reliability) อย่างน้อย 0.70
2. Index of
Item-Objective Congruence (IOC) มีค่าอย่างน้อย 0.5
3. ความยาก (Difficulty: p) มีค่าระหว่าง 0.20 ถึง 0.80
4. อำนาจจำแนก (Discrimination: r) มีค่าอย่างน้อย 0.20
5. ดาวน์โหลดโปรแกรมวิเคราะห์ข้อสอบ
KR 20 คลิกที่นี่
โปรแกรมวิเคราะห์ข้อสอบ KR 20 (ลิงก์ 2) คลิกที่นี่
----------------------------------
เอกสารอ้างอิง
บุญเชิด
ภิญโญอนันตพงษ์.(มปป). การวัดและประเมินผลการศึกษา ทฤษฎีและการประยุกต์.
กรุงเทพฯ:คณะศึกษาศาสตร์
มหาวิทยาลัยศรีนครินทรวิโรฒ ประสานมิตร.
Burns,N. and Grove,S.K. (1997). The
practiceof nursing research : Conduct critique
&utilization
(3thed).
Pensylvania: Saunders.
Mehrens, W. A. & Lehmann, I. J. (1984). Measurement and education in evaluation and
psyschology. New York: Holt, Rinehart and Winston.
Rovinelli, R. J., & Hambleton, R.
K. (1977). On the use of content
specialists in the assessment of
criterion-referenced
test item validity. Dutch Journal of Educational Research,
ไม่มีความคิดเห็น:
แสดงความคิดเห็น