เลื่อนวิทยฐานะไม่ยากอย่างที่คิด : Dr. Prasit Rattanasupa: การตรวจคุณภาพของเครื่องมือ : ข้อสอบ

การตรวจคุณภาพของเครื่องมือ : ข้อสอบ

เรียบเรียงโดย ว่าที่ ร.ต. ดร. ประสิทธิ์ รัตนสุภา

ข้อสอบแบบเลือกตอบ (ทำถูก ได้ 1 คะแนน ทำผิด ได้ 0 คะแนน )

งานวิจัยจะมีความน่าเชื่อถือเพียงใดจะขึ้นอยู่กับเครื่องมือที่ใช้ในการเก็บรวบรวมข้อมูล ถ้าเครื่องมือไม่มีความตรง ก็ทำให้งานวิจัยขาดความเชื่อถือไปด้วย ข้อสอบเป็นเครื่องมือตัวหนึ่งในการเก็บข้อมูล การที่จะเป็นข้อสอบที่ดีนั้นควรเป็นข้อสอบที่มีการตรวจคุณภาพ อย่างน้อย 4 ประการ คือ 1. ความตรง (Validity) 2. ความเชื่อมั่น (Reliability) 3. ความยาก (Difficulty) และ 4. อำนาจจำแนก (Discrimination)

1. ความตรง (Validity)

ความตรง เป็นความสอดคล้องหรือความเหมาะสมของผลการวัดกับเนื้อเรื่อง หรือเกณฑ์ หรือทฤษฏีที่เกี่ยวกับลักษณะที่มุ่งวัดซึ่งมีหลายประเภท เช่น ความตรงเชิงเนื้อหา(Content Validity) ความตรงเชิงเกณฑ์สัมพันธ์ (Criterion-related Validity) ความตรงเชิงพยากรณ์(Predictive Validity) ในการตรวจคุณภาพของข้อสอบ ขอเสนอ ความตรงเชิงเนื้อหา(Content Validity)

ความตรงเชิงเนื้อหา (Content Validity) ขอนำเสนอวิธีการที่คุ้นเคยและสะดวกคือ จากการพิจารณาของผู้เชี่ยวชาญในศาสตร์นั้น ๆ จำนวน 3-5 คนเพื่อลงสรุป โดยใช้ดัชนีความสอดคล้องระหว่างข้อคำถามกับจุดประสงค์ (Index of Item-Objective Congruence : IOC) ที่มีเกณฑ์ในการพิจารณาให้คะแนน ดังนี้ ให้ +1 เมื่อแน่ใจว่าข้อคำถามมีความสอดคล้องกับจุดประสงค์ ให้ 0 เมื่อไม่แน่ใจว่าข้อคำถามมีความสอดคล้องกับจุดประสงค์ และให้-1 เมื่อแน่ใจว่าข้อคำถามไม่สอดคล้องกับจุดประสงค์หลังจากนั้นนำคะแนนของผู้เชี่ยวชาญมาหาค่าดัชนีความสอดคล้อง ฯ โดยใช้สูตรของ โรวิเนลลี และแฮมเบิลตัน มีสูตรการคำนวณ (Rovinelli and Hambleton, 1977 : 49-60) ซึ่งมีค่าเท่ากับผลรวมของคะแนนผู้เชี่ยวชาญแต่ละคน หารด้วยจำนวนผู้เชี่ยวชาญ (ดูสูตรจากต้นฉบับ)

เกณฑ์การพิจารณาระดับค่าดัชนีความสอดคล้องฯ (IOC) ตั้งแต่ 0.5 ขึ้นไป คัดเลือกข้อสอบข้อนั้นไว้ใช้ได้

ตารางที่ 1 ตัวอย่างรูปแบบแบบสอบถามในการส่งให้ผู้ทรงคุณวุฒิพิจารณาด้วยดัชนี IOC

แบบประเมินความสอดคล้องระหว่างจุดประสงค์กับข้อคำถาม

คำชี้แจง : 1.ประเมินความสอดคล้องระหว่างจุดประสงค์กับข้อคำถามโดยให้คะแนน ดังนี้

+1 เมื่อแน่ใจว่าข้อคำถามมีความสอดคล้องกับจุดประสงค์

0 เมื่อไม่แน่ใจว่าข้อคำถามมีความสอดคล้องกับจุดประสงค์

-1 เมื่อแน่ใจว่าข้อคำถามไม่สอดคล้องกับจุดประสงค์

จุดประสงค์	ข้อคำถาม	ผลการพิจารณา			ข้อเสนอแนะ
จุดประสงค์	ข้อคำถาม	+1	0	-1	ข้อเสนอแนะ
1.บอกองค์ประกอบ ของระบบคอมพิวเตอร์	1. ระบบคอมพิวเตอร์จัดแบ่งออกเป็น องค์ประกอบอะไรบ้าง ก. hardware, software, people ข. hardware, software ค. hardware, people ง. hardware, softwnw, internet
1.บอกองค์ประกอบ ของระบบคอมพิวเตอร์	2.
2. ……………………	3.
	4.
	5.

ตารางที่ 2 ตัวอย่างการนำเสนอผลการหาความสอดคล้องระหว่างข้อคำถามกับจุดประสงค์ของ

ข้อสอบ โดยผู้เชี่ยวชาญจำนวน 3 คนในการพิจารณาข้อคำถามข้อที่ 1-4 กับจุดประสงค์

ดังนี้

ข้อที่	คะแนนจากผู้เชี่ยวชาญ คนที่			ผลรวม	IOC	ผลการวิเคราะห์
ข้อที่	1	2	3	ผลรวม	IOC	ผลการวิเคราะห์
1	+1	+1	+1	+3	1.00	นำไปใช้ได้
2	0	0	0	0	0.00	ใช้ไม่ได้
3	+1	-1	-1	-1	-0.33	ใช้ไม่ได้
4	+1	+1	0	+2	0.67	นำไปใช้ได้

2. ความเชื่อมั่น (Reliability)

คุณภาพของเครื่องมือในการรวบรวมข้อมูลที่สำคัญอีกประการก็คือ ผลของการวัดจากเครื่องมือนั้นมีความคงเส้นคงวาในการวัดหรือไม่ นั่นคือ หากมีการใช้เครื่องมือวัดซ้ำกับคนกลุ่มเดิมอีก ผลการวัดแต่ละครั้งควรใกล้เคียงกัน ซึ่งหาได้หลายวิธี เช่น 1. วิธีการสอบซ้ำ (Test-Retest Method) 2. วิธีการใช้เครื่องมือคู่ขนาน (Parallel forms Method) 3. วิธีการแบ่งครึ่ง (Split-Half Method) 4. วิธีการหาความเป็นเอกพันธ์ภายใน (Internal Consistency Method)

ในการหาความเชื่อมั่น(Reliability) ของข้อสอบ ขอเลือก วิธีที่ 4 วิธีการหาความเป็นเอกพันธ์ภายใน (Internal Consistency Method) วิธีการหาความเป็นเอกพันธ์ภายใน วิธีนี้ใช้การเก็บข้อมูลครั้งเดียวแล้วหาความเชื่อมั่นไว้เลย การคำนวณอาจหาได้หลายวิธี คือ1) สูตร Kuder-Richardson 2) สูตรสัมประสิทธิ์แอลฟา (Coefficient Alpha) ในที่นี้ขอนำเสนอหาความเชื่อมั่น(Reliability) ของข้อสอบ จากสูตร Kuder-Richardson

สูตร Kuder-Richardson วิธีนี้สูตรที่ใช้มี 2 สูตร คือ 1) KR-20 และ 2) KR-21 โดย สูตร KR-20 สูตรของคูเดอร์-ริชาร์ดสัน 20 (KR-20) ข้อสอบแต่ละข้อไม่จำเป็นต้องมีความยากเท่ากันแต่ควรมีจำนวนข้อสอบอย่างน้อย 20 ข้อ ส่วน สูตร KR-21 เป็นสูตรการคำนวณค่าสัมประสิทธิ์ความเชื่อมั่นที่มี ข้อตกลงเบื้องต้นว่าข้อสอบแต่ละข้อต้องมีความยากเท่ากัน ทำให้สูตรการคำนวณมีความซับซ้อน น้อยลงแต่สูตรการคำนวณ KR-21 จะให้ค่าความเชื่อมั่นที่ต่ำกว่าการคำนวณด้วยสูตร KR-20 (Mehrens and Lehmann,1984 : 276) ในการหาความเชื่อมั่น(Reliability) ของข้อสอบ โดยทั่วไป ควรใช้ สูตร KR-20

เกณฑ์พิจารณาค่าความเชื่อมั่นของเครื่องมือวิจัย ค่าความเชื่อมั่นของเครื่องมือในการวิจัย มีเกณฑ์สาหรับพิจารณาว่าเป็นความเชื่อมั่น ที่ใช้ได้ในการนำเครื่องมือนั้น ๆ ไปใช้ มีดังนี้ (Burns and Grove,1997 : 327) ดังนี้

1. เครื่องมือที่ใช้วัดการทำหน้าที่ของอวัยวะต่าง ๆ ในร่างกายของมนุษย์ควรมีความเชื่อมั่น 0.95 ขึ้นไป

2. เครื่องมือที่มีมาตรฐานทั่ว ๆ ไปควรมีความเชื่อมั่นเท่ากับ 0.8 แต่ถ้าเป็นเครื่องมือที่สร้างและพัฒนาขึ้นควรมีความเชื่อมั่นอย่างน้อย 0.70

3. เครื่องมือที่ใช้วัดเจตคติ ความรู้สึก ควรมีความเชื่อมั่นตั้งแต่ 0.70 ขึ้นไป

4. เครื่องมือที่ใช้ในการสังเกต ควรมีค่าความเชื่อมั่นตั้งแต่ 0.80 ขึ้นไป

ข้อสอบเป็นเป็นเครื่องมือที่สร้างและพัฒนาขึ้นควรมีความเชื่อมั่นอย่างน้อย 0.70 (ค่ารวมทั้งฉบับ)

3. ความยาก (Difficulty: p)

ความยาก(Difficulty: p) หมายถึง เป็นคุณภาพของเครื่องมือที่เป็นแบบทดสอบ ที่แสดง สัดส่วนของผู้สอบที่ตอบข้อนั้นได้ถูกต้องต่อผู้สอบทั้งหมด ตามความมุ่งหมายและหลักเกณฑ์ เป็นการหาค่ารายข้อ

ข้อสอบที่ดีควรมีความยากง่ายพอเหมาะ ไม่ยากหรือง่ายเกินไป ข้อสอบฉบับหนึ่ง ควรมีผู้ตอบถูก
ไม่ต่ำกว่า 20 คนและไม่เกิน 80 คนจากผู้สอบ 100 คน นั่นคือค่า P อยู่ระหว่าง.20-.80 จึงถือว่าเป็น
ข้อสอบที่มีค่าความยากง่ายพอเหมาะ เกณฑ์พิจารณาค่าความยาก โดยที่ข้อสอบที่จะสามารถนาไปใช้ในการวัดผลที่มีประสิทธิภาพจะมีค่าความยากอยู่ ระหว่าง 0.20 ถึง 0.80

4. อำนาจจำแนก (Discrimination: r)

อำนาจจำแนก (Discrimination: r) หมายถึง คุณภาพของเครื่องมือที่สร้างขึ้นแล้วสามารถจำแนกกลุ่ม/บุคคลแยกออกจากกันเป็นกลุ่มตามลักษณะที่ตนเองเป็นอยู่/เกณฑ์ของความรอบรู้ได้อย่างมีประสิทธิภาพ (บุญเชิด ภิญโญอนันต์พงษ์. มปป.135-139) เป็นการหาค่ารายข้อ

เกณฑ์ในการพิจารณาอำนาจจำแนกของข้อสอบ r อย่างน้อย 0.20

ตารางที่ 3 ตัวอย่าง การนำเสนอข้อสอบที่คัดเลือกใช้เป็นเครื่องมือในงานวิจัยนี้

ข้อที่	IOC	p	r	หมายเหตุ
1
2

หมายเหตุ 1.ข้อสอบทั้งฉบับมีความเชื่อมั่น (Reliability) อย่างน้อย 0.70

2. Index of Item-Objective Congruence (IOC) มีค่าอย่างน้อย 0.5

3. ความยาก (Difficulty: p) มีค่าระหว่าง 0.20 ถึง 0.80

4. อำนาจจำแนก (Discrimination: r) มีค่าอย่างน้อย 0.20

5. ดาวน์โหลดโปรแกรมวิเคราะห์ข้อสอบ KR 20 คลิกที่นี่

โปรแกรมวิเคราะห์ข้อสอบ KR 20 (ลิงก์ 2) คลิกที่นี่

----------------------------------

เอกสารอ้างอิง

บุญเชิด ภิญโญอนันตพงษ์.(มปป). การวัดและประเมินผลการศึกษา ทฤษฎีและการประยุกต์.

กรุงเทพฯ:คณะศึกษาศาสตร์ มหาวิทยาลัยศรีนครินทรวิโรฒ ประสานมิตร.

Burns,N. and Grove,S.K. (1997). The practiceof nursing research : Conduct critique

&utilization (3thed). Pensylvania: Saunders.

Mehrens, W. A. & Lehmann, I. J. (1984). Measurement and education in evaluation and

psyschology. New York: Holt, Rinehart and Winston.

Rovinelli, R. J., & Hambleton, R. K. (1977). On the use of content specialists in the assessment of

criterion-referenced test item validity. Dutch Journal of Educational Research,

เลื่อนวิทยฐานะไม่ยากอย่างที่คิด : Dr. Prasit Rattanasupa

วันเสาร์ที่ 4 มิถุนายน พ.ศ. 2559

การตรวจคุณภาพของเครื่องมือ : ข้อสอบ

จุดประสงค์

ข้อคำถาม

ผลการพิจารณา

ข้อเสนอแนะ

ไม่มีความคิดเห็น:

แสดงความคิดเห็น