วันอาทิตย์ที่ 27 มีนาคม พ.ศ. 2559

การรายงานผลคะแนนอย่างเหมาะสม กรณีตัวอย่างรายงานผลคะแนน O-NET



         คะแนการทดสอบระดับชาติของไทย O-NET ก็เริ่มประกาศผลการทดสอบมาแล้ว คนที่ลุ้นมากกว่านักเรียนก็คือครูผู้สอน มีหลายโรงเรียนและหลายเขตพื้นที่การศึกษาได้ทำรายงานเพื่อรายงานผลคะแนนออกมาแล้ว ซึ่งในรายงานดังกล่าวถูกต้องไหม ผมตอบว่าถูกแต่ก็ยังไม่ถูกหลักและความเหมาะสมเลยทีเดียว  สทศ ที่เป็นหน่วยงานสถาบันที่เกี่ยวข้องกับเรื่องนี้เต็มๆ และผมเน้นย้ำอีกนะครับว่าจุดมุ่งหมายของการประกาศผลสอบในครั้งนี้ไม่ได้เป็นการมุ่งหวังเพื่อเปรียบเทียบ แต่ใช้เป็นสารสนเทศในการจัดการด้านการศึกษาต่อไป
        จากประสบการณ์การเป็นข้าราชการครูประมาณ 5 ปี ได้มีโอกาศทำงานด้านวิชาการอยู่บ้าง ยังไม่มีหน่วยงานให้ความรู้ในเรื่องดังกล่าวอย่างถูกต้อง วันนี้ผมในฐานคุณครูและนักวิจัย นักวัดผลและเป็นส่วนหนึ่งของหัวข้อดุษฏีนิพนธ์ เรื่อง การพัฒนาการรู้การประเมินของครู ด้วยการประเมินเพื่อการเรียนรู้แบบเสริมพลังอำนาจ โดยการรู้การประเมินของครู (Assessment Literacy) นั้นเป็นเรื่องที่ต้องได้รับการส่งเสริมอย่างถูกต้องและถูกวิธี อย่างยั่งยืน และมีองค์ประกอบหนึ่งที่เกี่ยวข้องโดยตรงเลยคือ เรื่อง การรายงานผลคะแนนอย่างเหมาะสม เพื่อเป็นการส่งเสริมความความเข้าที่ถูกต้องและเหมาะสม จึงอยากจะขอยกกรณีตัวอย่าง การรวมผลคะแนนโอเน็ตในระดับโรงเรียน โดยเป็นวิธีการที่ถูกต้องที่สุดไหม ผมตอบว่าไม่ แต่เป็นวิธีการที่เหมาะสมและมีความน่าเชื่อถือ

ตัวอย่าง ผลการทดสอบ O-NET
วิชา Mean SD
ไทย 52.08 6.02
คณิต 50.00 5.00
วิทย์ 43.42 5.22
สังคม 52.33 7.16
อังกฤษ 45.42 9.83
Mean รวม 48.65
SD รวม 3.60

         เมื่อผลการทดสอบประกาศมา ก็จะมีการจัดทำรายงานโดยก็จะรายงานเป็น ในภาพรวมของโรงเรียนแห่งนี้ มีผลการทดสอบรวม เท่ากับ 48.65 (ไทย+คณิต+วิทย์+สังคม+อังกฤษ) ส่วนเบี่ยงเบนมาตรฐาน เท่ากับ 3.06 (ไทย+คณิต+วิทย์+สังคม+อังกฤษ) 
         การรวมกันทั้ง 5 วิชานั้น โดยช่วงคะแนนเท่ากัน คือทุกวิชาคะแนนเต็ม 100 เท่ากัน แต่ทางการวัดผลถือว่าเป็นการรวมสิ่งที่ต่างกัน ยกตัวอย่างเช่น การรวมกันของ มะนาว มะพร้าม ส้มโอ แตงโม และลำไย ดังนั้นแล้วหากต้องการรวมสิ่งเหล่านี้เข้าด้วยกันก็ควรมีการปรับให้ทุกอย่างอยู่ภายใต้เงื่อนไขเดียวกัน จึงควรปรับให้เป็นคะแนนมาตรฐาน (รายงานเป็น Z-SCORE หรือ T-SCORE) แล้วจึงรายงานผล
จะทำให้ผลการรายงานมีความน่าเชื่อถือเพิ่มมากขึ้น ใช้เป็นสารสนเทศในการบริหารจัดการต่อไป

การแปลงเป็นคะแนน Z-SCORE จากสูตร (คะแนนรายวิชา-MEAN5วิชา)/SDรวม5วิชา

การแปลงเป็นคะแนน T-SCORE จากสูตร (10Z+50)

ดังนั้นจะหา T-SCORE ได้ ต้องทราบค่า Z-SCORE ก่อน

ตัวอย่าง ปรับคะแนนวิชาภาษาไทยเป็นคะแนน Z-SCORE  = (52.08-48.65)/3.60  = 0.952
ตัวอย่าง ปรับคะแนนวิชาภาษาไทยเป็นคะแนน T-SCORE  = 10(0.952)+50 = 59.519

และทำการแปลทุกรายวิชา

วิชา Mean SD Z-SCORE T-SCORE
ไทย 52.08 6.02 0.952 59.519
คณิต 50.00 5.00 0.375 53.747
วิทย์ 43.42 5.22 -1.451 35.485
สังคม 52.33 7.16 1.021 60.213
อังกฤษ 45.42 9.83 -0.896 60.213
Mean รวม 48.65
SD รวม 3.60


          รายงานผลเราก็รายงานในภาพรวม แต่ในครั้งนี้เราจะใช้คะแนนมาตรฐานเป็นตัวรายงาน ซึ่งถือว่าเป็นวิธีที่เหมาะสม ในครั้งนี้ผู้เขียนจะแสดงการรายงานผลทั้ง Z-SCORE และ T-SCORE

กรณี  Z-SCORE 
     วิชาภาษาไทย Z-SCORE = 59.519 หมายความว่า คะแนนภาษาไทย มีผลการทดสอบที่สูงกว่าค่าเฉลี่ยของโรงเรียน
      วิชาคณิต Z-SCORE = 0.375 หมายความว่า คะแนนคณิต มีผลการทดสอบที่สูงกว่าค่าเฉลี่ยของโรงเรียน
       วิชาวิทย์ Z-SCORE = -1.451 หมายความว่า คะแนนวิทย์ มีผลการทดสอบที่ต่ำกว่าค่าเฉลี่ยของโรงเรียน
       วิชาสังคม Z-SCORE = 1.021 หมายความว่า คะแนนสังคม มีผลการทดสอบสูงกว่าค่าเฉลี่ยของโรงเรียน
       วิชาอังกฤษ Z-SCORE = -0.896 หมายความว่า คะแนนอังกฤษ มีผลการทดสอบที่ต่ำกว่าค่าเฉลี่ยของโรงเรียน
   ****หากแปลงเป็นคะแนน Z-SCORE เครื่องหมายเข้ามาเกี่ยวข้อง คือ + และ - โดยหากผลไปในทิศทางบวกแสดงว่ามากกว่าค่าเฉลี่ย และในทางตรงกันข้ามหากมีทิศทางไปด้านลบก็จะหมายถึงต่ำกว่าค่าเฉลี่ย****

กรณี  T-SCORE 
         วิชาภาษาไทย T-SCORE = 0.952 หมายความว่า คะแนนภาษาไทย มีผลการทดสอบที่สูงกว่าค่าเฉลี่ยของโรงเรียน
          วิชาคณิต T-SCORE = 53.747 หมายความว่า คะแนนคณิต มีผลการทดสอบที่สูงกว่าค่าเฉลี่ยของโรงเรียน
          วิชาวิทย์ T-SCORE = 35.485 หมายความว่า คะแนนวิทย์ มีผลการทดสอบที่ต่ำกว่าค่าเฉลี่ยของโรงเรียน
           วิชาสังคม T-SCORE = 60.213 หมายความว่า คะแนนสังคม มีผลการทดสอบสูงกว่าค่าเฉลี่ยของโรงเรียน
           วิชาอังกฤษ T-SCORE = 60.213 หมายความว่า คะแนนอังกฤษ มีผลการทดสอบสูงกว่าค่าเฉลี่ยของโรงเรียน
         ****หากแปลงเป็นคะแนน T-SCORE มากกว่า 50 แสดงว่ามากกว่าค่าเฉลี่ย และน้อยกว่า 50 แสดงว่าต่ำกว่าค่าเฉลี่ย****

            ผู้เขียนหวังเป็นอย่างยิ่งว่า ผุ้ที่มีส่วนเกี่ยวข้องจะได้ใช้ความรู้จากการอ่านในครั้งนี้ไปปรับใช้กับการรายงานผลคะแนน  จุดประสงค์ของ สทศ ที่ปรับให้หน่วย 100 เท่ากัน ก็เพื่อที่จะให้ครูผู้สอนใช้เปรียบเทียบภายในโรงเรียน หรือรายวิชานั้นๆ ในภาคเรียนนั้นๆ เท่านั้น  หากจะปรับหรือเปรียบเทียบหรือรวมกัน จึงควรปรับให้เป็นคะแนนมาตรฐานดังตามตัวอย่างข้างต้น
             ถือแม้ว่าการรายงานผล ความหมายจะไม่เปลี่ยนจากการรายงานโดยใช้ค่าเฉลียเลย แต่ผู้เขียนก็อธิบายแล้วว่า คะแนนมาตรฐานเป็นการปรับแก้สิ่งที่ต่างกันให้สามารถเปรียบเทียบกันได้อย่างมีความน่าเชื่อถือนะครับ
                                                                                                                        อิสระ กุลวุฒิ 28/03/2559
                                                                                                                   เขียนที่ร้าน Together coffee



วันอาทิตย์ที่ 6 มีนาคม พ.ศ. 2559

ความยากของข้อสอบสำคัญไหม

          ก่อนจะพิจารณาว่าความยากของข้อสอบสำคัญไหม เรามาทำความรู้จักกับความยากของแบบทดสอบกันก่อน โดยในการเขียนแสดงความคิดเห็นครั้งนี้เป็นการใช้กรณีศึกษาของแบบทดสอบผลสัมฤทธิ์ทางการศึกษาทั่วไปที่เป็นกรณีตอบถูกกำหนดให้เป็น 1 และตอบผิดกำหนดให้เป็น 0
1.      ความยากข้อข้อสอบคืออะไร ตอบแบบทางการหน่อยมันก็คืออัตราส่วนของผู้ที่ตอบถูกหารด้วยผู้ที่
เข้าสอบทั้งหมดโดยพิจารณาเป็นรายข้อ จะเห็นได้ว่าหากผู้ที่ตอบถูกในข้อนั้นๆ มากจะทำให้ค่าความยากมีค่าสูง(ข้อนี้คนตอบถูกเยอะน่าจะง่าย) ในทางตรงกันข้ามหากมีผู้ที่ตอบข้อสอบข้อนั้นถูกจำนวนไม่มากก็จะทำให้ค่าความยากมีค่าน้อย (ข้อนี้คนตอบถูกน้อยน่าจะยาก)
ตัวอย่าง มีผู้เข้าสอบทั้งหมด 10 คน ในข้อที่ 1 ตอบถูกทั้งสิ้นจำนวน 8 คน ค่าความยากจะเท่ากับ 8/10=0.80 และในข้อที่ 2 ตอบถูกทั้งสินจำนวน 3 คน ค่าความยากจะเท่ากับ 2/10= 0.20 คน
2.      0.20 ถึง 0.80 เป็นค่าที่ถือว่าข้อสอบมีคุณภาพจริงหรือ หากศึกษาจากตำราไทยร้อยละ 99.99
มีทิศทางเดียวกันคือ ค่าความยากตั้งแต่ 0.20 ถึง 0.80 ถือว่าข้อสอบข้อนั้นมีค่าความยากที่ถือว่าใช้ได้ ควรเก็บข้อคำถามนั้นไว้ใช้เก็บข้อมูลจริงได้ คำถามในใจต่อมาจริงหรือ ต้องตอบก่อนว่าเหตุผลที่ตำราไทยให้คำแนะนำว่าข้อสอบควรมีค่าความยากระหว่าง 0.20 ถึง 0.80 เพราะในการทดสอบที่ใช้ข้อสอบแบบกรณี 2 ค่า (Dichotomous) คือกำหนดให้ตัวเลือก (Choice) ตอบถูกกำหนดให้มีค่าเป็น 1 ตอบผิดให้มีค่าเป็น 0 จะเชื่อโยงเข้าไปสู่ความแปรปรวนรายข้อ คือกำหนดช่วงให้มีขนาดกว้างมากขึ้นจะทำให้ความแปรปรวนรายข้อของข้อสอบข้อนั้นลดต่ำลง และเมื่อความแปรปรวนของข้อคำถามลดต่ำลงก็จะเป็นปัจจัยที่นำไปสู่ความเที่ยงของข้อสอบกรณีอิงกลุ่ม (KR-20, KR-21) สูงขึ้นนั้นเอง ดังนั้นแล้วสารสนเทศที่ได้จากค่าความยากของข้อสอบจึงบอกความมีคุณภาพได้ไม่มาก จึงควรใช้เกณฑ์การหาคุณภาพของข้อสอบอื่นๆ ร่วมด้วย
3.      เราไม่ต้องการความยากได้ไหม ในการแสดงความคิดเห็นครั้งนี้เน้นนะครับคือการยกตัวอย่างบริบท
จริงกับแบบทดสอบผลสัมฤทธิ์ทางการเรียน ที่ครูใช้กับนักเรียนโดยทั่วไป ตอบครับหากต้องการทำให้ถูกต้องตามกระบวนการวิจัยหรือระเบียบวิธีวิจัยไทยที่ทำตามกันมา การหาความยากก็ไม่เสียหายอะไร แต่ในมุมมองที่เปิดกว้างทางการศึกษาด้านสังคมศาสตร์และพฤติกรรมศาสตร์เราไม่จำเป็นต้องการค่าความยากก็ได้หากตัวครูผู้สอนสร้างข้อคำถามได้มีความตรง (Validity) คำเตือน หากท่านทำงานวิจัยเพื่อเลื่อนวิทยฐานะควรทำตามกติกา เพราะเนื่องจากกรรมการที่ตรวจงานของท่านมักไม่เปิดมุมมองข้างต้น แต่หากพูดถึงกรณีการนำความยากไปใช้ประโยชน์ทางตรงกรณีที่โรงเรียนมีการใช้ระบบคลังข้อสอบหรือพัฒนาคลังข้อสอบ (Item bank)
4.      อยากให้ครูนำประโยชน์จากความยากไปใช้ กรณีนี้อาจจะไม่ถึงระบบคลังข้อสอบก็ได้ ยกตัวอย่าง
โต้งสอบวิชาวิทยาศาสตร์ตก ครูผู้สอนหากคำนึงถึงความได้เปรียบเสียเปรียบความเท่าเทียบกัน ครูก็ต้องใช้ข้อสอบข้อใหม่แต่มีความยากที่ใกล้เคียงกันหรือเท่ากับของเดิมซึ่งเป็นได้ได้ยากและเสียเวลามากถ้าไม่มีระบบคลังข้อสอบ
จากประโยชน์ข้างต้นทำให้ทุกวันนี้ถูกพัฒนาไปในเรื่องของการทำหน้าที่ต่างกันของข้อสอบ ภาษานักวัดผลจะพูดว่าข้อสอบข้องนั้น diff ไหม

          ความยากข้อสอบสอบเป็นการแสดงจำนวนคนหรืออัตราส่วนที่ตอบถูกในข้อนั้นๆ ประโยชน์ที่ได้จากการหานำไปใช้ประโยชน์ได้น้อย หากผู้ประเมินผลการวิจัยที่ตั้งตนเป็นผู้เชี่ยวชาญแต่ไม่เชี่ยวชาญเปิดใจรับฟังเหตุผลจะทำให้ครูประหยัดเวลาอาจจะไม่มาก แต่ก็หากแล้วไม่ได้ใช้ประโยชน์อะไรต่อ  แต่หากโรงเรียนของท่านมีระบบคลังข้อสอบ (Item bank) หรือกำลังพัฒนาภายใต้การวัดแบบดั่งเดิมความยากจำเป็นอย่างมากที่ครูจำเป็นต้องหา

วัตถุประสงค์การวิจัย 3 ข้อ สูตรยาผีบอก

      นโยบายเปลี่ยน การปฏิบัติก็เปลี่ยน การทำวิจัยในครูก็ยิ่งลดลง เนื่องด้วยการประเมินวิทยฐานะแบบใหม่หรือเรียกกันติดปากว่า ว.21 วันนี้จะมาพ...