วันพุธที่ 27 เมษายน พ.ศ. 2559

มันคืออำนาจจำแนกของแบบสอบถามจริงหรือ


            คำถามว่าทำไม เป็นคำถามที่ดีสำหรับคนที่ต้องการค้นหาคำตอบ เพราะคำว่าทำไมทำให้เกิดการหาคำตอบของคำว่าทำไม และแล้ววันหนึ่งคำว่าทำไมของผมก็เขามาเกี่ยวกับกับการหาอำนาจจำแนกของแบบสอบถามในโปรแกรม SPSS ซึ่งดูแล้วมันขัดแย้งกันในเชิงนิยาม
            เราต้องมาดูความหมายของอำนาจจำแนก หมายถึง ความสามารถของข้อคำถามที่สามารถจำแนกออกได้ตามสิ่งที่เราต้องการ เช่น แบบสอบถามเจตคติเกี่ยวกับการเรียน อำนาจจำแนกในกรณีนี้จะหมายถึง ข้อคำถามที่สามารถจำแนกคนออกเป็น 2 กลุ่มคือ คนที่มีเจตคติเกี่ยวกับการเรียน และคนที่ไม่มีเจตคติเกี่ยวกับการเรียน จากได้ศึกษาวิธีการสร้างและหาคุณภาพเครื่องมือ ในครั้งนี้เจาะจงแค่แบบสอบถามที่ให้ตอบเป็นแบบ Rating scale โดยจะเริ่มจากการนิยามศัพท์เฉพาะ สร้างข้อคำถามให้ครอบคลุมกับนิยามศัพท์ จากนั้นผ่านกระบวนการหาคุณภาพเครื่องมือ ไม่ว่าจะเป็นความตรงจากผู้ทรงคุณวุฒิ หาอำนาจจำแนกรายข้อ รวมถึงหาคุณภาพทั้งฉบับ ผู้เขียนจึงได้ทำการศึกษาวิธีการหาคุณภาพเครื่องมือของต่างประเทศผ่านการใช้โปรแกรม SPSS จึงได้พบกับความจริงบางอย่างที่ในไทยยังเข้าใจคลาดเคลื่อน




         ในเมืองไทยจะพบว่าการหาอำนาจจำแนกผ่านโปรแกรม SPSS จะดูค่าที่ช่อง Corrected Item-Total Correlation แล้วกำหนดค่า 0.2 ถึง 1.00 เป็นค่าที่บ่งชี้ว่าข้อดังกล่าวที่มีอำนาจจำแนก ซึ่งเป็นความเข้าใจที่คลาดเคลื่อนอย่างมากเพราะช่อง Corrected Item-Total Correlation ถือได้ว่าเป็น Correlation จากการคำนวณ จำเป็นอย่างยิ่งต้องเปิดตารางเพื่อหาค่าวิกฤตไว้เปรียบเทียบ ซึ่งค่าไหนที่มากกว่าค่าวิกฤตถือว่าเป็นข้อที่มีอำนาจจำแนก แต่ก็มีนักวิจัยส่วนใหญ่ที่ยังถ่ายทอดและทำผิดโดยยึดเกณฑ์ 0.2 ถึง 1.00 (เป็นเกณฑ์ของระบบคำตอบที่เป็น Dichotomous ตอบผิดกำหนดให้เป็น 0 ตอบถูกกำหนดให้เป็น 1) 
         จากความเข้าใจคลาดเคลื่อนเรื่องของการใช้เกณฑ์อำนาจจำแนกผิดประเภทแล้ว คำถามต่อมาคือ ช่อง Corrected Item-Total Correlation คือ ช่องที่ระบุอำนาจจำแนกจริงหรือ



          ซึ่งเมื่อตรวจสอบและการคำนวณแล้วค่าจากช่อง Corrected Item-Total Correlation  ไม่ตรงกับความหมายของอำนาจแจกแนก ซึ่งความหมายที่แท้จริงแล้วคือ จากที่ยกตัวอย่างแล้วมีข้อคำถามทั้งสิ้น 65 ข้อ ค่า Corrected Item-Total Correlation ข้อที่ b1 = .725 หมายถึง สหสัมพันธ์ระหว่างข้อมูลของข้อที่ b1 กับ ผลรวมข้อข้อที่ b2 ถึง b65 หรือ  สหสัมพันธ์ระหว่างข้อมูลของข้อที่ b1 กับ ค่าเฉลี่ยของข้อที่ b2 ถึง b65

  
              ซึ่งจะหมายถึงความสัมพันธ์ของ ข้อ b1 สัมพันธ์กับ ข้อที่เหลือเท่าไร ซึ่งขัดแย้งกับความหมายของอำนาจจำแนก หรืออาจจะกล่าวไว้ช่อง ช่อง Corrected Item-Total Correlation เป็นการหาความสอดคล้องของข้อคำถามรายข้อกับภาพรวมกับข้อคำถามที่เหลือ
              หากปรับเปลียนและทำความเข้าใจที่ถูกต้องยอมรับฟังด้วยเหตุและผลจะทำให้ระเบียบวิธีการวิจัย การสร้างเครื่องมือการหาคุณภาพของเครื่องมือมีความถูกต้องและมีความน่าเชื่อถือมากขึ้น

ความสุขของอิสระ
27 เมษายน 2559
เขียนที่คอนโดหรูใกล้หาดบางแสน

วันจันทร์ที่ 11 เมษายน พ.ศ. 2559

การกำหนดจำนวนกลุ่มตัวอย่างใน SEM

การกำหนดจำนวนกลุ่มตัวอย่างใน SEM
            จำนวนกลุ่มตัวอย่างที่นำมาเพื่อคำนวณ หาคำตอบในงานวิจัยเชิงปริมาณนั้นมีกฎเกณฑ์ในการตั้งไว้อยู่มากหมาย เมื่อกำหนดความพอเพียงต่อการคำนวณทดสอบสมมติฐานได้ก็จะทำให้งานวิจัยเพิ่มความน่าเชื่อถือมากขึ้น โดยในการกำหนดขนาดความพอเพียงได้มีนักวิชาการทั้งไทยและเทศได้กำการกำหนดไว้ เช่น การนับจำนวนตัวแปรสังเกตได้ แล้วทำการคูณด้วย 5 ถึง 20 เท่า ก็จะเป็นจำนวนที่กลุ่มตัวอย่างที่ต้องการ หรือการนับค่าพารามิเตอร์ที่ต้องการประมาณค่า แล้วทำการคูณด้วย 20 เท่า วันนี้ผู้เขียนอยากแนะนำเว็บไซต์ที่ใช้คำนวณขนาดหรือจำนวนกลุ่มตัวอย่างของสมการโครงสร้าง SEM นั้นคือhttp://www.danielsoper.com/statcalc/calculator.aspx?id=1 เมื่อเข้าไปแล้วจะพบกับเว็บไซต์ดังนี้
          

         
            จากนั้นเลือกให้โปรแกรมเพื่อคำนวณขนาดกลุ่มตัวอย่าง Sample Size

            เลือก A-priori Sample Size Calculator for Structural Equation Models  เพื่อคำนวณหาจำนวนกลุ่มตัวอย่างที่ต้องการ

                   จากนั้นกรอกลายละเอียดเกี่ยวกับ ข้อมูลที่ใช้ในการวิเคราะห์ ดังนี้ 
             Anticipated effect size = คือการกำหนด effect size คือ 0.1 0.3 และ 0.5 เรียงลำดับจาก effect size เล็ก กลางและใหญ่
             Desired statistical power level = คือค่า 1-Type II error
           Number of latent variables  = คือจำนวนตัวแปรแฝง แน่นอนว่าผู้วิจัยต้องรู้และวาดโมเดลของตนเป็น
           Number of observed variables = คือจำนวนตัวแปรสังเกตได
           Probability level = การตั้งค่าโอกาสในการมีนัยสำคัญทางสถิติหรือ Type I error


                 
         จากตัวอย่างนี้ผู้เขียนได้ยกตัวอย่าง ในงานวิจัยของผู้เขียนเอง คือการวิเคราะห์องค์ประกอบเชิงยืนยันของความต้องการจำเป็นของครูด้านการรู้การประเมินในชั้นเรียน วิเคราะห์ CFA  มีตัวแปรแฝง 1 ตัวและตัวแปรสังเกตได้ 7 ตัวทำการกำหนดค่าต่าง ๆ ลงในโปรแกรมเพื่อคำนวณจำนวนกลุ่มตัวอย่าง
             Anticipated effect size  กำหนด เป็น 0.1 หมายถึง effect size effect size เล็ก 
             Desired statistical power level กำหนดค่า P ที่ 0.8 
            Number of latent variables  กำหนดเป็น 1 เพราะ จากโมเดลของผู้วิจัยมีตัวแปรแฝง 1 ตัว
            Number of observed variables กำหนดเป็น 7 เพราะ จากโมเดลของผู้วิจัยมีตัวสังเกตได้ 7 ตัว
            Probability level กำหนดเป็น 0.05 

           โปรแกรมจะคำนวณหากลุ่มตัวอย่างในครั้งนี้ได้จำนวน ต่ำสุดที่แนะนำคือ 400 คน นำหลักการนี้ไปใช้คำนวณหากลุ่มตัวอย่างกับการทดสอบสถิติอื่น ๆ ได้นะครับ 

ความสุขของอิสระ
11 เมษายน 2559
เขียนที่คอนโดหรูใกล้ชายหาดบางแสน


วันศุกร์ที่ 1 เมษายน พ.ศ. 2559

ความเข้าใจที่คลาดเคลื่อน เกี่ยวกับการรายงานผลคะแนนโอเน็ต กรณีศึกษาจากการโพสผ่านสื่อสังคมออนไลน์

ความเข้าใจที่คลาดเคลื่อน เกี่ยวกับการรายงานผลคะแนนโอเน็ต กรณีศึกษาจากการโพสผ่านสื่อสังคมออนไลน์
          คะแนนทดสอบระดับชาติ (O-NET) ของไทย ได้ประกอบผลสอบแล้ว ได้มีหน่วยงานได้รายงานคะแนนในเชิงเปรียบเทียบ รวมถึงรายงานในรูปของพัฒนาการแล้วจัดลำดับคะแนน จากการได้รับรู้จากสังคมออนไลน์และได้ทำการสังเกตวิธีการจัดเรียงลำดับพบว่าผู้ที่มีส่วนเกี่ยวข้องได้ทำการเปรียบเทียบหรือรายงานแบบเกิดความเข้าใจที่คลาดเคลื่อนไปมา ตัวอย่างแรกที่ผู้เขียนได้พบ

ความคลาดเคลื่อนที่พบ 1
            คะแนนผลการทดสอบของโรงเรียนแห่งหนึ่งทั้ง 5 วิชา เป็นดังนี้
ไทย      44.10    คณิต     35.68    วิทย์      36.60    สังคม    47.40    อังกฤษ  32.80
            มีหลายท่านได้ทำการรวมร้อยละจาก 5 วิชา ดังนี้
(44.10 + 35.68+ 36.60 + 47.40+ 32.80)/5 = 39.32
            ซึ่งกรณีเช่นนี้เป็นการรวมตัวของคะแนนจากต่างวิชา ดังนั้นจึงควรปรับให้อยู่ในรูปคะแนนมาตรฐานก่อน โดยสามารถศึกษาได้จากบทความที่แล้วมา  http://issarabuu.blogspot.com/2016/03/o-net.html ซึ่งผู้มีส่วนเกี่ยวข้องควรให้ความสำคัญในการทำความเข้าใจของคะแนนมาตรฐานเป็นอย่างมาก เพราะมีการรายงานผลที่คลาดเคลื่อนออกไปในวงกว้าง ถึงแม้ว่าช่วงคะแนนแนนของทั้ง 5 วิชาจะมีช่วง 100 ช่วงที่เท่ากันก็ตาม

ความคลาดเคลื่อนที่พบ
            ได้มีการเปรียบเทียบคะแนนระหว่างปีการศึกษา เช่น เปรียบเทียบคะแนนรวมปีศึกษา 2558 กับ 2559
วิชา/ปีการศึกษา
2558
2559
ไทย
42.64
44.10
คณิต
32.40
35.68
วิทย์
37.63
36.60
สังคม
42.24
47.40
อังกฤษ
30.62
32.80
ค่าเฉลี่ย
37.11
39.32
ส่วนเบี่ยงเบนมาตรฐาน
5.51
6.15



           





ตารางกรณีดังกล่าว ก็จะมีการรายงานว่า ปีการศึกษา 2559 มีค่าเฉลี่ยรวม 39.32 ปีการศึกษา 2558
มีค่าเฉลี่ยรวม 37.11 โดยทั่วไปที่ผู้เขียนพบเจอก็จะรายงานว่ามีพัฒนาการขึ้น 39.32 – 37.11= 2.21 ถือว่าผิดไหมในฐานนะนักวัดผลก็จะตอบว่า น่าจะทำให้ครบกระบวนการแล้วนำมาเปรียบเทียบน่าจะให้รายงานผลพัฒนาการที่น่าเชื่อถือกว่า นั้นก็คือการแปลงเป็นคะแนนมาตรฐาน T-SCORE หรือแปลงเป็นคะแนนมาตรฐาน Z-SCORE

การปรับความเข้าใจคลาดเคลื่อนไปสู่ความเข้าใจที่ถูกต้องทำอย่างไร
วิชา/ปีการศึกษา
2558
T-SCORE
2559
T-SCORE
ไทย
42.64
60.04
44.10
57.78
คณิต
32.40
41.46
35.68
44.09
วิทย์
37.63
50.95
36.60
45.58
สังคม
42.24
59.32
47.40
63.14
อังกฤษ
30.62
38.23
32.80
39.40
ค่าเฉลี่ย
37.11
50
39.32
50
SD
5.51
10
6.15
10
           
ปีการศึกษา
2558
2559
ค่าเฉลี่ย
SD
คะแนนรวม
37.11
39.32
38.22
1.11
T-SCORE
40
60
50
10

            เมื่อแปลงเป็นคะแนนมาตรฐานแล้วพบว่า คะแนนมาตรฐานเป็นการปรับคะแนนสอบทั้ง 2 ปีการศึกษามีความทัดเทียมกัน สังเกตจาก ค่าเฉลี่ย และส่วนเบี่ยงเบนมาตรฐานที่เท่ากัน (ค่าเฉลี่ย=50, SD= 10) ทำการเปรียบเทียบเป็นรายวิชา
            ในส่วนของคะแนนรวมเมื่อแปลงเป็นคะแนนมาตรฐานแล้วจะพบว่าในปีการศึกษา 2559 โรงเรียนแห่งนี้มีพัฒนาการทางบวกคิดเป็น 60-40 = 20 ซึ่งเมื่อมีหลายโรงเรียนควรปรับเปลี่ยนให้อยู่ในคะแนนมาตรฐานแล้วจึงนำมาเรียงลำดับตามพัฒนาการจึงจะมีความเหมาะสมกว่า การลบกันของค่าเฉลี่ย

1 เมษายน 2559
ความสุขของอิสระ
เขียนที่คอนโดหรูย่านมหาวิทยาลัย ดังแถวบางแสน





วัตถุประสงค์การวิจัย 3 ข้อ สูตรยาผีบอก

      นโยบายเปลี่ยน การปฏิบัติก็เปลี่ยน การทำวิจัยในครูก็ยิ่งลดลง เนื่องด้วยการประเมินวิทยฐานะแบบใหม่หรือเรียกกันติดปากว่า ว.21 วันนี้จะมาพ...