วันพุธที่ 6 สิงหาคม พ.ศ. 2557

การตรวจสอบข้อมูลเบื้องต้นก่อนการวิเคราะห์ข้อมูล



การตรวจสอบข้อมูลก่อนการวิเคราะห์ข้อมูลนั้น เป็นเรื่องที่ดีและเป็นจริยธรรมที่ดีของนักวิจัย เพราะข้อมูลที่ได้จากกลุ่มตัวอย่าง หรือกลุ่มเป้าหมายนั้น แสดงผลออกในรูปผลลัพธ์ของการวิจัย หากละเลยไม่มีการตรวจสอบก็อาจทำให้ผลการวิจัยคลาดเคลื่อน หรือมีความน่าเชื่อถือน้อยลง การเก็บข้อมูลการวิจัยแต่ละครั้งนักวิจัยอาจประสบปัญหา เช่น การได้ข้อมูลมาไม่ครบถ้วนอันจะส่งผลทำให้เกิดปรากฏการณ์ ความไม่ครบถ้วนหรือภาวะข้อมูลสูญหาย (Missing Data) และอีกปรากฎการณ์หนึ่งที่เกิดขึ้นได้หากไม่มีการตรวจสอบก่อนการวิเคราะห์ข้อมูลคือ การรายงานผลลัพธ์โดยมีค่าสุดโต่งแฝง (Outlier)
           ในการวิเคราะห์ข้อมูลนั้น โดยธรรมชาติของการวิจัยทางสังศาสตร์นั้นจะเป็นการวัดพฤติกรรมผ่านตัวแปรแฝง หรือพูดอีกอย่างคือการวัดพฤติกรรมทางอ้อม จะเห็นได้ว่าหากมีการบวนการเก็บข้อมูลที่ไม่ดีจะทำให้ข้อมูลที่ได้มาตอบคำถามไม่ตรงประเด็น เสียเวลา และเปล่าประโยชน์ เพราะการเก็บข้อมูลที่ผ่านกระบวนการสุ่มนั้น ค่าความคลาดเคลื่อนที่นักวิจัยยอมรับได้ คือ ค่าความคลาดเคลื่อนที่เกิดอย่างสุ่ม เพราะการเกิดขึ้นอย่างสุ่มเป็นเหตุการณ์ที่เกิดกับกรณีเดียว หรือหมู่คณะเดียว ผู้มีส่วนได้ส่วนเสียเดียว เท่านั้น ไม่ได้เกิดขึ้นที่ส่งผลกระทบเป็นระบบ ตัวอย่างความคลาดเคลื่อนที่เกิดอย่างสุ่มนั้น เช่น นักวิจัยสุ่มกลุ่มตัวอย่างได้ 10 คน ภายหลังพบว่ามี 3 คนที่ไม่สบาย
ไม่สามารถให้คำตอบได้ แต่หากเป็นควาดคลาดเคลื่อนที่เกิดขึ้นเป็นระบบนั้น ต้องเกิดจากปัจจัยหรือเงื่อนไขบ้างประการ ตัวอย่างเช่น เก็บข้อมูลอยู่ เกิดภาวะแผ่นดินไหว น้ำท่วม ส่งผลกระทบทั้งหมดกับงานวิจัย
           จากที่ได้กล่าวมาจะเห็นได้ว่าความรับผิดชอบของนักวิจัยต้องมีอยู่เสมอ เพราะในการทำงานวิจัยจริงต้องพบกับอุปสรรคหลายอย่าง แต่ในที่นี้จะสรุปเหตุการณ์ที่จะพบโดยส่วนมากมีอยู่ 2 ประเด็นคือ ความไม่ครบถ้วนของข้อมูลและค่าสุดโต่ง (Missing Data and Outlier) แยกสรุปได้ ดังนี้

1. ความไม่ครบถ้วนของข้อมูล (Missing Data)
          ความไม่ครบถ้วนหรือการไม่สมบูรณ์ของข้อมูลนั้น เกิดได้หลายปัจจัย เกิดได้จากการละเลยหรือความบังเอิญ ข้อมูลที่ขาดหายไปจะส่งผลต่อการอ้างอิงกลับไปยังกลุ่มประชากร หากเกิดการขาดหายไปเยอะ นักวิจัยอาจแก้ปัญหาด้วยการเก็บข้อมูลซ้ำ หรือหากขาดหลายไปบางช่วงบางตอน นักวิจัยอาจพิจารณาเป็นกรณีไป เช่น การตัดตัวแปรที่มีปัญหาออก การแทนที่ด้วยค่าเฉลี่ยของชุดข้อมูลนั้น ๆ การละเลยโดยให้โปรแกรมวิเคราะห์จัดการให้ เป็นต้น โดยทั่วไปจะแบ่งย่อยออกเป็น 2 ประเภทคือ ขณะกำลังดำเนินการเลือกตัวอย่างวิจัย (MAR) และหลังเลือกกลุ่มตัวอย่างการวิจัย (MCAR) ดังนี้
           ความไม่ครบถ้วนของข้อมูลเกิดขึ้นขณะกำลังเลือกกลุ่มตัวอย่าง (MAR)
           ในความไม่ครบถ้วนหรือการขาดหายของข้อมูลนี้ เกิดขึ้นขณะสุ่มกลุ่มตัวอย่าง เช่น การทำวิจัยเกี่ยวกับปัจจัย  ในการเลือกเช่าสนามฟุตบอลหญ้าเทียมในจังหวัดชลบุรี ในการสุ่มกลุ่มตัวอย่าง ก็จะเน้นไปที่เพศชายเป็นหลัก แต่หากในการเก็บข้อมูลเก็บไปเก็บตรงกับเพศชายไม่มีเคยใช้บริการสนามฟุตบอลหญ้าเทียมข้อมูลที่ได้ก็จะถือเป็น MAR หรือ การไม่ตั้งใจทำแบบทดสอบหรือแบสอบถามก็ถือว่าเป็นการไม่ครบถ้วนของข้อมูลในระดับ MAR เช่นกัน
           ความไม่ครบถ้วนของข้อมูลเกิดขึ้นหลังเลือกกลุ่มตัวอย่างการวิจัย (MCAR)
           ความไม่ครบถ้วนหรือขาดหายไปหลักการเก็บข้อมูลจากกลุ่มตัวอย่างแล้ว เช่น การลงรหัสผิด หรือเหตุการณ์ที่ทำให้ข้อมูลคลาดเคลื่อนหลังการเก็บข้อมูล
           จะเห็นได้ว่าความไม่ครบถ้วนของข้อมูลทั้งอย่างนี้ มีผลต่อการอ้างอิงกลับไปยังกลุ่มประชากร (Generalization) โดยในนี้จะแบ่งเป็นระดับ MAR นั้นเป็นผลที่เก็บข้อมูลได้ไม่ตรง ส่วน MCAR เก็บได้ตรงไม่ตรงยังไม่ทราบ แต่เกิดความคลาดเคลื่อนต่ออีกระดับหนึ่ง โดยสรุป หากเกิดเป็นกรณีของ MCAR นั้น ผลลัพธ์ของการวิจัยจะคลาดเคลื่อนออกไปเยอะ ลักษณะ MCAR ส่วนมากจะเกิดขึ้นแบบเป็นระบบ

2. ค่าสุดโต่งของข้อมูล (Outlier)
           จะเห็นได้ว่าค่าสุดโต่งนี้ ก็มีผลต่อผลลัพธ์ทางการวิจัยมากพอสมควร หากนักวิจัยละเลยที่จะตรวจสอบค่าสุดโต่งจะทำให้ผลการวิจัยคลาดเคลื่อนและสรุปผลได้ไม่ถูกต้อง ตัวอย่างเช่น ในการเก็บข้อมูลจากกลุ่มตัวอย่าง รายได้เฉลี่ยของแรงงานในนิคมอุตสหกรรมอมตะนคร จังหวัดชลบุรี จำนวน  5 รายดังนี้ คนที่ 1 ถึงคนที่ 4 มีรายได้ 20,000 – 40,000 แต่คนที่ 5 มีรายได้ 1,000,000 บาท จะทำให้ค่าเฉลี่ยของชุดข้อมูลนี้สูงขึ้นทันที การแก้ไขเมื่อพบข้อมูลที่สุดโต่ง วิธีการที่ง่ายที่สุดคือการตัดสมาชิกนั้นทิ้ง หรือการแก้ปัญหาโดยการเก็บข้อมูลซ้ำให้ได้กับจำนวนที่พบค่าความสุดโต่ง

           จากการตรวจสอบเบื้องต้นพบว่า นักวิจัยควรให้ความสำคัญกับการตรวจสอบที่มาของข้อมูล เพราะจะมีผลมากหากนำ ผลการวิจัยไปอ้างอิงกลับไปยังกลุ่มประชากร ดังนั้นเมื่อเราทราบถึงผลที่จะเกิดขึ้นแล้วควรให้ความสำคัญกับการตรวจสอบข้อมูล ซึ่งการตรวจสอบง่าย ๆ ก็ได้อธิบายและยกตัวอย่างไปแล้ว

ไม่มีความคิดเห็น:

แสดงความคิดเห็น

วัตถุประสงค์การวิจัย 3 ข้อ สูตรยาผีบอก

      นโยบายเปลี่ยน การปฏิบัติก็เปลี่ยน การทำวิจัยในครูก็ยิ่งลดลง เนื่องด้วยการประเมินวิทยฐานะแบบใหม่หรือเรียกกันติดปากว่า ว.21 วันนี้จะมาพ...