การตรวจสอบข้อมูลก่อนการวิเคราะห์ข้อมูลนั้น
เป็นเรื่องที่ดีและเป็นจริยธรรมที่ดีของนักวิจัย
เพราะข้อมูลที่ได้จากกลุ่มตัวอย่าง หรือกลุ่มเป้าหมายนั้น แสดงผลออกในรูปผลลัพธ์ของการวิจัย
หากละเลยไม่มีการตรวจสอบก็อาจทำให้ผลการวิจัยคลาดเคลื่อน
หรือมีความน่าเชื่อถือน้อยลง การเก็บข้อมูลการวิจัยแต่ละครั้งนักวิจัยอาจประสบปัญหา
เช่น การได้ข้อมูลมาไม่ครบถ้วนอันจะส่งผลทำให้เกิดปรากฏการณ์
ความไม่ครบถ้วนหรือภาวะข้อมูลสูญหาย (Missing Data) และอีกปรากฎการณ์หนึ่งที่เกิดขึ้นได้หากไม่มีการตรวจสอบก่อนการวิเคราะห์ข้อมูลคือ
การรายงานผลลัพธ์โดยมีค่าสุดโต่งแฝง (Outlier)
ในการวิเคราะห์ข้อมูลนั้น
โดยธรรมชาติของการวิจัยทางสังศาสตร์นั้นจะเป็นการวัดพฤติกรรมผ่านตัวแปรแฝง
หรือพูดอีกอย่างคือการวัดพฤติกรรมทางอ้อม จะเห็นได้ว่าหากมีการบวนการเก็บข้อมูลที่ไม่ดีจะทำให้ข้อมูลที่ได้มาตอบคำถามไม่ตรงประเด็น
เสียเวลา และเปล่าประโยชน์ เพราะการเก็บข้อมูลที่ผ่านกระบวนการสุ่มนั้น
ค่าความคลาดเคลื่อนที่นักวิจัยยอมรับได้ คือ ค่าความคลาดเคลื่อนที่เกิดอย่างสุ่ม
เพราะการเกิดขึ้นอย่างสุ่มเป็นเหตุการณ์ที่เกิดกับกรณีเดียว หรือหมู่คณะเดียว
ผู้มีส่วนได้ส่วนเสียเดียว เท่านั้น ไม่ได้เกิดขึ้นที่ส่งผลกระทบเป็นระบบ
ตัวอย่างความคลาดเคลื่อนที่เกิดอย่างสุ่มนั้น เช่น นักวิจัยสุ่มกลุ่มตัวอย่างได้ 10 คน ภายหลังพบว่ามี 3 คนที่ไม่สบาย
ไม่สามารถให้คำตอบได้
แต่หากเป็นควาดคลาดเคลื่อนที่เกิดขึ้นเป็นระบบนั้น
ต้องเกิดจากปัจจัยหรือเงื่อนไขบ้างประการ ตัวอย่างเช่น เก็บข้อมูลอยู่
เกิดภาวะแผ่นดินไหว น้ำท่วม ส่งผลกระทบทั้งหมดกับงานวิจัย
จากที่ได้กล่าวมาจะเห็นได้ว่าความรับผิดชอบของนักวิจัยต้องมีอยู่เสมอ
เพราะในการทำงานวิจัยจริงต้องพบกับอุปสรรคหลายอย่าง
แต่ในที่นี้จะสรุปเหตุการณ์ที่จะพบโดยส่วนมากมีอยู่ 2 ประเด็นคือ
ความไม่ครบถ้วนของข้อมูลและค่าสุดโต่ง (Missing Data and
Outlier) แยกสรุปได้
ดังนี้
1.
ความไม่ครบถ้วนของข้อมูล (Missing Data)
ความไม่ครบถ้วนหรือการไม่สมบูรณ์ของข้อมูลนั้น
เกิดได้หลายปัจจัย เกิดได้จากการละเลยหรือความบังเอิญ ข้อมูลที่ขาดหายไปจะส่งผลต่อการอ้างอิงกลับไปยังกลุ่มประชากร
หากเกิดการขาดหายไปเยอะ นักวิจัยอาจแก้ปัญหาด้วยการเก็บข้อมูลซ้ำ
หรือหากขาดหลายไปบางช่วงบางตอน นักวิจัยอาจพิจารณาเป็นกรณีไป เช่น
การตัดตัวแปรที่มีปัญหาออก การแทนที่ด้วยค่าเฉลี่ยของชุดข้อมูลนั้น ๆ
การละเลยโดยให้โปรแกรมวิเคราะห์จัดการให้ เป็นต้น โดยทั่วไปจะแบ่งย่อยออกเป็น 2 ประเภทคือ ขณะกำลังดำเนินการเลือกตัวอย่างวิจัย (MAR)
และหลังเลือกกลุ่มตัวอย่างการวิจัย (MCAR) ดังนี้
ความไม่ครบถ้วนของข้อมูลเกิดขึ้นขณะกำลังเลือกกลุ่มตัวอย่าง
(MAR)
ในความไม่ครบถ้วนหรือการขาดหายของข้อมูลนี้
เกิดขึ้นขณะสุ่มกลุ่มตัวอย่าง เช่น การทำวิจัยเกี่ยวกับปัจจัย ในการเลือกเช่าสนามฟุตบอลหญ้าเทียมในจังหวัดชลบุรี
ในการสุ่มกลุ่มตัวอย่าง ก็จะเน้นไปที่เพศชายเป็นหลัก
แต่หากในการเก็บข้อมูลเก็บไปเก็บตรงกับเพศชายไม่มีเคยใช้บริการสนามฟุตบอลหญ้าเทียมข้อมูลที่ได้ก็จะถือเป็น
MAR
หรือ
การไม่ตั้งใจทำแบบทดสอบหรือแบสอบถามก็ถือว่าเป็นการไม่ครบถ้วนของข้อมูลในระดับ MAR
เช่นกัน
ความไม่ครบถ้วนของข้อมูลเกิดขึ้นหลังเลือกกลุ่มตัวอย่างการวิจัย
(MCAR)
ความไม่ครบถ้วนหรือขาดหายไปหลักการเก็บข้อมูลจากกลุ่มตัวอย่างแล้ว
เช่น การลงรหัสผิด หรือเหตุการณ์ที่ทำให้ข้อมูลคลาดเคลื่อนหลังการเก็บข้อมูล
จะเห็นได้ว่าความไม่ครบถ้วนของข้อมูลทั้งอย่างนี้
มีผลต่อการอ้างอิงกลับไปยังกลุ่มประชากร (Generalization) โดยในนี้จะแบ่งเป็นระดับ
MAR นั้นเป็นผลที่เก็บข้อมูลได้ไม่ตรง ส่วน MCAR เก็บได้ตรงไม่ตรงยังไม่ทราบ แต่เกิดความคลาดเคลื่อนต่ออีกระดับหนึ่ง
โดยสรุป หากเกิดเป็นกรณีของ MCAR นั้น ผลลัพธ์ของการวิจัยจะคลาดเคลื่อนออกไปเยอะ
ลักษณะ MCAR ส่วนมากจะเกิดขึ้นแบบเป็นระบบ
2.
ค่าสุดโต่งของข้อมูล (Outlier)
จะเห็นได้ว่าค่าสุดโต่งนี้
ก็มีผลต่อผลลัพธ์ทางการวิจัยมากพอสมควร หากนักวิจัยละเลยที่จะตรวจสอบค่าสุดโต่งจะทำให้ผลการวิจัยคลาดเคลื่อนและสรุปผลได้ไม่ถูกต้อง
ตัวอย่างเช่น ในการเก็บข้อมูลจากกลุ่มตัวอย่าง
รายได้เฉลี่ยของแรงงานในนิคมอุตสหกรรมอมตะนคร จังหวัดชลบุรี จำนวน 5 รายดังนี้ คนที่ 1
ถึงคนที่ 4 มีรายได้ 20,000 – 40,000 แต่คนที่ 5 มีรายได้ 1,000,000 บาท จะทำให้ค่าเฉลี่ยของชุดข้อมูลนี้สูงขึ้นทันที
การแก้ไขเมื่อพบข้อมูลที่สุดโต่ง วิธีการที่ง่ายที่สุดคือการตัดสมาชิกนั้นทิ้ง
หรือการแก้ปัญหาโดยการเก็บข้อมูลซ้ำให้ได้กับจำนวนที่พบค่าความสุดโต่ง
ไม่มีความคิดเห็น:
แสดงความคิดเห็น