วันอังคารที่ 22 กรกฎาคม พ.ศ. 2557

การจำแนกสถิติในระดับพหุ (A Classification of Multivariate Techniques)



   ในการใช้สถิติระดับระดับพหุนี้ มีนักวิจัยหลายคนมองว่าเป็นเรื่องที่ท้าทายความสามารถ  เหมาะกับงานในระดับบัณฑิตศึกษา ไม่ว่าจะเป็นในระดับ ป. โท-เอก โดยใช้การวิเคราะห์ที่เป็นทีเป็นกระแสสังคมในปัจจุบัน แต่หากมองย้อนกลับไปแล้วจะพบว่ารากที่มา  ของสถิติที่เรียกว่าสถิติขั้นสูง ต่างเป็นสถิติที่ต่อยอดมากจากสถิติพื้นฐาน คือ ค่าเฉลี่ย (Mean) และส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation) และความแปรปรวน หากพิจารณาสูตรในการคำนวณแต่ละตัวจะพบว่าตัวหาร จะเป็นส่วนที่เราเรียกว่า ความความแปรปรวน (Error) หรือพูดแบบง่ายว่า สูตรในการคำนวณสถิติขั้นสูงคือ อัตราส่วนของสิ่งที่เรารู้ หารด้วยสิ่งที่เราไม่รู้ โดยส่วนมากสิ่งที่เราไม่รู้จะมีลักษณะคล้ายกับความแปรปรวน ลองสังเกตนะครับ
   การแบ่งกลุ่มหรือประเภทของ สถิติระดับพหุนั้น ผมของยก ต้นตำหรับหนังสือสถิติของแฮร์  ซึ่งเป็นการเขียน โดยการรวบรวมเอาองค์ความรู้ที่เป็นแกนของสถิติ  แล้วนำมาทำความเข้าใจสรุปผลและถ่ายทอด ให้นักวิจัยและสถิติรุ่นหลังอ่าน โดยแฮร์จะแบ่งออกเป็น 2 กลุ่มคือ กลุ่มที่ใช้เทคนิคตัวแปรตาม (Dependence Techniques) และกลุ่มของความสัมพันธ์ภายในของตัวแปรตาม (Interdependence Techniques) ซึ่งนักวิจัยต้องให้ความสำคัญของการเลือกใช้สถิติให้มีความหมายสมกับชุดข้อมูล หรือชุดตัวแปร เพราะในข้อตกลงเบื้องต้นก่อนการใช้สถิติจะระบุชัดไว้อยู่แล้ว  ผู้เขียนขอสรุปความหมายของประเภทสถิติระดับระดับพหุดังนี้ 


   1. กลุ่มที่ใช้เทคนิคตัวแปรตาม (Dependence Techniques) ขั้นแรกที่จะแยกว่าสถิติใดบ้างที่อยู่กลุ่มดังกล่าว นักวิจัยต้องสามารถแยกแยกได้ว่า ตัวแปรใดเป็นตัวแปรต้น ตัวแปรใดเป็นตัวแปรตาม ตัวแปรตามเป็นการจัดกระทำ หรือเป็นการรวมตัว จากความแปรปรวนในตัวแปรตามกี่ตัว (Combinations of variables) และภายใน กลุ่มที่ใช้เทคนิคตัวแปรตาม (Dependence Techniques) ยังสามารถแบ่งย่อยออกได้อีก 2 ประเภท คือ 
     1.1 จำนวนตัวแปรตาม  โดยในกลุ่มนี้จะมีตัวแปรตามตั้งแต่ 1 ตัวขึ้นไป,ตัวแปรต้นและตัวแปรตามหลายตัว
     1.2 ประเภทของตัวแปรที่ใช้ในการวัด โดยตัวแปรตามจะอยู่ในกลุ่มของตัวแปรเชิงคุณภาพ (Non-Metric) และตัวแปรเชิงปริมาณ (Metric)


ตัวอย่าง เมื่อเราพิจารณาแล้วพบว่า งานวิจัยของเรามีตัวแปรตามตัวเดียวและเป็นตัวแปรในเชิงปริมาณ (Metric) สถิติที่จะใช้วิเคราะห์ที่เป็นไปได้ก็คือ Multiple Regression และ Conjoint Analysis ถือแม้ว่าข้อตกลงเบื้องต้นของตัวแปรต้น จะต่างกัน แต่มีวิธีการที่จัการกับ ตัวแปรต้นที่เป็นตัวแปรเชิงคุณภาพใหอยู่ในรูปของตัวแปรเชิงปริมาณ ด้วยการทำ Dummy ตัวแปร  และในทางตรงกันข้ามัน หากตัวแปรตามเป็นตัวแปรเชิงคุณภาพ สถิติที่ใช้ในการวิเคราะห์ จะเป็นสถิติ จำแนกประเภท (Discriminate Analysis)  

   แต่เมื่อพบว่าตัวแปรตาม มีมากกว่าสองตัวขึ้นไป ก็ต้องเปลี่ยนไปใช้สถิติที่เหมาะสม เช่น Manova ใช้เมื่อกลุ่มตัวแปรตามเป็นตัวแปรเชิงปริมาณ หากกลุ่มตัวแปรตามเป็นตัวแปรเชิงคุณภาพก็จะใช้สถิติ Canonical Correlation และสุดท้ายหากเป็นกลุ่มตัวแปร ทั้งต้นและตาม และมีลักษณะมีความสัมพันธ์กัน ก็จะใช้สถิติ SEM


    2. กลุ่มของความสัมพันธ์ภายในของตัวแปรตาม (Interdependence Techniques) จะต่างจากสถิติกลุ่มข้างต้น คือ ในกลุ่มนี้จะเป็นการวิเคราะห์เป็นชุดๆ ไม่สามารถระบุได้ชัดว่า ตัวแปรใดเป็นตัวแปรต้นหรือตัวแปรตาม  การวิเคราะห์ข้อมูลหรือการเลือกใช้สถิติจะขึ้นอยู่กับภายใต้โครงสร้างหรือวัตถุประสงค์ของการวิจัย เช่น ต้องการวิเคราะห์ สถิติที่เหมาะสม คือ กลุ่ม Factor หากต้องการรายงานเป็นลักษณะโครงสร้าง สถิติที่เหมาะสมคือ Cluster และหลักในการจำแนกสถิติที่ใช้ในกลุ่ม Factor และ Cluster นั้นก็ต้องพิจารณา ประเภทของตัวแปรต้นว่าอยู่ในเชิงคุณภาพหรือเชิงปริมาณ

    สรุป ในการเลือกใช้สถิติให้เหมาะสมกับชุดข้อมูลนั้นเป็นเรื่องที่ทำให้การวิเคราะห์ข้อมูลออกมาแล้วมีความน่าเชื่อถือ เพราะถือว่าเป็นการตรวจสอบเบื้องต้นก่อนการวิเคราะห์ข้อมูล  ส่วนการสรุปรายละเอียดปลีกย่อยจะสรุปในโอกาสต่อไป ครับ 

ไม่มีความคิดเห็น:

แสดงความคิดเห็น

วัตถุประสงค์การวิจัย 3 ข้อ สูตรยาผีบอก

      นโยบายเปลี่ยน การปฏิบัติก็เปลี่ยน การทำวิจัยในครูก็ยิ่งลดลง เนื่องด้วยการประเมินวิทยฐานะแบบใหม่หรือเรียกกันติดปากว่า ว.21 วันนี้จะมาพ...