วันศุกร์ที่ 8 สิงหาคม พ.ศ. 2557

การวิเคราะห์องค์ประกอบ (Factor Analysis) ตอนที่ 1


การวิเคราะห์องค์ประกอบ (Factor Analysis)
          จากการอ่านบทความ และหนังสือด้านสถิติทั้งในไทยและต่างประเทศ จะเห็นว่าการให้ความหมาย ของการวิเคราะห์องค์ประกอบนั้น จะเริ่มที่ การวิเคราะห์องค์ประกอบคือ เทคนิคที่ใช้วิเคราะห์คำตอบในสถิติระดับพหุ แต่ในมุมมองของ ข้าพเจ้าหากจะให้คำตอบเรื่องการวิเคราะห์องค์ประกอบนั้นจะให้คำตอบที่กว้างไปหาส่วนที่ แคบ โดยตามหมายหมายในการสังเคราะห์ การอ่าน ตามรูปแบบของอิสระ นะครับ “การวิเคราะห์องค์ประกอบคือ การใช้เทคนิคทางสถิติกลุ่ม กลุ่มของความสัมพันธ์ภายในของตัวแปรตาม (Interdependence Techniques) โดยมีวัตถุประสงค์เพื่อสรุปหรือลดตัวแปร โดยยังคงสืบถือสารสนเทศของตัวแปรดังเดิม
             ข้อแตกต่างระหว่างการใช้สถิติกลุ่ม Interdependence Techniques กับ กลุ่ม dependence Techniques นั้น มีข้อที่จำแนกได้ชัดเจนคือ สถิติกลุ่ม Interdependence Techniques จะไม่สามารถระบุได้ว่าตัวแปรใดคือตัวแปรต้น ตัวแปรตาม และตัวแปรที่อยู่ในการวิเคราะห์องค์ประกอบนั้นจะเป็นการพยายามให้สารสนเทศมากที่สุด ไม่ใช่นำเข้าเพื่อทำนายสิ่งที่จะเกิดเหมือน กลุ่มสถิติ dependence Techniques ที่พยายามรวมความแปรปรวนเพื่อการพยากรณ์เป็นหลัก  แต่เมื่อให้วัถตุประสงค์ของการวิเคราะห์องค์ประกอบไปแล้ว สถิติกลุ่ม Interdependence Techniques กับ กลุ่ม dependence Techniques จะเริ่มที่ส่วนที่อธิบายได้คลายคล้ายกัน โดยวัถตุประสงค์ของของการใช้สถิติการวิเคราะห์องค์ประกอบนั้น เพื่อ สรุปและลดตัวแปร การสรุปผลนั้นเป็นการใช้สารสนเทศที่ได้จากตัวแปรโดยใช้ค่า Correlation Matrix แล้วอธิบายรวมในลักษณะของตัวแปรแฝง (Latent Variable) ส่วนวัตถุประสงค์เพื่อลดตัวแปรหรือสร้างรวมกลุ่มตัวแปรใหม่จากกลุ่มตัวแปรเดิม โดยอาศัยสารสนเทศที่ได้จากตัวแปรโดยใช้ค่า Correlation Matrix เช่นเดียวกัน 


ตัวอย่างของวัถตุประสงค์การใช้สถิติการวิเคราะห์องค์ประกอบ


เพื่อลดตัวแปร จากภาพจะเห็นได้ว่า มีตัวแปรเดิมอยู่ 4 ตัว เมื่อศึกษาทิศทาง และความสัมพันธ์ใน Correlation Matrix สรุปได้ว่ามีทิศทางแนวโน้ว ที่จะให้สารสนเทศใหม่ได้จึงรวมและสร้างเป็นตัวแปรใหม่ ในรูปแบบของ ตัวแปรแฝง Latent Variable


จะเห็นได้ว่า วัตถุประสงค์หลักของการวิเคราะห์องค์ประกอบนั้นจะเป็นกานสรุปข้อมูล จากตัวแปรที่มีอยู่ และการให้สารสนเทศใหม่ โดยวัตถุประสงค์ทั้งคู่ต้องอาศัยข้อมูลเดิมจากตัวแปรดั่งเดิม หรือข้อมูลเชิงความสัมพันธ์ใน Correlation Matrix จากตัวอย่างที่กล่าวมาข้างต้น เป็นแค่กรณีที่ยกตัวอย่าง อาจจะไม่เป็นแบบนี้เสมอไป แต่ข้อให้ผู้อ่านได้เข้าใจวัตถุประสงค์ ของสถิติการวิเคราะห์องค์ประกอบ

รูปแบบของการวิเคราะห์องค์ประกอบ
             เมื่อศึกษากลุ่มตัวแปรที่นำมาวิเคราะห์และดูหรือแยกได้ว่าวัตถุประสงค์ในการวิเคราะห์องค์ประกอบนั้น เพื่อสรุปหรือเพื่อลดตัวแปร ได้แล้วนักวิจัยต้องพิจารณาต่อไปอีกว่า ภายใต้ความสัมพันธ์ภายในระหว่างตัวแปร Correlation Matrix เป็นความสัมพันธ์ระหว่างตัวแปร หรือเป็นกลุ่มตัวแทน โดยจะพิจาณารูปแบบของการวิเคราะห์องค์ประกอบเป็น 2 ประเภทคือ ประเภท R และประเภท Q ดังนี้
             การวิเคราะห์องค์ประกอบทั้งประเภท R (R-TYPE) และ Q (Q-TYPE) นั้น ต้องอาศัยความสัมพันธ์ภายในระหว่างตัวแปร Correlation Matrix ซึ่ง ประเภท R นั้นเป็นความสัมพันธ์ระหว่างตัวแปรที่แท้จริง แต่ความสัมพันธ์ประเภท Q จะอาศัยสรุปจากประเภทของ R ก่อน ค่อยนำไปเป็นตัวแทนหรือกลุ่ม ซึ่งจะเห็นได้ว่า Q-TYPE กับการวิเคราะห์แบบกลุ่ม (Cluster analysis) ก็มีข้อแตกต่างกันย่อย ออกไป โดย Q-TYPE นั้นจะยึดกลุ่มตัวแทนที่มีคุณลักษณะเหมือนกัน แต่ การวิเคราะห์แบบกลุ่ม (Cluster analysis) จะอาศัยแยกตามลักษณะคะแนนหรือช่วง ดังตัวอย่าง

จากภาพประกอบ เป็นคะแนนของผู้เข้าสอบ 4 คน จากการวัด ตัวแปร 3 ตัว เมื่อนำมาแสดงเป็นกราฟวิเคราะห์ข้อมูลจะเห็นได้ว่า เมื่อพิจารณาตาม Q-TYPE จะพบว่า A และ C จัดอยู่ในประเภทเดียวกัน แต่เมื่อวิเคราะห์แบบกลุ่ม (Cluster analysis) จะอาศัยระยะทางหรือคะแนนเป็นตัวตั้ง จะทำให้ AB เป็นกลุ่มสูง ส่วน CD เป็นกลุ่มต่ำ

ตัวแปรและขนาดกลุ่มตัวอย่าง
            ตัวแปรที่ใช้กับสถิติการวิเคราะห์องค์ประกอบนี้ก็ยังคง ยึดตัวแปรที่มีค่าต่อเนื่อง (Metric Variable)  และหากตัวแปรที่ใช้ไม่อยู่ค่าต่อเนื่องก็แก้ปัญหาโดยการ แทนค่าให้อยู่ในรูปของค่าต่อเนื่องหรือ การดัมมี่ตัวแปร (Dummy Variable)
             กลุ่มตัวอย่างที่ใช้ได้มีนักสถิติหลายท่านกำหนดเกณฑ์ในการเก็บข้อมูล โดยจะข้อสรุปเพื่อให้มีความเข้าใจตรงกัน ถึงแม้ว่าการวิเคราะห์องค์ประกอบนั้นจะขึ้นอยู่กับ ข้อมูลเชิงความสัมพันธ์ใน Correlation Matrix ก็ตาม เช่น ในการวิเคราะห์องค์ประกอบควรเก็บข้อมูลกับกลุ่มตัวอย่าง 50 คน ขึ้นไป หรือ นับจำนวนตัวแปรที่มีและทำการเก็บข้อมูลโดยถือให้อย่างน้อยตัวแปรละ 5 คน เป็นต้น แต่อย่างไรก็ตามในการเก็บกลุ่มตัวอย่างนั้น หากเก็บในจำนวนหรือปริมาณที่มากจะทำให้ค่าสถิติที่ใช้ทดสอบมีนัยสำคัญทงสถิติได้ง่าย

ข้อตกลงเบื้องต้น
            ในการวิเคราะห์สถิติระดับพหุนั้น โดยทั่วไปข้อตกลงเบื้องต้นก่อนการวิเคราะห์ ได้แก่ ข้อมูลตัวแปรที่เก็บมาจากกลุ่มตัวอย่าง มีการแจกแจงแบบโค้งปกติ ไม่มีสภาวะซ้ำซ้อน (Multicollinearity) มีความสัมพันธ์เชิงเส้น (linearity) เป็นต้น การวิเคราะห์องค์ประกอบก็ยังยึดข้อตกลงเบื้องต้นดังกล่าว แต่จะเพิ่มในเรื่องของแนวคิด (Concept) ที่นักวิจัยควรพึงตระหนักให้เป็นข้อตกลงเบื้องต้น และมีความสำคัญมากการข้อตกลงเบื้องต้นทางสถิติ คือ ในการวิเคราะห์องค์ประกอบนั้น จะใช้ข้อมูลเชิงความสัมพันธ์ใน Correlation Matrix รวมถึง สารสนเทศที่มาจากข้อมูลในตัวแปรดังเดิม โดยตั้งอยู่ภายใต้เงื่อนไขโครงสร้างนั้น ๆ รวมไปถึงการเก็บข้อมูลที่กำหนดความเฉพาะแต่ต้องมาจากกระบวนการสุ่มที่อาศัยความน่าจะเป็น

ภาพรวมของความสัมพันธ์ระหว่างตัวแปร
             ในการวิเคราะห์องค์ประกอบนั้นต้องอาศัยข้อมูลเชิงความสัมพันธ์ใน (Correlation Matrix) การตัดสินในพื้นฐานไม่ใช่เพื่อแค่ค่าความสัมพันธ์แต่ต้องมีหลักฐาน หรือเงื่อนไขเชิงประจักษ์ และในภาพรวมที่นำมาตัดสินว่าตัวแปรแต่ละตัวมีความสัมพันธ์ในระดับที่เหมาะสมหรือไม่ นั้น พิจารณาได้จาก
             1. ค่าความสัมพันธ์แท้ที่ส่งผลต่อสิ่งที่ต้องการศึกษา (Partial Correlation) หากค่า ดังกล่าวสูง จะทำให้ตัวแปรที่ศึกษาจะไม่เหมาะสมกับการวิเคราะห์องค์ประกอบ เพราะหากมีสูงมากจะทำให้ตัวแปรอื่นมีค่า loading ต่ำ
             2. ค่าความสัมพันธ์อย่างง่ายควรมีความสัมพันธ์อยู่ระหว่าง .30 ถึง .70 หรือในบางตำรา อาจจะขยายไปถึง .80
             3. ทดสอบด้วย Bartlett s test sphericity ต้องมีนัยสำคัญทางสถิติ (sig < .05) คือ จะหมายความว่า ตัวแปรที่นำมาวิเคราะห์ในรูปของ Correlation Matrix มีความสามารถในการวิเคราะห์องค์ประกอบได้
            
Common factor analysis และ Component factor analysis
            รูปแบบการวิเคราะห์องค์ประกอบนั้นพื้นฐานต้องมากจาก Correlation Matrix หากเป็นักวิจัยที่เคร่งทางสถิติ การวิเคราะห์แบบ Component factor analysis จะไม่ถือว่าเป็นการวิเคราะห์องค์ประกอบ เพราะพื้นฐานของ Component factor analysis จะเป็นการแชร์ความแปรปรวนทั้งหมดกับตัวแปรที่นำมาวิเคราะห์องค์ประกอบ ไม่ว่าตัวแปรนั้นจะสำคัญหรือไม่ สรุปได้ดังนี้
             Common factor analysis จะเป็นการแชร์ความแปรปรวนเฉพาะส่วนที่มีความสัมพันธ์กันในองค์ประกอบนั้น ๆ ไม่มีการแชร์ให้กับค่าความคลาดเคลื่อนหรือตัวแปรอื่น ส่วน
             Component factor analysis จะแชร์ความแปรปรวนให้กับตัวแปรที่เข้าร่วมวิเคราะห์ทุกตัวรวมถึง ความคลาดเคลื่อนด้วย

เกณฑ์ในการเลือกจำนวนองค์ประกอบ
            ในการจะติดสินว่า ตัวแปรที่นำมาวิเคราะห์นั้นควรแยกเป็นกี่องค์ประกอบจึงจะได้สารสนเทศครบตามวัตถุประสงค์ของการวิเคราะห์องค์ประกอบ โดยมีเกณฑ์ในการตัดสินใจดังนี้
             1. แบ่งอย่างง่าย คือแบ่งตามตัวแปรที่นำเข้าไปทั้งหมด แต่จะมีปัญหาเมื่อตัวแปรในการวิเคราะห์ข้อมูลมีจำนวนมาก เช่น วิเคราะห์ 30 ตัวแปร แบ่งอย่างง่ายก็จะมี 30 องค์ประกอบ แต่จะผิดกับวัตถุประสงค์ของการวิเคราะห์องค์ประกอบในเรื่องของการสรุป หรือการลดตัวแปรแต่ยังคงสาระสนเทศ
             2. ตัวแปรแฝงเป็นเกณฑ์ โดยธรรมชาติตัวแปรแฝงในการวิเคราะห์องค์ประกอบนั้น จะทำหน้าที่คล้ายกับตัวแปรตาม โดยจะมีกลุ่มของตัวแปรที่เป็นตัวบ่งชี้ให้ตัวแปรแฝงเป็นองค์ประกอบในการวิเคราะห์ โดยส่วนมากจะยึดตามค่า Eigen ต้องมากกว่า 1
             3. วัตถุประสงค์การวิจัยเป็นเกณฑ์ ในการแบ่งในลักษณะนี้จะเน้นในส่วนของการทดสอบสมมติฐานการวิจัย คือนักวิจัยรู้แล้วหรือทำการศึกษาซ้ำเพื่อยืนยัน ว่าการแบ่งจำนวนองค์ประกอบถูกต้องหรือไม่ โดยนักวิจัยจะรู้ว่ามีกี่องค์ประกอบอยู่แล้ว
             4. ใช้ความแปรปรวนเป็นเกณฑ์ โดยทั่วไปแล้วจะใช้ความแปรปรวนในเชิงของการอธิบายได้ มากกว่าการทำนาย แต่มีที่มาคลายกัน ในธรรมชาติของงานวิจัยทางพฤติกรรมศาสตร์และสังมศาสตร์นี้ เปอร์เซ็นของความแปรปรวนที่ร่วมอธิบายประมาณ 60 หรือมากกว่า กลุ่มตัวแปรที่ให้สัดส่วนความแปรปรวนนั้น ถือว่าเป็น 1 องค์ประกอบ
             5. ใช้สกรีตเทส โดยดูแนวโน้มของสกรีตเทส เพราะในภาพจะเป็นการวาดโครงร่างของข้อมูลที่ได้จาก Correlation Matrix จะแสดงจุดตัด และจะหยุดแบ่งองค์ประกอบเมื่อไม่มีความชัน
             6. ความแตกต่างของชุดตัวแทน ในการแบ่งองค์ประกอบอาจดูจากธรรมชาติของตัวแปรที่นำมาวิเคราะห์ข้อมูลโดยแยกว่า ตัวแปรใดมีความเหมือนหรือต่าง ก็จัดเป็นองค์ประกอบ
             สรุปในการใช้เกณฑ์ในการ เลือกจำนวนองค์ประกอบในการวิเคราะห์องค์ประกอบนั้น โดยส่วนมากนักวิจัยจะพิจารณาเพียงแค่ เกณฑ์เดียว แต่หากนักวิจัยเคร่งในเรื่องของเกณฑ์ในการตัดสินก็สามารถใช้การเกณฑ์ร่วมกันได้ เช่น ดูค่า Eigen ต้องมากกว่า 1 ในเรื่องของการใช้ตัวแปรแฝงเป็นเกณฑ์ ผู้วิจัยรู้จำนวนองค์ประกอบล่วงหน้า แต่ต้องการพิสูนจ์ ทดสอบสมมติฐาน หรือใช้สกรีตเทสในการตัดสินใจ รวมถือการใช้สันส่วนของความแปรปรวนที่ต้องมากกว่า ร้อยละ 60 ในงานวิจัยทางการศึกษา ถือว่าเป็น 1 องค์ประกอบ หรืออาจใช้เกณฑ์ความต่างในการแบ่งองค์ประกอบ



ไม่มีความคิดเห็น:

แสดงความคิดเห็น

วัตถุประสงค์การวิจัย 3 ข้อ สูตรยาผีบอก

      นโยบายเปลี่ยน การปฏิบัติก็เปลี่ยน การทำวิจัยในครูก็ยิ่งลดลง เนื่องด้วยการประเมินวิทยฐานะแบบใหม่หรือเรียกกันติดปากว่า ว.21 วันนี้จะมาพ...