การวิเคราะห์องค์ประกอบ (Factor
Analysis)
จากการอ่านบทความ
และหนังสือด้านสถิติทั้งในไทยและต่างประเทศ จะเห็นว่าการให้ความหมาย
ของการวิเคราะห์องค์ประกอบนั้น จะเริ่มที่ การวิเคราะห์องค์ประกอบคือ
เทคนิคที่ใช้วิเคราะห์คำตอบในสถิติระดับพหุ แต่ในมุมมองของ
ข้าพเจ้าหากจะให้คำตอบเรื่องการวิเคราะห์องค์ประกอบนั้นจะให้คำตอบที่กว้างไปหาส่วนที่
แคบ โดยตามหมายหมายในการสังเคราะห์ การอ่าน ตามรูปแบบของอิสระ นะครับ “การวิเคราะห์องค์ประกอบคือ
การใช้เทคนิคทางสถิติกลุ่ม กลุ่มของความสัมพันธ์ภายในของตัวแปรตาม (Interdependence
Techniques) โดยมีวัตถุประสงค์เพื่อสรุปหรือลดตัวแปร
โดยยังคงสืบถือสารสนเทศของตัวแปรดังเดิม”
ข้อแตกต่างระหว่างการใช้สถิติกลุ่ม
Interdependence
Techniques กับ กลุ่ม dependence Techniques
นั้น มีข้อที่จำแนกได้ชัดเจนคือ สถิติกลุ่ม Interdependence Techniques จะไม่สามารถระบุได้ว่าตัวแปรใดคือตัวแปรต้น ตัวแปรตาม และตัวแปรที่อยู่ในการวิเคราะห์องค์ประกอบนั้นจะเป็นการพยายามให้สารสนเทศมากที่สุด
ไม่ใช่นำเข้าเพื่อทำนายสิ่งที่จะเกิดเหมือน กลุ่มสถิติ dependence
Techniques ที่พยายามรวมความแปรปรวนเพื่อการพยากรณ์เป็นหลัก แต่เมื่อให้วัถตุประสงค์ของการวิเคราะห์องค์ประกอบไปแล้ว
สถิติกลุ่ม Interdependence Techniques กับ กลุ่ม
dependence Techniques จะเริ่มที่ส่วนที่อธิบายได้คลายคล้ายกัน
โดยวัถตุประสงค์ของของการใช้สถิติการวิเคราะห์องค์ประกอบนั้น เพื่อ
สรุปและลดตัวแปร การสรุปผลนั้นเป็นการใช้สารสนเทศที่ได้จากตัวแปรโดยใช้ค่า Correlation
Matrix แล้วอธิบายรวมในลักษณะของตัวแปรแฝง (Latent Variable)
ส่วนวัตถุประสงค์เพื่อลดตัวแปรหรือสร้างรวมกลุ่มตัวแปรใหม่จากกลุ่มตัวแปรเดิม
โดยอาศัยสารสนเทศที่ได้จากตัวแปรโดยใช้ค่า Correlation Matrix เช่นเดียวกัน
ตัวอย่างของวัถตุประสงค์การใช้สถิติการวิเคราะห์องค์ประกอบ
เพื่อลดตัวแปร
จากภาพจะเห็นได้ว่า มีตัวแปรเดิมอยู่ 4 ตัว เมื่อศึกษาทิศทาง
และความสัมพันธ์ใน Correlation Matrix
สรุปได้ว่ามีทิศทางแนวโน้ว ที่จะให้สารสนเทศใหม่ได้จึงรวมและสร้างเป็นตัวแปรใหม่
ในรูปแบบของ ตัวแปรแฝง Latent Variable
จะเห็นได้ว่า
วัตถุประสงค์หลักของการวิเคราะห์องค์ประกอบนั้นจะเป็นกานสรุปข้อมูล
จากตัวแปรที่มีอยู่ และการให้สารสนเทศใหม่
โดยวัตถุประสงค์ทั้งคู่ต้องอาศัยข้อมูลเดิมจากตัวแปรดั่งเดิม
หรือข้อมูลเชิงความสัมพันธ์ใน Correlation Matrix
จากตัวอย่างที่กล่าวมาข้างต้น เป็นแค่กรณีที่ยกตัวอย่าง อาจจะไม่เป็นแบบนี้เสมอไป
แต่ข้อให้ผู้อ่านได้เข้าใจวัตถุประสงค์ ของสถิติการวิเคราะห์องค์ประกอบ
รูปแบบของการวิเคราะห์องค์ประกอบ
เมื่อศึกษากลุ่มตัวแปรที่นำมาวิเคราะห์และดูหรือแยกได้ว่าวัตถุประสงค์ในการวิเคราะห์องค์ประกอบนั้น
เพื่อสรุปหรือเพื่อลดตัวแปร ได้แล้วนักวิจัยต้องพิจารณาต่อไปอีกว่า
ภายใต้ความสัมพันธ์ภายในระหว่างตัวแปร Correlation Matrix
เป็นความสัมพันธ์ระหว่างตัวแปร หรือเป็นกลุ่มตัวแทน
โดยจะพิจาณารูปแบบของการวิเคราะห์องค์ประกอบเป็น 2 ประเภทคือ
ประเภท R และประเภท Q ดังนี้
การวิเคราะห์องค์ประกอบทั้งประเภท R (R-TYPE) และ Q (Q-TYPE) นั้น ต้องอาศัยความสัมพันธ์ภายในระหว่างตัวแปร Correlation
Matrix ซึ่ง ประเภท R นั้นเป็นความสัมพันธ์ระหว่างตัวแปรที่แท้จริง
แต่ความสัมพันธ์ประเภท Q จะอาศัยสรุปจากประเภทของ R ก่อน ค่อยนำไปเป็นตัวแทนหรือกลุ่ม ซึ่งจะเห็นได้ว่า Q-TYPE กับการวิเคราะห์แบบกลุ่ม (Cluster analysis)
ก็มีข้อแตกต่างกันย่อย ออกไป โดย Q-TYPE
นั้นจะยึดกลุ่มตัวแทนที่มีคุณลักษณะเหมือนกัน แต่ การวิเคราะห์แบบกลุ่ม (Cluster
analysis) จะอาศัยแยกตามลักษณะคะแนนหรือช่วง ดังตัวอย่าง
จากภาพประกอบ เป็นคะแนนของผู้เข้าสอบ 4 คน จากการวัด ตัวแปร 3 ตัว
เมื่อนำมาแสดงเป็นกราฟวิเคราะห์ข้อมูลจะเห็นได้ว่า เมื่อพิจารณาตาม Q-TYPE จะพบว่า A และ C จัดอยู่ในประเภทเดียวกัน
แต่เมื่อวิเคราะห์แบบกลุ่ม (Cluster analysis)
จะอาศัยระยะทางหรือคะแนนเป็นตัวตั้ง จะทำให้ AB เป็นกลุ่มสูง
ส่วน CD เป็นกลุ่มต่ำ
ตัวแปรและขนาดกลุ่มตัวอย่าง
ตัวแปรที่ใช้กับสถิติการวิเคราะห์องค์ประกอบนี้ก็ยังคง
ยึดตัวแปรที่มีค่าต่อเนื่อง (Metric Variable)
และหากตัวแปรที่ใช้ไม่อยู่ค่าต่อเนื่องก็แก้ปัญหาโดยการ
แทนค่าให้อยู่ในรูปของค่าต่อเนื่องหรือ การดัมมี่ตัวแปร (Dummy Variable)
กลุ่มตัวอย่างที่ใช้ได้มีนักสถิติหลายท่านกำหนดเกณฑ์ในการเก็บข้อมูล
โดยจะข้อสรุปเพื่อให้มีความเข้าใจตรงกัน
ถึงแม้ว่าการวิเคราะห์องค์ประกอบนั้นจะขึ้นอยู่กับ ข้อมูลเชิงความสัมพันธ์ใน Correlation
Matrix ก็ตาม เช่น ในการวิเคราะห์องค์ประกอบควรเก็บข้อมูลกับกลุ่มตัวอย่าง
50 คน ขึ้นไป หรือ
นับจำนวนตัวแปรที่มีและทำการเก็บข้อมูลโดยถือให้อย่างน้อยตัวแปรละ 5 คน เป็นต้น แต่อย่างไรก็ตามในการเก็บกลุ่มตัวอย่างนั้น
หากเก็บในจำนวนหรือปริมาณที่มากจะทำให้ค่าสถิติที่ใช้ทดสอบมีนัยสำคัญทงสถิติได้ง่าย
ข้อตกลงเบื้องต้น
ในการวิเคราะห์สถิติระดับพหุนั้น
โดยทั่วไปข้อตกลงเบื้องต้นก่อนการวิเคราะห์ ได้แก่
ข้อมูลตัวแปรที่เก็บมาจากกลุ่มตัวอย่าง มีการแจกแจงแบบโค้งปกติ ไม่มีสภาวะซ้ำซ้อน (Multicollinearity) มีความสัมพันธ์เชิงเส้น (linearity) เป็นต้น การวิเคราะห์องค์ประกอบก็ยังยึดข้อตกลงเบื้องต้นดังกล่าว
แต่จะเพิ่มในเรื่องของแนวคิด (Concept) ที่นักวิจัยควรพึงตระหนักให้เป็นข้อตกลงเบื้องต้น
และมีความสำคัญมากการข้อตกลงเบื้องต้นทางสถิติ คือ ในการวิเคราะห์องค์ประกอบนั้น
จะใช้ข้อมูลเชิงความสัมพันธ์ใน Correlation Matrix รวมถึง
สารสนเทศที่มาจากข้อมูลในตัวแปรดังเดิม โดยตั้งอยู่ภายใต้เงื่อนไขโครงสร้างนั้น ๆ
รวมไปถึงการเก็บข้อมูลที่กำหนดความเฉพาะแต่ต้องมาจากกระบวนการสุ่มที่อาศัยความน่าจะเป็น
ภาพรวมของความสัมพันธ์ระหว่างตัวแปร
ในการวิเคราะห์องค์ประกอบนั้นต้องอาศัยข้อมูลเชิงความสัมพันธ์ใน (Correlation
Matrix) การตัดสินในพื้นฐานไม่ใช่เพื่อแค่ค่าความสัมพันธ์แต่ต้องมีหลักฐาน
หรือเงื่อนไขเชิงประจักษ์ และในภาพรวมที่นำมาตัดสินว่าตัวแปรแต่ละตัวมีความสัมพันธ์ในระดับที่เหมาะสมหรือไม่
นั้น พิจารณาได้จาก
1. ค่าความสัมพันธ์แท้ที่ส่งผลต่อสิ่งที่ต้องการศึกษา (Partial
Correlation) หากค่า ดังกล่าวสูง
จะทำให้ตัวแปรที่ศึกษาจะไม่เหมาะสมกับการวิเคราะห์องค์ประกอบ เพราะหากมีสูงมากจะทำให้ตัวแปรอื่นมีค่า
loading ต่ำ
2. ค่าความสัมพันธ์อย่างง่ายควรมีความสัมพันธ์อยู่ระหว่าง .30 ถึง .70 หรือในบางตำรา อาจจะขยายไปถึง .80
3.
ทดสอบด้วย Bartlett s test sphericity ต้องมีนัยสำคัญทางสถิติ (sig < .05) คือ
จะหมายความว่า ตัวแปรที่นำมาวิเคราะห์ในรูปของ Correlation Matrix มีความสามารถในการวิเคราะห์องค์ประกอบได้
Common factor analysis และ
Component factor analysis
รูปแบบการวิเคราะห์องค์ประกอบนั้นพื้นฐานต้องมากจาก
Correlation
Matrix หากเป็นักวิจัยที่เคร่งทางสถิติ การวิเคราะห์แบบ Component
factor analysis จะไม่ถือว่าเป็นการวิเคราะห์องค์ประกอบ
เพราะพื้นฐานของ Component factor analysis
จะเป็นการแชร์ความแปรปรวนทั้งหมดกับตัวแปรที่นำมาวิเคราะห์องค์ประกอบ ไม่ว่าตัวแปรนั้นจะสำคัญหรือไม่
สรุปได้ดังนี้
Common factor
analysis
จะเป็นการแชร์ความแปรปรวนเฉพาะส่วนที่มีความสัมพันธ์กันในองค์ประกอบนั้น ๆ
ไม่มีการแชร์ให้กับค่าความคลาดเคลื่อนหรือตัวแปรอื่น ส่วน
Component factor
analysis
จะแชร์ความแปรปรวนให้กับตัวแปรที่เข้าร่วมวิเคราะห์ทุกตัวรวมถึง ความคลาดเคลื่อนด้วย
เกณฑ์ในการเลือกจำนวนองค์ประกอบ
ในการจะติดสินว่า
ตัวแปรที่นำมาวิเคราะห์นั้นควรแยกเป็นกี่องค์ประกอบจึงจะได้สารสนเทศครบตามวัตถุประสงค์ของการวิเคราะห์องค์ประกอบ
โดยมีเกณฑ์ในการตัดสินใจดังนี้
1. แบ่งอย่างง่าย คือแบ่งตามตัวแปรที่นำเข้าไปทั้งหมด
แต่จะมีปัญหาเมื่อตัวแปรในการวิเคราะห์ข้อมูลมีจำนวนมาก เช่น วิเคราะห์ 30 ตัวแปร แบ่งอย่างง่ายก็จะมี 30 องค์ประกอบ
แต่จะผิดกับวัตถุประสงค์ของการวิเคราะห์องค์ประกอบในเรื่องของการสรุป
หรือการลดตัวแปรแต่ยังคงสาระสนเทศ
2. ตัวแปรแฝงเป็นเกณฑ์
โดยธรรมชาติตัวแปรแฝงในการวิเคราะห์องค์ประกอบนั้น จะทำหน้าที่คล้ายกับตัวแปรตาม โดยจะมีกลุ่มของตัวแปรที่เป็นตัวบ่งชี้ให้ตัวแปรแฝงเป็นองค์ประกอบในการวิเคราะห์
โดยส่วนมากจะยึดตามค่า Eigen ต้องมากกว่า 1
3. วัตถุประสงค์การวิจัยเป็นเกณฑ์
ในการแบ่งในลักษณะนี้จะเน้นในส่วนของการทดสอบสมมติฐานการวิจัย
คือนักวิจัยรู้แล้วหรือทำการศึกษาซ้ำเพื่อยืนยัน
ว่าการแบ่งจำนวนองค์ประกอบถูกต้องหรือไม่
โดยนักวิจัยจะรู้ว่ามีกี่องค์ประกอบอยู่แล้ว
4. ใช้ความแปรปรวนเป็นเกณฑ์ โดยทั่วไปแล้วจะใช้ความแปรปรวนในเชิงของการอธิบายได้
มากกว่าการทำนาย แต่มีที่มาคลายกัน
ในธรรมชาติของงานวิจัยทางพฤติกรรมศาสตร์และสังมศาสตร์นี้
เปอร์เซ็นของความแปรปรวนที่ร่วมอธิบายประมาณ 60 หรือมากกว่า
กลุ่มตัวแปรที่ให้สัดส่วนความแปรปรวนนั้น ถือว่าเป็น 1 องค์ประกอบ
5. ใช้สกรีตเทส โดยดูแนวโน้มของสกรีตเทส
เพราะในภาพจะเป็นการวาดโครงร่างของข้อมูลที่ได้จาก Correlation Matrix จะแสดงจุดตัด และจะหยุดแบ่งองค์ประกอบเมื่อไม่มีความชัน
6. ความแตกต่างของชุดตัวแทน
ในการแบ่งองค์ประกอบอาจดูจากธรรมชาติของตัวแปรที่นำมาวิเคราะห์ข้อมูลโดยแยกว่า
ตัวแปรใดมีความเหมือนหรือต่าง ก็จัดเป็นองค์ประกอบ
สรุปในการใช้เกณฑ์ในการ
เลือกจำนวนองค์ประกอบในการวิเคราะห์องค์ประกอบนั้น โดยส่วนมากนักวิจัยจะพิจารณาเพียงแค่
เกณฑ์เดียว
แต่หากนักวิจัยเคร่งในเรื่องของเกณฑ์ในการตัดสินก็สามารถใช้การเกณฑ์ร่วมกันได้
เช่น ดูค่า Eigen
ต้องมากกว่า 1 ในเรื่องของการใช้ตัวแปรแฝงเป็นเกณฑ์
ผู้วิจัยรู้จำนวนองค์ประกอบล่วงหน้า แต่ต้องการพิสูนจ์ ทดสอบสมมติฐาน
หรือใช้สกรีตเทสในการตัดสินใจ รวมถือการใช้สันส่วนของความแปรปรวนที่ต้องมากกว่า
ร้อยละ 60 ในงานวิจัยทางการศึกษา ถือว่าเป็น 1 องค์ประกอบ หรืออาจใช้เกณฑ์ความต่างในการแบ่งองค์ประกอบ
ไม่มีความคิดเห็น:
แสดงความคิดเห็น