วันพฤหัสบดีที่ 17 กรกฎาคม พ.ศ. 2557

การพยากรณ์ (PREDICTING)


      การพยากรณ์ตัวแปรเป็นการใช้ความรู้หรือสารสนเทศที่มีอยู่ เพื่อทำนายหรือพยากรณ์จากเส้นที่มีระบบขึ้นลง
อย่างเป็นระบบ หรือ regression line เพื่อให้สอดคล้องกับ สมการเส้นตรงและ Scatterplots ที่อิงการใช้คะแนน     Z- SCORE กล่าวโดยรวมคือ การที่จะพยากรณ์สิ่งที่จะเกิดขึ้นได้นั้นตัวแปรดังกล่าวต้องเกี่ยวพันธ์กับข้อมูลที่มี 
โดยมีหลักฐานเชิงประจักษ์ประกอบการตัดสินใจ นั้นคือเส้น regression line ซึ่งเป็นการพัฒนาจาก Scatterplots 
นั้นเอง

เส้นการขึ้นลงอย่างเป็นระบบ (THE REGESSION LINE)
       เส้นการขึ้นลงอย่างเป็นระบบนั้น มีชื่อเรียกที่ต่างกันออกไป แต่ในครั้งนี้ผู้เขียนได้เรียกชื่อเส้นดังกล่าวตามลักษณะ โดยมีระบบที่แฝงอยู่ภายในทำให้เส้นดังกล่าวมีค่า หลังการแทนค่าที่ต่างออกไปตามชุดข้อมูลที่มีอยู่ โดยทั่วไปแล้วจะกล่าวถึงสมการเส้นตรงคือ

                                                            Y` = bx + c

      โดย b คือ ค่าความชันในสมหาร โดยค่าความชันนี้เป็นตัวเลข หรือค่าที่บ่งบอกถึง การเพิ่มขึ้นหรือลดลงเมื่อกำหนดให้ตัวแปรอื่นคนที่ ในตัวแปรตาม 1 หน่วย ตัวอย่างเช่น มีสมการคือ  Y` = 1.78x + c จะอธิบายได้ว่า ค่าความชันของสมการมีค่า 1.78 เมื่อกำหนดให้ตัวแปรอื่นคงที จะแปรปรวนเพิ่ม (สังเกตเครื่องหมาย บวกคือเพิ่ม ลบคือลด) ในตัวแปรตามจำนวนตัวเลขที่ระบุ



     
ส่วน c คือ ค่าคงที่ ที่เป็นจุดตัดแกน y ของชุดข้อมูล ปกติโดยทั่วไปแล้วหากทำการศึกษาเปรียบเทียบโดยการแปรค่าคะแนนดิบจากชุดข้อมูลจาก X และ Y ให้เป็นคะแนนมาตรฐานแล้ว นิยมกำหนดค่าให้ c เป็น 0 นั้นหมายถึง เส้นการขึ้นลงอย่างเป็นระบบ หรือ regression line จะลากผ่านจุด 0,0 เขียนเป็นสมการได้ Z`y = m(Zx) + 0 หรือ      Z`y = m(Zx)


















      จากภาพข้างต้น ต้องแยกแยะค่าให้ได้ว่า ค่า Z คือค่าที่เกิดขึ้นแทนจริง ส่วนค่า Z`นั้นเป็นค่าที่เกิดจากระบบที่ขึ้นลงจากชุดข้อมูลที่ทำการศึกษา Z- Z` คือ ค่าความคลาดเคลื่อนในการพยากรณ์ จากภาพคะแนนของ Carl หากใช้จากคะแนนจริง Zy มีคะแนน 1.83 หากใช้เส้น regression line ในการพยากรณ์จะมีความคลาดเคลื่อน 1.83-.93 = .90

      สรุปคือ การทำ Scatterplots นั้นเป็นการศึกษาความสัมพันธ์ของตัวแปร และเป็นการกระทำโดยมีชุดข้อมูลจริง แต่ regression line นั้นเป็นการต่อยอดของ Scatterplots เพื่อพยากรณ์หรือทำนายตัวแปรที่สนใจ จากชุดข้อมูลที่มีอยู่ โดยการกำหนดเส้น regression line เป็นการกำหนดจากผลรวมของค่าที่แท้จริงลบด้วยค่าพยากรณ์ทุกจุด ยกกำลังสอง เพื่อให้เส้นมี ความคลาดเคลื่อนที่น้อยที่สุด (least squares criterion) และนักสถิติได้พัฒนาเพื่อให้การพยากรณ์จากจุดบนชุดข้อมูลให้มีความคลาดเคลื่อนน้อยที่สุดจึงทำการประยุกต์ความชันในสมการ ได้เป็นสมการดังนี้


         จะเห็นได้ว่า ฝั่งขวาของสมการจะเป็นค่าเดียวกันกับการหาสหสัมพันธ์ของเพียร์สันจากประชากร  และกำหนดให้จุดตัดแกน Y หรือค่า c เท่ากับ 0 แล้ว สามารถแปลงสูตรได้ดังนี้




ไม่มีความคิดเห็น:

แสดงความคิดเห็น

วัตถุประสงค์การวิจัย 3 ข้อ สูตรยาผีบอก

      นโยบายเปลี่ยน การปฏิบัติก็เปลี่ยน การทำวิจัยในครูก็ยิ่งลดลง เนื่องด้วยการประเมินวิทยฐานะแบบใหม่หรือเรียกกันติดปากว่า ว.21 วันนี้จะมาพ...