สถิติพื้นฐานในการวิเคราะห์ข้อมูลเชิงปริมาณ
แบบจำลองการถดถอยเชิงเส้นใช้เพื่อแสดงหรือทำนายความสัมพันธ์ระหว่างสอง ตัวแปรหรือปัจจัย ปัจจัยที่ถูกทำนาย (ปัจจัยที่ แก้ สมการ) ถูกเรียกว่า ตัวแปรตาม ปัจจัยที่ใช้พยากรณ์ค่าของตัวแปรอิสระจะเรียกว่าตัวแปรอิสระ
ข้อมูลที่ดีไม่ได้บอกเล่าเรื่องราวที่สมบูรณ์ การวิเคราะห์การถดถอยเป็นเรื่องปกติที่ใช้ในการวิจัยเนื่องจากพบว่ามีความสัมพันธ์ระหว่างตัวแปร
แต่ ความสัมพันธ์ไม่เหมือนกับสาเหตุ แม้บรรทัดในการถดถอยเชิงเส้นอย่างง่ายที่เหมาะกับจุดข้อมูลที่ดีอาจไม่ได้พูดอะไรบางอย่างที่ชัดเจนเกี่ยวกับความสัมพันธ์ของเหตุและผล
ในการถดถอยเชิงเส้นแบบง่ายการ สังเกต แต่ละครั้งจะประกอบด้วยค่าสองค่า ค่าหนึ่งสำหรับตัวแปรอิสระและหนึ่งค่าสำหรับตัวแปรอิสระ
- การวิเคราะห์การถดถอยเชิงเส้นแบบง่าย (Simple Linear Regression Analysis) รูปแบบการวิเคราะห์การถดถอยที่ง่ายที่สุดใช้ตัวแปรอิสระและตัวแปรอิสระหนึ่งตัวแปร ใน รูปแบบง่ายๆนี้ เส้นตรงจะประมาณความสัมพันธ์ระหว่างตัวแปรอิสระและตัวแปรอิสระ
- การวิเคราะห์การถดถอยเชิงพหุ (Multiple Regression Analysis) เมื่อมีการใช้ตัวแปรอิสระสองตัวหรือมากกว่าในการวิเคราะห์การถดถอยแบบจำลองโมเดลจะไม่เป็นแบบเส้นตรงอีกต่อไป
แบบจำลองการถดถอยเชิงเส้นแบบง่าย
แบบจำลองการถดถอยเชิงเส้นแบบง่ายจะแสดงดังนี้: y = ( β 0 + β 1 + Ε
โดยการคำนวณทางคณิตศาสตร์ทั้งสองปัจจัยที่เกี่ยวข้องกับการวิเคราะห์การถดถอยเชิงเส้นแบบง่ายจะถูกกำหนดเป็น x และ y
สมการที่อธิบายว่า y เกี่ยวข้องกับ x เรียกว่า แบบจำลองการถดถอย รูปแบบการถดถอยเชิงเส้นยังมีข้อผิดพลาดที่แสดงโดย Ε หรือจดหมายกรีก epsilon คำข้อผิดพลาดใช้เพื่ออธิบายความแปรปรวนใน y ที่ไม่สามารถอธิบายได้ด้วย ความสัมพันธ์เชิงเส้น ระหว่าง x และ y
นอกจากนี้ยังมีพารามิเตอร์ที่แสดงถึงประชากรที่กำลังศึกษา พารามิเตอร์ เหล่านี้ ของรูปแบบ ที่แสดงโดย ( β 0+ β 1 x )
แบบจำลองการถดถอยเชิงเส้นแบบง่าย
สมการถดถอยเชิงเส้นแบบง่ายจะแสดงดังนี้: Ε ( y ) = ( β 0 + β 1 x )
สมการถดถอยเชิงเส้นแบบง่ายจะถูกกราฟเป็นเส้นตรง
( β 0 คือการสกัดกั้น y ของเส้นการถดถอย
β 1 คือความชัน
Ε ( y ) เป็นค่าเฉลี่ยหรือที่คาดไว้ของ y สำหรับค่าที่กำหนดของ x
เส้นการถดถอยสามารถแสดงความสัมพันธ์เชิงบวกเชิงบวกความสัมพันธ์เชิงลบเชิงเส้นหรือไม่มีความสัมพันธ์ ถ้าเส้นกราฟในการถดถอยเชิงเส้นแบบเรียบง่าย (ไม่ลาดเอียง) ไม่มีความสัมพันธ์ระหว่างตัวแปรทั้งสอง ถ้าเส้นถดถอยลาดขึ้นกับปลายล่างของเส้นที่จุดตัดแกน (แกน) ของกราฟและด้านบนสุดของเส้นที่ยื่นออกมาในฟิลด์กราฟห่างจากจุดตัดขวาง (แกน) ความสัมพันธ์เชิงเส้นบวกมีอยู่ . ถ้าเส้นถดถอยลาดลงไปด้านบนของเส้นที่จุดตัดแกน (แกน) ของกราฟและด้านล่างสุดของเส้นที่ยื่นลงไปในฟิลด์กราฟไปยังจุดตัดขวาง (แกน) มีความสัมพันธ์เชิงลบเชิงเส้นอยู่
สมการถดถอยเชิงเสนโดยประมาณ
ถ้า พารามิเตอร์ของประชากร เป็นที่รู้จักกันสมการถดถอยเชิงเส้นอย่างง่าย (แสดงด้านล่าง) สามารถใช้ในการคำนวณค่าเฉลี่ยของ y สำหรับค่าที่รู้จักของ x
Ε ( y ) = ( β 0 + β 1 x )
อย่างไรก็ตามในทางปฏิบัติค่าพารามิเตอร์จะไม่เป็นที่รู้จักดังนั้นจึงต้องมีการประมาณโดยการใช้ ข้อมูลจากตัวอย่าง ประชากร พารามิเตอร์ประชากรถูกประมาณโดยใช้สถิติตัวอย่าง สถิติตัวอย่าง จะแสดงด้วย b 0 + b 1. เมื่อสถิติตัวอย่างถูกแทนที่สำหรับพารามิเตอร์ประชากรจะมีการสร้างสมการถดถอยที่ประมาณไว้
สมการถดถอยประมาณดังแสดงด้านล่าง
( ŷ ) = ( β 0 + β 1 x
( ŷ ) ออกเสียงว่าเป็น หมวก
กราฟของสมการถดถอยง่ายโดยประมาณเรียกว่าเส้นการถดถอยโดยประมาณ
B 0 คือการสกัดกั้น y
ข 1 คือความลาดชัน
ŷ ) คือค่าประมาณของ y สำหรับค่าที่กำหนดของ x
หมายเหตุสำคัญ: การวิเคราะห์การถดถอยไม่ใช้ในการตีความ ความสัมพันธ์ ระหว่าง เหตุและผล ระหว่างตัวแปร การวิเคราะห์การถดถอยสามารถ อธิบายได้ว่าตัวแปรมีความเกี่ยวเนื่องกันอย่างไร หรือ ตัวแปรที่เกี่ยวข้อง กับ ตัวแปร อื่น ๆ
ในการทำเช่นนี้การวิเคราะห์การถดถอยมีแนวโน้มที่จะสร้างความสัมพันธ์ที่เด่นชัดซึ่งจะทำให้นักวิจัยที่มีความรู้สามารถ มองใกล้ ได้มากขึ้น
หรือเป็นที่รู้จักอีกอย่างว่า: การถดถอยสองด้านการวิเคราะห์การถดถอย
ตัวอย่าง: วิธีต่ำสุด เป็น วิธี การทางสถิติสำหรับการ ใช้ข้อมูลตัวอย่าง เพื่อหาค่าของสมการถดถอยที่ประมาณ วิธีการน้อยที่สุดที่เสนอโดยคาร์ลฟรีดริชเกาส์ผู้เกิดในปี พ.ศ. 2320 และเสียชีวิตในปี พ.ศ. 2398 วิธีการที่น้อยที่สุดก็ยังใช้กันอย่างแพร่หลาย
แหล่งที่มา:
Anderson, DR, Sweeney, DJ และ Williams, TA (2003) Essentials of Statistics for Business and Economics (ฉบับที่ 3) Mason, Ohio: Southwestern, Thompson Learning
______ (2010) อธิบาย: การวิเคราะห์การถดถอย ข่าว MIT
McIntyre, L. (1994) การใช้ข้อมูลบุหรี่สำหรับการแนะนำการถดถอยพหุคูณ วารสารสถิติการศึกษา 2 (1)
Mendenhall, W. , และ Sincich, T. (1992) สถิติวิศวกรรมศาสตร์และวิทยาศาสตร์ (3rd เอ็ด), นิวยอร์กนิวยอร์ก: Dellen สำนักพิมพ์ จำกัด
Panchenko, D. 18.443 สถิติสำหรับการใช้งาน, ฤดูใบไม้ร่วง 2006, มาตรา 14, การถดถ้วนเชิงเส้นแบบง่าย (Massachusetts Institute of Technology: MIT OpenCourseWare)