วิธีมองเห็นแบบเบื้องหลังของวิธีสี่เหลี่ยมค่าเฉลี่ยเป็นกระบวนการหาเส้นสุดยอดหรือเส้นสองระดับสำหรับชุดข้อมูลใด ๆ ที่อธิบายด้วยสมการ วิธีนี้ต้องการลดผลรวมของจุดที่เหลือเศษของเส้นโค้งหรือเส้นตรงกับแนวโน้มของผลลัพธ์ที่พบในทางปริมาณวิเคราะห์ วิธีการของการวางเส้นโค้งได้มองเห็นขณะวิเคราะห์สมการเชิงโค้งและสมการเหมาะสมในการได้รับเส้นโค้งคือวิธีสี่เหลี่ยมค่าเฉลี่ย
ในส่วนนี้เราจะพิจารณาเรื่องสี่เหลี่ยมค่าเฉลี่ยอย่างง่ายด้วย คุณหญิงโดลมากล่าวในชั้นเรียนว่า “เด็กที่ใช้เวลามากกว่ากับการบ้านของพวกเขาจะได้เกรดดีขึ้น” นักเรียนคนหนึ่งต้องการประเมินเกรดของเขาสำหรับการใช้เวลา 2.3 ชั่วโมงในการบ้าน ด้วยวิธีการสี่เหลี่ยมค่าเฉลี่ยอย่างง่ายดาย สามารถหาโมเดลทำนายได้อย่างแม่นยำ วิธีนี้ง่ายมากเพราะมีเพียงข้อมูลเบา ๆ และบางครั้งอาจต้องใช้เครื่องคิดเลขเท่านั้น
ในส่วนนี้ เราจะสำรวจเรื่องสี่เหลี่ยมค่าเฉลี่ย ให้เข้าใจว่าหมายถึงอะไร รู้จักสูตรทั่วไป ขั้นตอนใ
นิยามวิธีสี่เหลี่ยมค่าเฉลี่ย
วิธีสี่เหลี่ยมค่าเฉลี่ยเป็นวิธีสถิติที่ใช้หาเส้นสุดยอดหรือเส้นสองระดับในรูปแบบของสมการ เช่น y = mx + b สำหรับข้อมูลที่กำหนดให้ โดยเส้นโค้งของสมการเรียกว่าเส้นสุดยอดการสอดคล้อง วัตถุประสงค์หลักของเราในวิธีนี้คือการลดผลรวมของเศษกำลังสองให้น้อยที่สุด นี่คือเหตุผลที่วิธีนี้เรียกว่าวิธีสี่เหลี่ยมค่าเฉลี่ย วิธีนี้มักใช้ในการหาแนวโน้มของข้อมูลที่เหมาะสมเมื่อผลลัพธ์ที่ดีที่สุดคือการลดผลรวมของเศษกำลังสองซึ่งถือว่าเป็นความต่างระหว่างค่าที่สังเกตเห็นและค่าที่ปรับตัวได้ เศษกำลังสองทั้งหมดช่วยในการหาการเปลี่ยนแปลงของข้อมูลที่สังเกตเห็นได้ เช่น หากมีข้อมูล 4 จุด โดยใช้วิธีนี้เราจะได้กราฟดังต่อไปนี้
ประเภทพื้นฐานของปัญหาสี่เหลี่ยมค่าเฉลี่ย
สองประเภทของปัญหาสี่เหลี่ยมค่าเฉลี่ยที่พื้นฐานคือปัญหาสี่เหลี่ยมค่าเฉลี่ยที่เป็นปกติหรือเชิงเส้นและปัญหาสี่เหลี่ยมค่าเฉลี่ยที่ไม่ใช่เชิงเส
กราฟวิธีสี่เหลี่ยมค่าเฉลี่ย

ดูกราฟด้านล่างนี้ จะเห็นได้ว่าเส้นตรงแสดงความสัมพันธ์ของตัวแปรอิสระและตัวแปรตาม วัตถุประสงค์สุดท้ายของวิธีนี้คือการลดความแตกต่างระหว่างการตอบสนองที่สังเกตเห็นและการตอบสนองที่ทำนายโดยเส้นสุดยอดการสอดคล้อง ผลเศษของการสอดคล้องน้อยแสดงว่าโมเดลพอดีกับข้อมูลมากขึ้น จุดข้อมูลต้องลดน้อยลงโดยการลดเศษเหลือของแต่ละจุดจากเส้นโค้ง การเศษเหลือสามารถแบ่งเป็นเศษเหลือแนวตั้งและเศษเหลือแนวตั้ง การแบ่งแบบแนวตั้งใช้งานมากกว่าในปัญหาโพลินอเมียลและปัญหาไฮเปอร์เพลน ในขณะที่การแบ่งแบบแนวตั้งใช้งานโดยทั่วไปเช่นที่เห็นในภาพด้านล่าง
การลดเศษเหลือแนวตั้ง
การลดเศษเหลือแนวตั้งนั้นคำนวณโดยการหาความแตกต่างระหว่างค่าตัวแปรตามที่สังเกตเห็นและค่าที่จะเป็นไปได้โดยใช้สมการหลาย ๆ ตัวแปร วิธีนี้ใช้กันอย่างแพร่หลายในการปรับโมเดลหลายแบบ
สูตรวิธีสี่เหลี่ยมค่าเฉลี่ย
วิธีสี่เหลี่ยมค่าเฉลี่ยคือเส้นโค้งที่ตอบสนองดีที่สุดกับชุดข้อมูลที่มีผลรวมของเศษกำลังสองหรือข้อผิดพลาดที่น้อยที่สุด ให้เราสมมติว่าจุดข้อมูลที่กำหนดไว้คือ (x1, y1), (x2, y2), (x3, y3), …, (xn, yn) โดยที่ x ทั้งหมดเป็นตัวแปรอิสระ ส่วน y ทั้งหมดเป็นตัวแปรตาม วิธีนี้ใช้สำหรับการหาเส้นตรงเชิงเส้นของรูปแบบ y = mx + b โดยที่ y และ x เป็นตัวแปร m คือความชัน และ b คือจุดตัดแกน y สูตรการคำนวณความชัน m และค่า b คือ:
m = (n∑xy – ∑y∑x)/n∑x2 – (∑x)2
b = (∑y – m∑x)/n
ที่นี่ n คือจำนวนจุดข้อมูล
ต่อไปนี้คือขั้นตอนในการคำนวณสี่เหลี่ยมค่าเฉลี่ยโดยใช้สูตรดังกล่าว
ขั้นตอนที่ 1: วาดตารางที่มี 4 คอลัมน์โดยคอลัมน์ 2 และ 3 ใช้สำหรับจุด x และ y
ขั้นตอนที่ 2: ในคอลัมน์ถัดไป หาค่า xy และ (x)2
ขั้นตอนที่ 3: หาค่า ∑x, ∑y, ∑xy และ ∑(x)2
ขั้นตอนที่ 4: หาค่าความชัน m โดยใช้สูตรดังกล่าว
ขั้นตอนที่ 5: คำนวณค
ตัวอย่าง
สมมติว่าเรามีข้อมูลตามที่แสดงด้านล่างนี้
แล้วเราจะทำตามขั้นตอนเพื่อหาเส้นตรงเชิงเส้น
x | y | xy | x2 |
---|---|---|---|
1 | 2 | 2 | 1 |
2 | 5 | 10 | 4 |
3 | 3 | 9 | 9 |
4 | 8 | 32 | 16 |
5 | 7 | 35 | 25 |
∑x = 15 | ∑y = 25 | ∑xy = 88 | ∑x2 = 55 |
หาค่าความชัน m โดยใช้สูตรดังกล่าว
m = (n∑xy – ∑y∑x)/n∑x2 – (∑x)2
m = [(5×88) – (15×25)]/(5×55) – (15)2
m = (440 – 375)/(275 – 225)
m = 65/50 = 13/10
หาค่า b โดยใช้สูตรดังกล่าว
b = (∑y – m∑x)/n
b = (25 – 1.3×15)/5
b = (25 – 19.5)/5
b = 5.5/5
ดังนั้น สมการของเส้นตรงเชิงเส้นคือ y = mx + b = 13/10x + 5.5/5
วิธีสี่เหลี่ยมค่าเฉลี่ยถูกใช้เพื่อทำนายพฤติกรรมของตัวแปรตามอิสระต่อตัวแปรตาม
การใช้ Ordinary Least Squares สำหรับอะไร
วิธี Ordinary least squares นี้ถูกใช้เพื่อหาโมเดลการทำนายที่เหมาะสมที่สุดกับจุดข้อมูลของเรา
การใช้ Linear Regression กับ Least Squares เหมือนกันหรือไม่
ไม่เหมือนกัน การวิเคราะห์เชิงเส้นแบบเชิงสถิติ (Linear regression) เป็นการวิเคราะห์ข้อมูลทางสถิติเพื่อทำนายค่าของตัวแปรปริมาณได้ ในขณะที่ least squares เป็นหนึ่งในวิธีที่ใช้ในการวิเคราะห์เชิงเส้นแบบเชิงสถิติเพื่อหาโมเดลการทำนาย
อาการ Outlier มีผลต่อเส้นสุดท้ายของ Linear Regression อย่างไร
การมีจุดข้อมูลที่ไม่ปกติ (outliers) สามารถทำให้ผลลัพธ์ของการวิเคราะห์เชิงเส้นแบบเชิงสถิติเกิดความเบียดเบียน ซึ่งทำให้ความถูกต้องของโมเดลเป็นสิ่งสำคัญในการได้รับคำตอบที่เป็นเสียงสำหรับคำถามที่สร้างโมเดลการทำนาย
คุณกำลังดู: วิธีที่น้อยที่สุด – สูตร, คำนิยาม, ตัวอย่าง
สูตร Least Square Method
เพื่อหาสมการของเส้นสุดท้ายสำหรับข้อมูลใด ๆ เราต้องใช้สมการ y = mx + b สูตร least-square method คือการหาค่าของทั้ง m และ b โดยใช้สูตรต่อไปนี้:
m = (n∑xy – ∑y∑x)/n∑x2 – (∑x)2
b = (∑y – m∑x)/n
ที่นี่ n คือจำนวนจุดข้อมูล
วิธี Least Square Method ใน Regression คืออะไร
วิธีการ Least-square regression ช่วยในการคำนวณเส้นตรงที่เหมาะสมที่สุดของชุดข้อมูลจากทั้งระดับกิจกรรมและค่าใช้จ่ายรวมที่สอดคล้องกัน ความคิดเ behind การคำนวณคือการลดค่าผลรวมของความผิดพลาดแนวตั้งระหว่างจุดข้อมูลและฟังก์ชันต้นทุน
ทำไมต้องใช้ Least Square Method
Least square ถูกใช้เป็นการเทียบเท่ากับ Maximum likelihood เมื่อค่าเศษเหลี่ยมระหว่างโมเดลและข้อมูลต่างจากกันมีการกระจายแบบปกติและมีค่าเฉลี่ยเป็น 0
Least Square Curve Fitting คืออะไร
Least square method เป็นกระบวนการที่ใช้สอดคล้องกับข้อมูลที่กำหนดไว้ เป็นหนึ่งในวิธีการใช้เพื่อกำหนดเส้นแนวโน้มสำหรับข้อมูลที่กำหนด