ความแปรปรวนเป็นตัวชี้วัดที่ใช้วัดระดับความกระจายตัวของชุดข้อมูล มันบ่งชี้ถึงการกระจายตัวของข้อมูลว่าแตกต่างกันอย่างไร ซึ่งมีประโยชน์ในการใช้สร้างตัวอย่างทางสถิติ เนื่องจากความแปรปรวนต่ำเป็นสัญญาณว่าข้อมูลอาจถูกบีบอัดมากเกินไปจนไม่สามารถทำนายผลได้[1] สามารถคำนวณความแปรปรวนได้ดังนี้:
- คำนวณค่าเฉลี่ยของชุดข้อมูล ซึ่งเป็นผลรวมของค่าในชุดข้อมูลหารด้วยจำนวนของข้อมูลทั้งหมด
- หาความแตกต่างของแต่ละค่าในชุดข้อมูลจากค่าเฉลี่ยที่คำนวณได้ในข้อ 1 และยกกำลังสองของความแตกต่างนี้
- นำผลคำนวณในข้อ 2 มาบวกกันทั้งหมด และหารด้วยจำนวนของข้อมูลทั้งหมด
สามารถใช้สูตรดังนี้เพื่อคำนวณความแปรปรวนของชุดข้อมูล:
ความแปรปรวน = (Σ(ค่าข้อมูล – ค่าเฉลี่ย)²) / จำนวนข้อมูลทั้งหมด
เมื่อได้ค่าความแปรปรวนแล้ว สามารถใช้ข้อมูลนี้เพื่อวิเคราะห์ระดับความกระจายตัวของชุดข้อมูลและปรับปรุงหรือประเมินค่าทางสถิติอื่น ๆ ตามที่เหมาะสมในการใช้งาน

คุณกำลังดู: วิธีการ คำนวณความแปรปรวน
การวิเคราะห์และการนับถือกฎหมายของข้อมูลตัวอย่าง
การเข้าถึงและการวิเคราะห์ข้อมูลตัวอย่าง
ในการวิเคราะห์ข้อมูลทางสถิติ, นักวิเคราะห์ส่วนใหญ่จะเข้าถึงข้อมูลตัวอย่าง ซึ่งเป็นกลุ่มตัวอย่างที่สุ่มมาจากจำนวนประชากรทั้งหมดที่ต้องการศึกษา (Sukal, 2021)
ตัวอย่างเช่น ถ้าเราต้องการวิเคราะห์ราคาของรถยนต์ในประเทศเยอรมนี นักวิเคราะห์สถิติอาจเลือกสุ่มราคาจากกลุ่มรถยนต์ไม่กี่พันคันเพื่อคาดการณ์ราคาของรถยนต์ในประเทศเยอรมนี (Sukal, 2021)
อย่างไรก็ตาม การวิเคราะห์ข้อมูลตัวอย่างไม่ใช่ตัวเลขแท้ๆ เนื่องจากมันไม่สามารถแทนจำนวนประชากรทั้งหมดได้อย่างแม่นยำ แต่สามารถใช้เพื่อคาดการณ์และประมาณค่าแบบสถิติได้ (Sukal, 2021)
การคำนวณความแปรปรวน
ความแปรปรวนเป็นตัวบ่งชี้ว่าข้อมูลในกลุ่มตัวอย่างมีการกระจายตัวอย่างไร ค่าความแปรปรวนที่มากก็แสดงว่าข้อมูลมีการกระจายตัวอย่างไกล่เกลี่ยมากขึ้น และค่าความแปรปรวนที่น้อยก็แสดงว่าข้อมูลมีการกระจายตัวอย่างใกล้เคียงกันมากขึ้น (Dew
คำนวณหาค่าเฉลี่ยของกลุ่มตัวอย่าง
หากคุณต้องการหาค่าเฉลี่ยของกลุ่มตัวอย่าง คุณสามารถใช้สัญลักษณ์ x̅ หรือ “x-bar” ซึ่งหมายถึงค่าเฉลี่ยของกลุ่มตัวอย่าง โดยการคำนวณเหมือนกับการหาค่าเฉลี่ยใดๆ โดยการบวกค่าทั้งหมดของจุดข้อมูลเข้าด้วยกัน แล้วหารด้วยจำนวนสมาชิกของข้อมูลนั้น
ตัวอย่าง
เพื่อให้เข้าใจง่ายขึ้น สมมติว่าเรามีกลุ่มตัวอย่าง 6 จุดข้อมูลดังนี้ 17, 15, 23, 7, 9, และ 13 จะได้ว่า
17 + 15 + 23 + 7 + 9 + 13 = 84
จากนั้นหารคำตอบที่ได้ด้วยจำนวนสมาชิกของข้อมูล ในกรณีนี้คือหก:
84 ÷ 6 = 14
ดังนั้น ค่าเฉลี่ยของกลุ่มตัวอย่างคือ x̅ = 14
คุณอาจมองว่าค่าเฉลี่ยเป็นเหมือน “จุดกึ่งกลาง” ของข้อมูล หากกลุ่มข้อมูลจับกลุ่มรวมตัวใกล้ค่าเฉลี่ย ความแปรปรวนก็จะต่ำ หากมันกระจายห่างออกจากค่าเฉลี่ย ก็แสดงว่าความแปรปรวนสูง
ลบค่าเฉลี่ยออกจากจุดข้อมูลแต่ละตัว
ต่อมา เราสามารถหาค่าเบี่ยงเบนจากค่าเฉลี่ยโดยการลบค่าเฉลี่ยออกจากจุดข้อมูลแต่ละตั
การคำนวณค่าเบี่ยงเบนเฉลี่ยและค่าเบี่ยงเบนที่แก้ปัญหาการบวกลบ
ค่าเบี่ยงเบนเฉลี่ย
เมื่อต้องการหาว่าข้อมูลมีการกระจายตัวเช่นไร ทำได้โดยการคำนวณค่าเบี่ยงเบนเฉลี่ย (standard deviation) ซึ่งคือการหาค่าระยะห่างของข้อมูลจากค่าเฉลี่ย แต่โดยปกติแล้วเราจะไม่สามารถนำค่าเบี่ยงเบนแบบตรงๆ มาใช้ได้ เนื่องจากค่าเบี่ยงเบนของข้อมูลจะบอกถึงความแตกต่างของข้อมูลแต่ไม่สามารถบอกได้ว่าข้อมูลมีการกระจายตัวอย่างไร โดยตัวเบี่ยงเบนที่นำมาใช้ต้องผ่านการยกกำลังสองก่อนจึงนำมาคำนวณ จึงจะได้ผลรวมที่ไม่ติดลบ
การแก้ปัญหาการบวกลบ
เมื่อนำค่าเบี่ยงเบนแต่ละตัวมาบวกกัน จะพบว่าค่าบวกและลบจะได้ไม่หักลบกันเองจนกลายเป็นศูนย์ แต่การนำค่าเบี่ยงเบนแต่ละตัวมายกกำลังสองก่อนจะทำให้ได้ผลรวมที่ไม่ติดลบ ดังนั้น ในการคำนวณค่าเบี่ยงเบนจะต้องนำค่าทุกตัวมายกกำลังสองก่อนจึงจะนำไปคำนวณต่อ และการหาผลรวมของค่าที่ถูกยกกำลังสองก็สามารถทำได้โดยการใช้สูตร: ∑[( – x̅)] ตัวซิกม่าพิมพ์ใหญ่ ∑ คือผลรวมค่าของพจน์ต่
ทำความเข้าใจเกี่ยวกับความแปรปรวนและส่วนเบี่ยงเบนมาตรฐาน
ความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานเป็นมาตรการทางสถิติที่สำคัญซึ่งใช้เพื่ออธิบายการแพร่กระจายหรือการกระจายตัวของชุดข้อมูล ความแปรปรวนถูกกำหนดให้เป็นค่าเฉลี่ยของผลต่างกำลังสองจากค่าเฉลี่ย ในขณะที่ค่าเบี่ยงเบนมาตรฐานคือรากที่สองของความแปรปรวน
การคำนวณความแปรปรวน
ในการคำนวณความแปรปรวนของชุดข้อมูล คุณสามารถใช้สูตร:
s2 = ∑(x – x̄)2 / (n – 1)
โดยที่ x คือค่าของแต่ละจุดข้อมูล x̄ คือค่าเฉลี่ยของชุดข้อมูล และ n คือจำนวนของจุดข้อมูลในชุดข้อมูล โปรดทราบว่าเราหารด้วย n – 1 แทน n เมื่อคำนวณความแปรปรวนตัวอย่าง สิ่งนี้เรียกว่าการแก้ไขของ Bessel และใช้เพื่ออธิบายความจริงที่ว่ากลุ่มตัวอย่างมีแนวโน้มที่จะประเมินค่าความแปรปรวนที่แท้จริงของประชากรต่ำเกินไป
ตัวอย่างเช่น หากคุณมีชุดข้อมูลที่มีจุดข้อมูล 6 จุด คุณจะคำนวณความแปรปรวนได้ดังนี้:
s2 = [(x1 – x̄)2 + (x2 – x̄)2 + (x3 – x̄)2 + (x4 – x̄)2 + (x5 – x̄)2 + (x6 – x̄)2 ] / (6 – 1 )
การคำนวณส่วนเบี่ยงเบนมาตรฐาน
ในการคำนวณค่าเบี่ยงเบนมาตรฐาน คุณเพียงแค่หารากที่สองของความแปรปรวน:
s = √s2
ใช้ตัวอย่างเดียวกับด้านบน ส่วนเบี่ยงเบนมาตรฐานจะเป็น:
s = √s2 = √33.2 = 5.76
บทสรุป
การทำความเข้าใจเกี่ยวกับความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานมีความสำคัญต่อการวิเคราะห์และตีความข้อมูล เมื่อต้องจัดการกับตัวอย่างประชากรจำนวนมาก สิ่งสำคัญคือต้องใช้การแก้ไขของ Bessel เพื่อคำนวณความแปรปรวนของตัวอย่าง ค่าเบี่ยงเบนมาตรฐานเป็นตัววัดที่มีประโยชน์สำหรับการแพร่กระจายของชุดข้อมูล และมักใช้ในการวิเคราะห์และการสร้างแบบจำลองทางสถิติ
การทำความเข้าใจข้อมูลประชากร: การคำนวณความแปรปรวนและค่าเฉลี่ย
การแนะนำ
ข้อมูลประชากรหมายถึงจำนวนบุคคลทั้งหมดในกลุ่มที่มีลักษณะร่วมกัน อาจเป็นกลุ่มคน สัตว์ หรือสิ่งของก็ได้ ตัวอย่างเช่น หากคุณกำลังศึกษาอายุของผู้อยู่อาศัยในเท็กซัส ประชากรจะเป็นผลรวมของอายุของผู้อยู่อาศัยทั้งหมดในเท็กซัส บทความนี้จะอธิบายวิธีการคำนวณความแปรปรวนและค่าเฉลี่ยของข้อมูลประชากร
ความแปรปรวนของประชากร
ในการวัดระดับความแปรปรวนของข้อมูลประชากร นักสถิติใช้สูตรที่เรียกว่าความแปรปรวนของประชากร สูตรความแปรปรวนถูกกำหนดเป็น:
σ² = (∑(x – μ)²) / n
ที่ไหน:
σ² = ความแปรปรวนของประชากร
μ = ค่าเฉลี่ยของประชากร
n = จำนวนสมาชิกในประชากร
∑ = เครื่องหมายผลรวม
x = จุดข้อมูลแต่ละจุด
เครื่องหมายผลรวม (∑) ใช้เพื่อเพิ่มค่าทั้งหมดของ (x – μ)² สำหรับแต่ละจุดข้อมูลในประชากร การลบค่าเฉลี่ยออกจากจุดข้อมูลแต่ละจุดและยกกำลังสองผลลัพธ์จะทำให้แน่ใจได้ว่าค่าทั้งหมดเป็นค่าบวก
ตัวอย่างการคำนวณ
สมมติว่าเรามีตู้ปลาหกตู้ในการจัดแสดงพิพิธภัณฑ์ โดยมีประชากรปลาดังต่อไปนี้:
ถัง 1: 10 ปลา
ถัง 2: 15 ปลา
ถัง 3: 8 ปลา
ถัง 4: 12 ปลา
ถัง 5: 11 ปลา
ถัง 6: 9 ปลา
ในการคำนวณความแปรปรวนของประชากร เราต้องหาค่าเฉลี่ยของประชากรก่อน
μ = (10 + 15 + 8 + 12 + 11 + 9) / 6
ไมโคร = 11
ตอนนี้เราสามารถคำนวณความแปรปรวนของประชากรได้:
σ² = ((10-11)² + (15-11)² + (8-11)² + (12-11)² + (11-11)² + (9-11)²) / 6
σ² = 4.33
ดังนั้นความแปรปรวนของประชากรสำหรับตู้ปลาคือ 4.33
ค่าเฉลี่ยของประชากร
ค่าเฉลี่ยประชากรหรือที่เรียกว่าค่าเฉลี่ยเป็นการวัดแนวโน้มเข้าสู่ส่วนกลาง มันแสดงผลรวมของจุดข้อมูลทั้งหมดในประชากรหารด้วยจำนวนสมาชิกในประชากร สูตรสำหรับค่าเฉลี่ยของประชากรกำหนดเป็น:
μ = (∑x) / n
ที่ไหน:
μ = ค่าเฉลี่ยประชากร
∑ = เครื่องหมายผลรวม
x = จุดข้อมูลแต่ละจุด
n = จำนวนสมาชิกในประชากร
ตัวอย่างการคำนวณ
จากตัวอย่างเดียวกันของตู้ปลา เราสามารถคำนวณค่าเฉลี่ยประชากรได้ดังนี้:
μ = (10 + 15 + 8 + 12 + 11 + 9) / 6
ไมโคร = 11
ดังนั้นค่าเฉลี่ยประชากรสำหรับตู้ปลาคือ 11
บทสรุป
โดยสรุป ข้อมูลประชากรหมายถึงจำนวนบุคคลทั้งหมดในกลุ่มที่มีลักษณะร่วมกัน สูตรความแปรปรวนจะวัดระดับความแปรผันของข้อมูลประชากร ในขณะที่สูตรค่าเฉลี่ยจะคำนวณแนวโน้มเข้าสู่ส่วนกลางของข้อมูลประชากร เมื่อเข้าใจวิธีการคำนวณความแปรปรวนและค่าเฉลี่ย นักสถิติสามารถได้รับข้อมูลเชิงลึกที่มีค่าจากข้อมูลประชากร
การคำนวณค่าเฉลี่ยและการวัดการกระจายข้อมูล
การคำนวณค่าเฉลี่ย
เพื่อหาค่าเฉลี่ยของชุดข้อมูล จะต้องนำผลรวมของข้อมูลทั้งหมดหารด้วยจำนวนข้อมูลทั้งหมด สูตรสำหรับการคำนวณค่าเฉลี่ย (Mean) คือ:
Mean (ค่าเฉลี่ย) = ผลรวมของข้อมูล / จำนวนข้อมูลทั้งหมด
เช่น หากเรามีชุดข้อมูลดังต่อไปนี้: 2, 4, 6, 8, 10 แล้วต้องการหาค่าเฉลี่ยของข้อมูลดังกล่าว
Mean = (2 + 4 + 6 + 8 + 10) / 5 = 6
ดังนั้น ค่าเฉลี่ยของชุดข้อมูลดังกล่าวคือ 6
การวัดการกระจายข้อมูล
หลังจากที่ได้หาค่าเฉลี่ยของชุดข้อมูลแล้ว เราสามารถวัดการกระจายของข้อมูลได้โดยการหาค่าต่างของแต่ละจุดข้อมูลจากค่าเฉลี่ย การวัดการกระจายข้อมูลสามารถใช้สูตรสำหรับคำนวณค่าความแปรปรวน (Variance) และสูตรสำหรับคำนวณค่าส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation) ได้ สูตรสำหรับคำนวณค่าความแปรปรวนและค่าส่วนเบี่ยงเบนมาตรฐาน ตามลำดับ คือ:
Variance (ความแปรปรวน) = (Σ(xi – μ)²) / n
Standard Deviation (ส่วนเบี่ยงเบนมาตรฐาน) = √(Variance)
โดยที่:
- xi = จุดข้อมูลที่ i
- μ = ค่าเฉลี่ยของข้อมูล
- n = จำ
หาค่าเฉลี่ยและความแปรปรวนของชุดข้อมูล
หาค่าเฉลี่ย
การหาค่าเฉลี่ยของชุดข้อมูลนั้นเป็นวิธีการที่นิยมใช้งานกันอย่างแพร่หลาย เพื่อแสดงถึงค่ากลางของชุดข้อมูล ซึ่งสามารถหาได้โดยการบวกค่าทุกตัวในชุดข้อมูลด้วยกันแล้วหารด้วยจำนวนของตัวแปรทั้งหมดในชุดข้อมูล
สูตรสำหรับการหาค่าเฉลี่ย: μ = (∑x) / n
เมื่อ
- μ คือค่าเฉลี่ย
- x คือค่าของตัวแปรในชุดข้อมูล
- n คือจำนวนตัวแปรทั้งหมดในชุดข้อมูล
ตัวอย่าง
สมมติว่าเรามีชุดข้อมูลดังนี้: 15, 18, 21, 24, 27
จะได้ค่าเฉลี่ยของชุดข้อมูลนี้โดยการหาผลรวมของค่าทุกตัวแล้วหารด้วยจำนวนตัวแปรทั้งหมดในชุดข้อมูลμ = (15 + 18 + 21 + 24 + 27) / 5 = 21
ดังนั้นค่าเฉลี่ยของชุดข้อมูลนี้คือ 21
หาความแปรปรวน
การหาความแปรปรวนของชุดข้อมูลนั้นใช้เพื่อวัดความแตกต่างของข้อมูลจากค่าเฉลี่ย โดยใช้สูตรการหาความแปรปรวนดังนี้:σ² = (∑(x-μ)²) / n
เมื่อ
- σ² คือความแปรปรวน
- x คือค่าของตัวแปรในชุดข้อมูล
ที่มาของข้อมูล: [1] https://en.wikipedia.org/wiki/Variance_(statistics)