ส่วนเบี่ยงเบนมาตรฐานรวมคืออะไร?
ส่วนเบี่ยงเบนมาตรฐานรวม รวมค่าประมาณความแปรปรวนจากสองกลุ่มขึ้นไปเพื่อให้ได้ค่าประมาณเดียวแบบถ่วงน้ำหนัก เป็นสิ่งจำเป็นสำหรับการทดสอบ t แบบสองตัวอย่างเมื่อสมมติว่าความแปรปรวนเท่ากัน
แนวคิดตรงไปตรงมา: ถ้าเราเชื่อว่าสองกลุ่มมาจากประชากรที่มีความแปรผันพื้นฐานเหมือนกัน เราสามารถรวมข้อมูลเพื่อประมาณค่าความแปรผันที่ใช้ร่วมกันได้ดีขึ้น ข้อมูลมากขึ้นหมายถึงค่าประมาณที่แม่นยำขึ้น
คิดแบบนี้: ถ้าคุณมี 20 ข้อสังเกตจากกลุ่ม A และ 30 จากกลุ่ม B และทั้งสองกลุ่มมีความแปรปรวนจริงเดียวกัน คุณจะมี 50 ข้อสังเกตเพื่อประมาณค่าความแปรปรวนนั้น แทนที่จะประมาณแยกจากตัวอย่างที่เล็กกว่า
เมื่อไหร่ควรรวม
สูตร SD รวม
สำหรับสองกลุ่ม ส่วนเบี่ยงเบนมาตรฐานรวมคือ:
SD รวมสองกลุ่ม
โดยที่ n₁ และ n₂ คือขนาดตัวอย่าง และ s₁ และ s₂ คือส่วนเบี่ยงเบนมาตรฐานของตัวอย่าง
สำหรับ k กลุ่ม (เช่นใน ANOVA) สูตรขยายเป็น:
SD รวมหลายกลุ่ม
สังเกตว่าสูตรใช้เทอม (n-1) ทั้งในตัวเศษและตัวส่วน การถ่วงน้ำหนักนี้ทำให้ตัวอย่างที่ใหญ่กว่ามีส่วนสนับสนุนมากกว่าต่อค่าประมาณรวม ซึ่งเหมาะสมเพราะตัวอย่างที่ใหญ่กว่าให้ค่าประมาณความแปรปรวนที่น่าเชื่อถือมากกว่า
ข้อสมมติพื้นฐาน
ส่วนเบี่ยงเบนมาตรฐานรวมสมมติ ความเป็นเอกพันธ์ของความแปรปรวน ว่าทุกกลุ่มมีความแปรปรวนของประชากรเดียวกัน ข้อสมมตินี้มีความสำคัญมากที่สุดเมื่อ:
- ขนาดตัวอย่างไม่เท่ากัน (มีปัญหามากเป็นพิเศษถ้ากลุ่มที่ใหญ่กว่ามีความแปรปรวนน้อยกว่า)
- อัตราส่วนของความแปรปรวนที่มากที่สุดต่อน้อยที่สุดเกิน 2-3
- ขนาดตัวอย่างเล็ก (ตัวอย่างใหญ่ทนทานต่อการละเมิดมากกว่า)
เมื่อความแปรปรวนไม่เท่ากัน
ตัวอย่างพร้อมวิธีทำ
สถานการณ์: เปรียบเทียบคะแนนสอบระหว่างสองชั้นเรียน:
- ชั้น A: n₁ = 25, ค่าเฉลี่ย = 78, s₁ = 12
- ชั้น B: n₂ = 30, ค่าเฉลี่ย = 82, s₂ = 14
การคำนวณ SD รวม:
sp = √[((25-1)(12)² + (30-1)(14)²) / (25+30-2)] sp = √[(24×144 + 29×196) / 53] sp = √[(3456 + 5684) / 53] sp = √[9140 / 53] = √172.45 = 13.13
SD รวม 13.13 อยู่ระหว่าง SD ของแต่ละกลุ่ม (12 และ 14) โดยถ่วงน้ำหนักไปทางตัวอย่างที่ใหญ่กว่า ค่ารวมนี้จะถูกนำไปใช้ในสูตรการทดสอบ t หรือการคำนวณ Cohen's d
การประยุกต์ใช้ทางสถิติ
- การทดสอบ t ตัวอย่างอิสระ: SD รวมใช้คำนวณความคลาดเคลื่อนมาตรฐานของความแตกต่างระหว่างค่าเฉลี่ย
- ขนาดอิทธิพล Cohen's d: ขนาดอิทธิพลถูกมาตรฐานโดยใช้ SD รวม: d = (M₁ - M₂) / sp
- ANOVA: ค่าเฉลี่ยกำลังสองของความคลาดเคลื่อน (MSE) ใน ANOVA เป็นค่าประมาณความแปรปรวนรวมข้ามทุกกลุ่ม
- การวิเคราะห์อภิมาน: เมื่อรวมงานวิจัย ค่าประมาณรวมช่วยมาตรฐานอิทธิพลข้ามบริบทต่างๆ