Σ
SDCalc
ระดับกลางแนวคิด·8 min

ส่วนเบี่ยงเบนมาตรฐานของตัวอย่าง vs ประชากร: ควรใช้เมื่อไหร่

เรียนรู้ความแตกต่างระหว่างส่วนเบี่ยงเบนมาตรฐานของตัวอย่างและประชากร ทำความเข้าใจการแก้ไขเบสเซล เมื่อไหร่ควรใช้ n-1 เทียบกับ n พร้อมตัวอย่างที่ชัดเจน

ภาพรวม

หนึ่งในคำถามที่พบบ่อยที่สุดในสถิติคือ: “ควรหารด้วย n หรือ n-1?” คำตอบขึ้นอยู่กับว่าคุณทำงานกับประชากรทั้งหมดหรือเพียงตัวอย่าง

ประชากร (N)

ใช้เมื่อคุณมีข้อมูลของ สมาชิกทุกคน ในกลุ่มที่คุณกำลังศึกษา σ = √[Σ(x-μ)² / N]

ตัวอย่าง (n-1)

ใช้เมื่อคุณมีข้อมูลจาก ส่วนย่อย ของประชากรที่ใหญ่กว่า s = √[Σ(x-x̄)² / (n-1)]

ส่วนเบี่ยงเบนมาตรฐานของประชากร (σ)

ส่วนเบี่ยงเบนมาตรฐานของประชากรใช้เมื่อคุณมีค่าจากการวัด สมาชิกทุกคน ในกลุ่มที่คุณกำลังวิเคราะห์ สิ่งนี้ค่อนข้างหายากในทางปฏิบัติ

ตัวอย่างของประชากรที่แท้จริง:

  • พนักงานทั้ง 50 คนในบริษัทขนาดเล็ก
  • นักเรียนทุกคนในชั้นเรียนที่มี 30 คน
  • ธุรกรรมทั้งหมดในปีงบประมาณที่ปิดแล้ว
  • ข้อมูลสำมะโนประชากรครบถ้วนของประเทศ

ส่วนเบี่ยงเบนมาตรฐานของตัวอย่าง (s)

ส่วนเบี่ยงเบนมาตรฐานของตัวอย่างใช้เมื่อคุณทำงานกับ ส่วนย่อยของประชากรที่ใหญ่กว่า นี่เป็นสถานการณ์ที่พบบ่อยกว่าในการวิเคราะห์ในชีวิตจริง

ตัวอย่างของตัวอย่าง:

  • สำรวจผู้มีสิทธิเลือกตั้ง 1,000 คนเพื่อพยากรณ์ผลการเลือกตั้ง
  • ทดสอบผลิตภัณฑ์ 50 ชิ้นจากล็อตการผลิต 10,000 ชิ้น
  • วัดความดันโลหิตของผู้ป่วย 200 คนในการศึกษาทางคลินิก
  • วิเคราะห์ข้อมูลหุ้น 5 ปีเพื่อพยากรณ์ความผันผวนในอนาคต

อธิบายการแก้ไขเบสเซล

การแก้ไขเบสเซล คือเหตุผลที่เราใช้ (n-1) แทน n เมื่อคำนวณส่วนเบี่ยงเบนมาตรฐานของตัวอย่าง ตั้งชื่อตามนักคณิตศาสตร์ชาวเยอรมัน ฟรีดริช เบสเซล การปรับแก้นี้ให้ ค่าประมาณที่ไม่เอนเอียง ของความแปรปรวนของประชากร

ทำไม (n-1) จึงใช้ได้ผล

เมื่อคุณคำนวณค่าเฉลี่ยตัวอย่าง คุณ “ใช้หมด” องศาอิสระหนึ่งหน่วย ค่าเฉลี่ยตัวอย่างจำกัดข้อมูล เมื่อคุณรู้ค่า n-1 ค่าและค่าเฉลี่ยแล้ว ค่าสุดท้ายจะถูกกำหนดไว้ การหารด้วย (n-1) จะแก้ไขการสูญเสียอิสระนี้

สัญชาตญาณทางคณิตศาสตร์

จุดข้อมูลตัวอย่างมีแนวโน้มที่จะรวมกลุ่มอยู่ใกล้ค่าเฉลี่ยตัวอย่างมากกว่าค่าเฉลี่ยประชากรที่แท้จริง สิ่งนี้ทำให้ผลรวมของค่าเบี่ยงเบนกำลังสองน้อยกว่าที่ควรจะเป็นอย่างเป็นระบบ

การหารด้วย (n-1) แทน n จะเพิ่มผลลัพธ์เล็กน้อย ชดเชยการประมาณค่าต่ำเกินไปนี้ และให้ค่าประมาณที่ไม่เอนเอียง

ควรใช้เมื่อไหร่

สถานการณ์ใช้หารด้วย
คุณมีจุดข้อมูลทั้งหมดที่มีอยู่SD ประชากร (σ)N
คุณกำลังอธิบายเฉพาะข้อมูลที่คุณมีSD ประชากร (σ)N
คุณกำลังประมาณค่าสำหรับประชากรที่ใหญ่กว่าSD ตัวอย่าง (s)n-1
คุณจะใช้ SD สำหรับสถิติอนุมานSD ตัวอย่าง (s)n-1

กฎทั่วไป

เมื่อไม่แน่ใจ ให้ใช้ส่วนเบี่ยงเบนมาตรฐานของตัวอย่าง (n-1) จะปลอดภัยกว่าเพราะ: - ข้อมูลในชีวิตจริงส่วนใหญ่มาจากตัวอย่าง ไม่ใช่ประชากรครบถ้วน - การใช้ n-1 กับประชากรที่แท้จริงจะประมาณค่าสูงไปเล็กน้อย (ปลอดภัยกว่าการประมาณค่าต่ำ) - สำหรับ n ขนาดใหญ่ ความแตกต่างจะน้อยมากอยู่แล้ว

ตัวอย่างเชิงปฏิบัติ

ตัวอย่าง: การควบคุมคุณภาพ

โรงงานผลิตวิดเจ็ต 10,000 ชิ้นต่อวัน ฝ่ายควบคุมคุณภาพทดสอบวิดเจ็ต 100 ชิ้นและพบว่าน้ำหนักมีค่าเฉลี่ย 50 กรัม คำตอบ: ใช้ SD ตัวอย่าง (n-1) เพราะวิดเจ็ต 100 ชิ้นเป็นตัวอย่างของ 10,000 ชิ้นที่ผลิต คุณใช้ตัวอย่างนี้เพื่อประมาณความแปรผันของวิดเจ็ตทั้งหมด

ตัวอย่าง: เกรดในชั้นเรียน

ครูต้องการอธิบายความแปรผันของคะแนนสอบสำหรับชั้นเรียนที่มีนักเรียน 25 คน เธอไม่ได้พยายามสรุปไปยังชั้นเรียนอื่น คำตอบ: ใช้ SD ประชากร (N) เพราะเธอมีคะแนนของทั้งชั้นเรียน (ประชากรที่สนใจของเธอ) และไม่ได้อนุมานเกี่ยวกับกลุ่มอื่น