Σ
SDCalc
Trung cấpKhái niệm·8 min

Độ lệch chuẩn Mẫu và Tổng thể: Khi nào sử dụng loại nào

Tìm hiểu sự khác biệt giữa độ lệch chuẩn mẫu và tổng thể. Hiểu hiệu chỉnh Bessel, khi nào dùng n-1 so với n, kèm ví dụ rõ ràng.

Tổng quan

Một trong những câu hỏi phổ biến nhất trong thống kê là: “Tôi nên chia cho n hay n-1?” Câu trả lời phụ thuộc vào việc bạn đang làm việc với toàn bộ tổng thể hay chỉ một mẫu.

Tổng thể (N)

Sử dụng khi bạn có dữ liệu của mọi thành viên trong nhóm bạn đang nghiên cứu. σ = √[Σ(x-μ)² / N]

Mẫu (n-1)

Sử dụng khi bạn có dữ liệu từ một tập con của tổng thể lớn hơn. s = √[Σ(x-x̄)² / (n-1)]

Độ lệch chuẩn tổng thể (σ)

Độ lệch chuẩn tổng thể được sử dụng khi bạn có phép đo từ mọi thành viên của nhóm bạn đang phân tích. Điều này tương đối hiếm trong thực tế.

Ví dụ về tổng thể thực sự:

  • Tất cả 50 nhân viên trong một công ty nhỏ
  • Mọi học sinh trong một lớp cụ thể gồm 30 người
  • Tất cả giao dịch trong một năm tài chính đã đóng
  • Dữ liệu tổng điều tra dân số hoàn chỉnh của một quốc gia

Độ lệch chuẩn mẫu (s)

Độ lệch chuẩn mẫu được sử dụng khi bạn đang làm việc với một tập con của tổng thể lớn hơn. Đây là trường hợp phổ biến hơn trong phân tích thực tế.

Ví dụ về mẫu:

  • Khảo sát 1.000 cử tri để dự đoán kết quả bầu cử
  • Kiểm tra 50 sản phẩm từ một lô sản xuất 10.000
  • Đo huyết áp của 200 bệnh nhân trong một nghiên cứu lâm sàng
  • Phân tích 5 năm dữ liệu cổ phiếu để dự đoán biến động tương lai

Giải thích hiệu chỉnh Bessel

Hiệu chỉnh Bessel là lý do tại sao chúng ta dùng (n-1) thay vì n khi tính độ lệch chuẩn mẫu. Được đặt theo tên nhà toán học người Đức Friedrich Bessel, điều chỉnh này tạo ra ước lượng không chệch cho phương sai tổng thể.

Tại sao (n-1) hoạt động

Khi bạn tính trung bình mẫu, bạn “sử dụng hết” một bậc tự do. Trung bình mẫu ràng buộc dữ liệu—khi bạn biết n-1 giá trị và trung bình, giá trị cuối cùng đã được xác định. Chia cho (n-1) hiệu chỉnh cho sự mất mát bậc tự do này.

Trực giác toán học

Các điểm dữ liệu mẫu có xu hướng tập trung gần trung bình mẫu hơn so với trung bình tổng thể thực. Điều này khiến tổng bình phương độ lệch nhỏ hơn một cách có hệ thống so với giá trị thực.

Chia cho (n-1) thay vì n làm tăng kết quả một chút, bù đắp cho sự đánh giá thấp này và tạo ra ước lượng không chệch.

Khi nào sử dụng loại nào

Tình huốngSử dụngChia cho
Bạn có tất cả điểm dữ liệu tồn tạiSD tổng thể (σ)N
Bạn chỉ mô tả dữ liệu hiện cóSD tổng thể (σ)N
Bạn ước lượng cho tổng thể lớn hơnSD mẫu (s)n-1
Bạn sẽ dùng SD cho thống kê suy luậnSD mẫu (s)n-1

Nguyên tắc chung

Khi không chắc chắn, hãy dùng độ lệch chuẩn mẫu (n-1). Điều này an toàn hơn vì: - Hầu hết dữ liệu thực tế là từ mẫu, không phải tổng thể hoàn chỉnh - Dùng n-1 trên tổng thể thực sẽ hơi đánh giá cao (an toàn hơn đánh giá thấp) - Với n lớn, sự khác biệt không đáng kể

Ví dụ thực tế

Ví dụ: Kiểm soát chất lượng

Một nhà máy sản xuất 10.000 sản phẩm mỗi ngày. Bộ phận kiểm soát chất lượng kiểm tra 100 sản phẩm và thấy trọng lượng trung bình là 50g. Đáp án: Sử dụng SD mẫu (n-1) vì 100 sản phẩm là mẫu của 10.000 sản phẩm được sản xuất. Bạn sử dụng mẫu này để ước lượng biến thiên của tất cả sản phẩm.

Ví dụ: Điểm lớp học

Một giáo viên muốn mô tả biến thiên điểm thi của lớp 25 học sinh. Cô ấy không cố khái quát hóa cho các lớp khác. Đáp án: Sử dụng SD tổng thể (N) vì cô ấy có điểm của toàn bộ lớp (tổng thể quan tâm) và không suy luận về các nhóm khác.