Tổng quan
Một trong những câu hỏi phổ biến nhất trong thống kê là: “Tôi nên chia cho n hay n-1?” Câu trả lời phụ thuộc vào việc bạn đang làm việc với toàn bộ tổng thể hay chỉ một mẫu.
Tổng thể (N)
Mẫu (n-1)
Độ lệch chuẩn tổng thể (σ)
Độ lệch chuẩn tổng thể được sử dụng khi bạn có phép đo từ mọi thành viên của nhóm bạn đang phân tích. Điều này tương đối hiếm trong thực tế.
Ví dụ về tổng thể thực sự:
- Tất cả 50 nhân viên trong một công ty nhỏ
- Mọi học sinh trong một lớp cụ thể gồm 30 người
- Tất cả giao dịch trong một năm tài chính đã đóng
- Dữ liệu tổng điều tra dân số hoàn chỉnh của một quốc gia
Độ lệch chuẩn mẫu (s)
Độ lệch chuẩn mẫu được sử dụng khi bạn đang làm việc với một tập con của tổng thể lớn hơn. Đây là trường hợp phổ biến hơn trong phân tích thực tế.
Ví dụ về mẫu:
- Khảo sát 1.000 cử tri để dự đoán kết quả bầu cử
- Kiểm tra 50 sản phẩm từ một lô sản xuất 10.000
- Đo huyết áp của 200 bệnh nhân trong một nghiên cứu lâm sàng
- Phân tích 5 năm dữ liệu cổ phiếu để dự đoán biến động tương lai
Giải thích hiệu chỉnh Bessel
Hiệu chỉnh Bessel là lý do tại sao chúng ta dùng (n-1) thay vì n khi tính độ lệch chuẩn mẫu. Được đặt theo tên nhà toán học người Đức Friedrich Bessel, điều chỉnh này tạo ra ước lượng không chệch cho phương sai tổng thể.
Tại sao (n-1) hoạt động
Trực giác toán học
Các điểm dữ liệu mẫu có xu hướng tập trung gần trung bình mẫu hơn so với trung bình tổng thể thực. Điều này khiến tổng bình phương độ lệch nhỏ hơn một cách có hệ thống so với giá trị thực.
Chia cho (n-1) thay vì n làm tăng kết quả một chút, bù đắp cho sự đánh giá thấp này và tạo ra ước lượng không chệch.
Khi nào sử dụng loại nào
| Tình huống | Sử dụng | Chia cho |
|---|---|---|
| Bạn có tất cả điểm dữ liệu tồn tại | SD tổng thể (σ) | N |
| Bạn chỉ mô tả dữ liệu hiện có | SD tổng thể (σ) | N |
| Bạn ước lượng cho tổng thể lớn hơn | SD mẫu (s) | n-1 |
| Bạn sẽ dùng SD cho thống kê suy luận | SD mẫu (s) | n-1 |
Nguyên tắc chung