Giới thiệu
Sai số chuẩn (SE) và Độ lệch chuẩn (SD) đều là các đại lượng đo độ phân tán, nhưng chúng trả lời những câu hỏi hoàn toàn khác nhau. Nhầm lẫn giữa chúng là một trong những sai lầm phổ biến nhất trong thống kê.
Nhầm lẫn thường gặp
Nhiều người dùng SD khi nên dùng SE, đặc biệt khi báo cáo độ chính xác của trung bình mẫu. Điều này có thể dẫn đến kết luận sai về ý nghĩa thống kê.
Sự khác biệt chính
Độ lệch chuẩn
Đo độ phân tán của các điểm dữ liệu riêng lẻ quanh trung bình.
“Các giá trị riêng lẻ biến thiên bao nhiêu?”
Sai số chuẩn
Đo độ chính xác của trung bình mẫu như một ước lượng cho trung bình tổng thể.
“Trung bình mẫu của chúng ta chính xác đến đâu?”
Công thức sai số chuẩn
Sai số chuẩn của trung bình
SE = s / √n
Trong đó s là độ lệch chuẩn mẫu và n là kích thước mẫu.
Ví dụ tính toán
Mẫu 25 học sinh có điểm trung bình = 75, SD = 10
- Độ lệch chuẩn (s) = 10 điểm
- Kích thước mẫu (n) = 25
- Sai số chuẩn = 10 / √25 = 10 / 5 = 2 điểm
Diễn giải: Trung bình mẫu 75 có độ không chắc chắn khoảng ±2 điểm.
Khi nào sử dụng mỗi loại
- Dùng Độ lệch chuẩn khi:Mô tả biến thiên của các quan sát riêng lẻ, đặc trưng cho tổng thể hoặc mẫu, thiết lập khoảng bình thường (ví dụ: khoảng tham chiếu lâm sàng), hoặc kiểm soát chất lượng (biến thiên chấp nhận được trong sản xuất)
- Dùng Sai số chuẩn khi:Báo cáo độ chính xác của thống kê mẫu, xây dựng khoảng tin cậy, so sánh trung bình giữa các nhóm, hoặc kiểm định giả thuyết
Ảnh hưởng của kích thước mẫu
Sự khác biệt quan trọng: SD gần như không đổi khi kích thước mẫu tăng, nhưng SE giảm với mẫu lớn hơn.
| Kích thước mẫu (n) | SD | SE = SD/√n |
|---|---|---|
| 25 | 10 | 2,00 |
| 100 | 10 | 1,00 |
| 400 | 10 | 0,50 |
| 10.000 | 10 | 0,10 |
Thông tin quan trọng
Để giảm một nửa sai số chuẩn, bạn cần tăng gấp bốn kích thước mẫu. Đây là lý do tại sao các ước lượng rất chính xác đòi hỏi mẫu lớn.