Phân phối chuẩn là gì?
Phân phối chuẩn, còn gọi là phân phối Gauss hay “đường cong hình chuông”, là phân phối xác suất quan trọng nhất trong thống kê. Nó mô tả cách các giá trị dữ liệu phân bố quanh giá trị trung bình.
The Classic Bell Curve
Phân phối chuẩn được xác định hoàn toàn chỉ bởi hai tham số: trung bình (μ) xác định tâm, và độ lệch chuẩn (σ) xác định mức độ phân tán.
Các tính chất chính
Đối xứng
Trung bình = Trung vị = Yếu vị
Tiệm cận
Tổng diện tích = 1
Độ lệch chuẩn ảnh hưởng đến hình dạng như thế nào
Độ lệch chuẩn kiểm soát mức “phân tán” của phân phối chuẩn. σ nhỏ hơn tạo ra đường cong cao, hẹp; σ lớn hơn tạo ra đường cong thấp, rộng.
Visual Comparison
Low SD (σ = 0.5)
Data clustered tightly around the mean
High SD (σ = 2)
Data spread widely from the mean
Điểm Z và chuẩn hóa
Điểm Z cho bạn biết một giá trị cách trung bình bao nhiêu độ lệch chuẩn. Điều này cho phép bạn so sánh các giá trị từ các phân phối chuẩn khác nhau.
Công thức điểm Z
| Điểm Z | Ý nghĩa | Phân vị |
|---|---|---|
| -2 | Thấp hơn 2 SD so với trung bình | ~2,3% |
| -1 | Thấp hơn 1 SD so với trung bình | ~15,9% |
| 0 | Tại trung bình | 50% |
| +1 | Cao hơn 1 SD so với trung bình | ~84,1% |
| +2 | Cao hơn 2 SD so với trung bình | ~97,7% |
Ví dụ thực tế
Nhiều hiện tượng tự nhiên tuân theo phân phối chuẩn:
- Chiều cao con người:Hầu hết mọi người có chiều cao gần trung bình, ít người rất cao hoặc rất thấp
- Điểm IQ:Được thiết kế để tuân theo phân phối chuẩn với trung bình 100 và SD 15
- Sai số đo lường:Sai số ngẫu nhiên trong các phép đo khoa học
- Huyết áp:Chỉ số huyết áp trong dân số
Khi dữ liệu không phân phối chuẩn
Không phải tất cả dữ liệu đều tuân theo phân phối chuẩn. Hãy cẩn thận với:
Các phân phối không chuẩn