Σ
SDCalc
Trung cấpLý thuyết·10 min

Hiểu về Phân phối chuẩn và Đường cong hình chuông

Tìm hiểu về phân phối chuẩn, hình dạng đường cong chuông, cách độ lệch chuẩn ảnh hưởng đến nó và tại sao nó là nền tảng của thống kê. Với hình ảnh trực quan tương tác.

Phân phối chuẩn là gì?

Phân phối chuẩn, còn gọi là phân phối Gauss hay “đường cong hình chuông”, là phân phối xác suất quan trọng nhất trong thống kê. Nó mô tả cách các giá trị dữ liệu phân bố quanh giá trị trung bình.

The Classic Bell Curve

Phân phối chuẩn được xác định hoàn toàn chỉ bởi hai tham số: trung bình (μ) xác định tâm, và độ lệch chuẩn (σ) xác định mức độ phân tán.

Các tính chất chính

Đối xứng

Phân phối đối xứng hoàn hảo quanh trung bình. Hai nửa trái và phải là hình ảnh phản chiếu của nhau.

Trung bình = Trung vị = Yếu vị

Trong phân phối chuẩn, cả ba đại lượng đo xu hướng trung tâm đều bằng nhau và nằm ở tâm.

Tiệm cận

Các đuôi kéo dài vô hạn nhưng không bao giờ chạm trục x. Các giá trị cực đoan có thể xảy ra nhưng ngày càng hiếm.

Tổng diện tích = 1

Tổng diện tích dưới đường cong bằng 1 (hoặc 100%), đại diện cho tất cả các kết quả có thể.

Độ lệch chuẩn ảnh hưởng đến hình dạng như thế nào

Độ lệch chuẩn kiểm soát mức “phân tán” của phân phối chuẩn. σ nhỏ hơn tạo ra đường cong cao, hẹp; σ lớn hơn tạo ra đường cong thấp, rộng.

Visual Comparison

Low SD (σ = 0.5)

Data clustered tightly around the mean

High SD (σ = 2)

Data spread widely from the mean

Điểm Z và chuẩn hóa

Điểm Z cho bạn biết một giá trị cách trung bình bao nhiêu độ lệch chuẩn. Điều này cho phép bạn so sánh các giá trị từ các phân phối chuẩn khác nhau.

Công thức điểm Z

z = (x - μ) / σ
Điểm ZÝ nghĩaPhân vị
-2Thấp hơn 2 SD so với trung bình~2,3%
-1Thấp hơn 1 SD so với trung bình~15,9%
0Tại trung bình50%
+1Cao hơn 1 SD so với trung bình~84,1%
+2Cao hơn 2 SD so với trung bình~97,7%

Ví dụ thực tế

Nhiều hiện tượng tự nhiên tuân theo phân phối chuẩn:

  • Chiều cao con người:Hầu hết mọi người có chiều cao gần trung bình, ít người rất cao hoặc rất thấp
  • Điểm IQ:Được thiết kế để tuân theo phân phối chuẩn với trung bình 100 và SD 15
  • Sai số đo lường:Sai số ngẫu nhiên trong các phép đo khoa học
  • Huyết áp:Chỉ số huyết áp trong dân số

Khi dữ liệu không phân phối chuẩn

Không phải tất cả dữ liệu đều tuân theo phân phối chuẩn. Hãy cẩn thận với:

Các phân phối không chuẩn

- Dữ liệu thu nhập: Thường lệch phải (đuôi dài của người thu nhập cao) - Thời gian chờ: Thường phân phối theo hàm mũ - Dữ liệu đếm: Có thể tuân theo phân phối Poisson - Tỷ lệ: Tuân theo phân phối nhị thức