Σ
SDCalc
Cơ bảnCơ bản·12 min

Hướng dẫn toàn diện về Độ lệch chuẩn

Nắm vững độ lệch chuẩn với hướng dẫn toàn diện. Tìm hiểu công thức, tính toán từng bước, ví dụ thực tế và khi nào sử dụng độ lệch chuẩn mẫu so với tổng thể.

Độ lệch chuẩn là gì?

Độ lệch chuẩn là một đại lượng thống kê đo lường mức độ biến thiên hoặc phân tán trong một tập dữ liệu. Nói đơn giản, nó cho bạn biết các con số nằm rải rác như thế nào so với giá trị trung bình (mean).

Hãy hình dung thế này: nếu bạn có một nhóm điểm thi của học sinh, độ lệch chuẩn cho bạn biết liệu hầu hết học sinh đạt điểm tương tự nhau (SD thấp) hay điểm số rất khác biệt (SD cao).

Visual Comparison

Low SD (σ = 0.5)

Data clustered tightly around the mean

High SD (σ = 2)

Data spread widely from the mean

Tại sao Độ lệch chuẩn quan trọng?

Độ lệch chuẩn là một trong những đại lượng thống kê được sử dụng rộng rãi nhất vì nó cung cấp thông tin quan trọng cho việc ra quyết định trong hầu hết mọi lĩnh vực:

  • Tài chính:Đo lường rủi ro đầu tư và biến động danh mục đầu tư
  • Sản xuất:Kiểm soát chất lượng và cải tiến quy trình Six Sigma
  • Khoa học:Báo cáo độ không chắc chắn của phép đo và độ chính xác thí nghiệm
  • Giáo dục:Phân tích phân phối điểm thi và đường cong chấm điểm
  • Y tế:Thử nghiệm lâm sàng và hiểu biến thiên dữ liệu bệnh nhân

Công thức Độ lệch chuẩn

Có hai phiên bản công thức độ lệch chuẩn, tùy thuộc vào việc bạn đang làm việc với mẫu hay toàn bộ tổng thể:

Độ lệch chuẩn tổng thể

σ = √[Σ(xᵢ - μ)² / N]

Độ lệch chuẩn mẫu

s = √[Σ(xᵢ - x̄)² / (n-1)]

Ký hiệu

σ (sigma) = SD tổng thể · s = SD mẫu · Σ = tổng của · xᵢ = mỗi điểm dữ liệu · μ (mu) = trung bình tổng thể · x̄ (x-bar) = trung bình mẫu · N = kích thước tổng thể · n = kích thước mẫu

Tại sao (n-1)?

Khi làm việc với mẫu, chúng ta chia cho (n-1) thay vì n. Đây được gọi là hiệu chỉnh Bessel và cung cấp ước lượng không chệch cho độ lệch chuẩn tổng thể.

Tính toán từng bước

Hãy tính độ lệch chuẩn mẫu cho tập dữ liệu: 4, 8, 6, 5, 3

1

Tính trung bình

Trung bình = (4 + 8 + 6 + 5 + 3) / 5 = 26 / 5 = 5,2
2

Tìm độ lệch từ trung bình

4 - 5,2 = -1,2 · 8 - 5,2 = 2,8 · 6 - 5,2 = 0,8 · 5 - 5,2 = -0,2 · 3 - 5,2 = -2,2
3

Bình phương mỗi độ lệch

(-1,2)² = 1,44 · (2,8)² = 7,84 · (0,8)² = 0,64 · (-0,2)² = 0,04 · (-2,2)² = 4,84
4

Tổng các bình phương độ lệch

1,44 + 7,84 + 0,64 + 0,04 + 4,84 = 14,8
5

Chia cho (n-1)

Phương sai = 14,8 / (5-1) = 14,8 / 4 = 3,7
6

Lấy căn bậc hai

Độ lệch chuẩn = √3,7 = 1,924

Mẹo hữu ích

Sử dụng Máy tính Độ lệch chuẩn của chúng tôi để tính SD ngay lập tức với lời giải từng bước cho bất kỳ tập dữ liệu nào.

Cách diễn giải kết quả

Hiểu ý nghĩa của giá trị độ lệch chuẩn là rất quan trọng để đưa ra quyết định sáng suốt:

Giá trị SDDiễn giảiVí dụ
SD thấpCác điểm dữ liệu tập trung gần trung bình; độ nhất quán caoLinh kiện sản xuất bằng máy với dung sai chặt
SD caoCác điểm dữ liệu phân bố rộng; biến thiên caoBiến động giá cổ phiếu hàng ngày
SD bằng 0Tất cả các điểm dữ liệu giống nhauSản phẩm giá cố định tại cửa hàng

Quy tắc thực nghiệm (68-95-99,7)

Đối với dữ liệu phân phối chuẩn: 68% dữ liệu nằm trong 1 độ lệch chuẩn quanh trung bình · 95% nằm trong 2 độ lệch chuẩn · 99,7% nằm trong 3 độ lệch chuẩn

Ví dụ thực tế

Ví dụ 1: Điểm thi

Một lớp 30 học sinh tham gia kỳ thi. Điểm trung bình là 75 với độ lệch chuẩn là 10. Diễn giải: Hầu hết học sinh (khoảng 68%) đạt điểm từ 65 đến 85. Một học sinh đạt 95 điểm đang học rất xuất sắc (cao hơn 2 SD so với trung bình), trong khi điểm 55 cho thấy đang gặp khó khăn (thấp hơn 2 SD so với trung bình).

Ví dụ 2: Chất lượng sản xuất

Một nhà máy sản xuất bu lông có đường kính yêu cầu 10mm. Sau khi đo 100 bu lông, trung bình là 10,02mm với SD là 0,05mm. Diễn giải: Quy trình được kiểm soát tốt. 99,7% bu lông sẽ có đường kính từ 9,87mm đến 10,17mm (±3σ). Nếu thông số kỹ thuật yêu cầu 10mm ± 0,2mm, quy trình này dễ dàng đáp ứng tiêu chuẩn chất lượng.

Các lỗi thường gặp cần tránh

Sử dụng sai công thức

Đừng dùng SD tổng thể (N) khi bạn có mẫu. Điều này sẽ đánh giá thấp biến thiên thực tế.

Bỏ qua giá trị ngoại lai

Độ lệch chuẩn rất nhạy cảm với giá trị ngoại lai. Một giá trị cực đoan duy nhất có thể làm SD tăng đáng kể. Hãy cân nhắc sử dụng độ lệch tuyệt đối trung vị (MAD) cho các tập dữ liệu có giá trị ngoại lai.

Giả định phân phối chuẩn

Quy tắc thực nghiệm (68-95-99,7) chỉ áp dụng cho dữ liệu phân phối chuẩn. Hãy kiểm tra phân phối dữ liệu của bạn trước khi áp dụng các tỷ lệ phần trăm này.