Giá trị ngoại lai là gì?
Giá trị ngoại lai là các điểm dữ liệu khác biệt đáng kể so với các quan sát khác. Chúng có thể do lỗi đo lường, nhập liệu sai, hoặc có thể đại diện cho các trường hợp bất thường thực sự đáng được điều tra.
Điểm màu cam tại (10, 50) là một giá trị ngoại lai
Quy tắc 3-Sigma
Đối với dữ liệu phân phối chuẩn, các điểm vượt quá 3 độ lệch chuẩn so với trung bình được coi là giá trị ngoại lai. Chúng xảy ra ít hơn 0,3% thời gian do ngẫu nhiên.
Ngoại lai nếu
Ví dụ
Phương pháp điểm Z
Tính điểm Z cho mỗi điểm dữ liệu. Nếu |z| > 3 (hoặc đôi khi 2,5), đó là giá trị ngoại lai.
Điểm Z
Các ngưỡng lựa chọn
Phương pháp IQR (Phương án thay thế)
Phương pháp Khoảng tứ phân vị (IQR) bền vững hơn với giá trị ngoại lai vì nó không sử dụng trung bình hay độ lệch chuẩn.
Bước 1
Bước 2
Bước 3
Bước 4
Bước 5
Xử lý giá trị ngoại lai
Đừng tự động xóa!