ค่าผิดปกติคืออะไร?
ค่าผิดปกติ คือจุดข้อมูลที่แตกต่างอย่างมีนัยสำคัญจากข้อสังเกตอื่นๆ อาจเกิดจากข้อผิดพลาดในการวัด ข้อผิดพลาดในการป้อนข้อมูล หรืออาจเป็นกรณีที่ผิดปกติอย่างแท้จริงที่ควรตรวจสอบ
จุดสีส้มที่ (10, 50) เป็นค่าผิดปกติ
กฎ 3-ซิกมา
สำหรับข้อมูลที่มีการแจกแจงปกติ จุดที่เกิน 3 ส่วนเบี่ยงเบนมาตรฐาน จากค่าเฉลี่ยถือเป็นค่าผิดปกติ เกิดขึ้นน้อยกว่า 0.3% ของเวลาโดยบังเอิญ
เป็นค่าผิดปกติถ้า
ตัวอย่าง
วิธีคะแนน Z
คำนวณคะแนน z สำหรับจุดข้อมูลแต่ละจุด ถ้า |z| > 3 (หรือบางครั้ง 2.5) ถือว่าเป็นค่าผิดปกติ
คะแนน Z
ตัวเลือกเกณฑ์
วิธี IQR (ทางเลือก)
วิธีพิสัยระหว่างควอร์ไทล์ (IQR) ทนทานต่อค่าผิดปกติมากกว่าเพราะไม่ใช้ค่าเฉลี่ยหรือส่วนเบี่ยงเบนมาตรฐาน
ขั้นตอนที่ 1
ขั้นตอนที่ 2
ขั้นตอนที่ 3
ขั้นตอนที่ 4
ขั้นตอนที่ 5
การจัดการค่าผิดปกติ
อย่าลบอัตโนมัติ!