Apakah Pencilan?
Pencilan ialah titik data yang berbeza secara ketara daripada pemerhatian lain. Ia boleh disebabkan oleh ralat pengukuran, kesilapan kemasukan data, atau mungkin mewakili kes luar biasa yang tulen yang patut disiasat.
Titik oren pada (10, 50) ialah pencilan
Peraturan 3-Sigma
Untuk data bertaburan normal, titik melebihi 3 sisihan piawai daripada min dianggap sebagai pencilan. Ia berlaku kurang daripada 0.3% daripada masa secara kebetulan.
Pencilan jika
Contoh
Kaedah Skor-Z
Kira skor-z untuk setiap titik data. Jika |z| > 3 (atau kadangkala 2.5), ia adalah pencilan.
Skor-Z
Pilihan Ambang
Kaedah IQR (Alternatif)
Kaedah Julat Antara Kuartil (IQR) lebih teguh terhadap pencilan kerana ia tidak menggunakan min atau sisihan piawai.
Langkah 1
Langkah 2
Langkah 3
Langkah 4
Langkah 5
Mengendalikan Pencilan
Jangan Padam Secara Automatik!