Apa itu Pencilan?
Pencilan adalah titik data yang berbeda secara signifikan dari pengamatan lainnya. Pencilan bisa disebabkan oleh kesalahan pengukuran, kesalahan entri data, atau mungkin mewakili kasus yang benar-benar tidak biasa yang layak diselidiki.
Titik oranye di (10, 50) adalah pencilan
Aturan 3-Sigma
Untuk data berdistribusi normal, titik yang melampaui 3 simpangan baku dari rata-rata dianggap sebagai pencilan. Mereka terjadi kurang dari 0,3% secara kebetulan.
Pencilan jika
Contoh
Metode Skor-Z
Hitung skor-z untuk setiap titik data. Jika |z| > 3 (atau terkadang 2,5), itu adalah pencilan.
Skor-Z
Pilihan Ambang Batas
Metode IQR (Alternatif)
Metode Rentang Interkuartil (IQR) lebih kebal terhadap pencilan karena tidak menggunakan rata-rata atau simpangan baku.
Langkah 1
Langkah 2
Langkah 3
Langkah 4
Langkah 5
Menangani Pencilan
Jangan Otomatis Menghapus!