Apa itu Pencilan?
Pencilan adalah titik data yang berbeda secara signifikan dari pengamatan lainnya. Pencilan bisa disebabkan oleh kesalahan pengukuran, kesalahan entri data, atau mungkin mewakili kasus yang benar-benar tidak biasa yang layak diselidiki.
Titik oranye di (10, 50) adalah pencilan
Aturan 3-Sigma
Untuk data berdistribusi normal, titik yang melampaui 3 simpangan baku dari rata-rata dianggap sebagai pencilan. Mereka terjadi kurang dari 0,3% secara kebetulan.
Pencilan jika
x < μ - 3σ OR x > μ + 3σ
Contoh
Jika nilai ujian memiliki μ = 75 dan σ = 10:
- Batas bawah: 75 - 30 = 45
- Batas atas: 75 + 30 = 105
- Nilai apa pun di bawah 45 atau di atas 105 adalah pencilan
Metode Skor-Z
Hitung skor-z untuk setiap titik data. Jika |z| > 3 (atau terkadang 2,5), itu adalah pencilan.
Pilihan Ambang Batas
- |z| > 3: Konservatif (menangkap lebih sedikit pencilan)
- |z| > 2,5: Moderat
- |z| > 2: Liberal (menangkap lebih banyak pencilan)
Metode IQR (Alternatif)
Metode Rentang Interkuartil (IQR) lebih kebal terhadap pencilan karena tidak menggunakan rata-rata atau simpangan baku.
1
Langkah 1
Temukan Q1 (persentil ke-25) dan Q3 (persentil ke-75)
2
Langkah 2
Hitung IQR = Q3 - Q1
3
Langkah 3
Pagar bawah = Q1 - 1,5 × IQR
4
Langkah 4
Pagar atas = Q3 + 1,5 × IQR
5
Langkah 5
Titik di luar pagar adalah pencilan
Menangani Pencilan
Jangan Otomatis Menghapus!
Pencilan tidak selalu merupakan kesalahan. Sebelum menghapusnya, selidiki:
- Apakah ini kesalahan entri data atau pengukuran?
- Apakah ini nilai ekstrem yang asli?
- Apakah ini mewakili kasus tepi yang penting?
Kapan Menghapus
- Kesalahan entri data yang terkonfirmasi
- Kerusakan peralatan pengukuran
- Di luar rentang nilai yang mungkin
Kapan Mempertahankan
- Mewakili variabilitas nyata
- Penting untuk analisis Anda
- Menghapus akan membuat hasil bias