Ce sunt valorile aberante?
Valorile aberante sunt puncte de date care diferă semnificativ de celelalte observații. Pot fi cauzate de erori de măsurare, greșeli de introducere a datelor sau pot reprezenta cazuri cu adevărat neobișnuite care merită investigate.
Punctul portocaliu de la (10, 50) este o valoare aberantă
Regula 3-Sigma
Pentru date distribuite normal, punctele dincolo de 3 deviații standard de la medie sunt considerate valori aberante. Acestea apar mai puțin de 0,3% din timp din întâmplare.
Valoare aberantă dacă
Exemplu
Metoda scorului Z
Calculează scorul z pentru fiecare punct de date. Dacă |z| > 3 (sau uneori 2,5), este o valoare aberantă.
Scor Z
Opțiuni de prag
Metoda IQR (alternativă)
Metoda intervalului intercuartilic (IQR) este mai robustă la valori aberante deoarece nu folosește media sau deviația standard.
Pasul 1
Pasul 2
Pasul 3
Pasul 4
Pasul 5
Gestionarea valorilor aberante
Nu le șterge automat!