Co jsou odlehlé hodnoty?
Odlehlé hodnoty jsou datové body, které se výrazně liší od ostatních pozorování. Mohou být způsobeny chybami měření, chybami při zadávání dat, nebo mohou představovat skutečně neobvyklé případy hodné prozkoumání.
Oranžový bod na pozici (10, 50) je odlehlá hodnota
Pravidlo 3 sigma
Pro normálně rozdělená data jsou body za hranicí 3 směrodatných odchylek od průměru považovány za odlehlé hodnoty. Náhodně se vyskytují v méně než 0,3 % případů.
Odlehlá hodnota, pokud
Příklad
Metoda Z-skóre
Vypočítejte z-skóre pro každý datový bod. Pokud |z| > 3 (nebo někdy 2,5), jedná se o odlehlou hodnotu.
Z-skóre
Možnosti prahu
Metoda IQR (alternativa)
Metoda mezikvartilového rozpětí (IQR) je robustnější vůči odlehlým hodnotám, protože nepoužívá průměr ani směrodatnou odchylku.
Krok 1
Krok 2
Krok 3
Krok 4
Krok 5
Práce s odlehlými hodnotami
Neodstraňujte automaticky!