O que São Outliers?
Outliers são pontos de dados que diferem significativamente das outras observações. Podem ser causados por erros de medição, erros na introdução de dados ou podem representar casos genuinamente invulgares que merecem investigação.
O ponto laranja em (10, 50) é um outlier
A Regra dos 3 Sigma
Para dados com distribuição normal, pontos para além de 3 desvios-padrão da média são considerados outliers. Ocorrem em menos de 0,3% das vezes por acaso.
Outlier se
Exemplo
Método do Z-Score
Calcula o z-score de cada ponto de dados. Se |z| > 3 (ou por vezes 2,5), é um outlier.
Z-Score
Opções de Limiar
Método IQR (Alternativa)
O método da Amplitude Interquartil (IQR) é mais robusto a outliers porque não utiliza a média nem o desvio-padrão.
Passo 1
Passo 2
Passo 3
Passo 4
Passo 5
Como Tratar Outliers
Não Elimines Automaticamente!