O que São Outliers?
Outliers (valores atípicos) são pontos de dados que diferem significativamente das demais observações. Podem ser causados por erros de medição, erros de digitação ou podem representar casos genuinamente incomuns que merecem investigação.
O ponto laranja em (10, 50) é um outlier
A Regra dos 3 Sigma
Para dados com distribuição normal, pontos além de 3 desvios padrões da média são considerados outliers. Eles ocorrem em menos de 0,3% das vezes por acaso.
É outlier se
Exemplo
Método do Escore Z
Calcule o escore Z para cada ponto de dado. Se |z| > 3 (ou às vezes 2,5), é um outlier.
Escore Z
Opções de Limiar
Método IQR (Alternativa)
O método do Intervalo Interquartil (IQR) é mais robusto a outliers porque não usa a média nem o desvio padrão.
Passo 1
Passo 2
Passo 3
Passo 4
Passo 5
Como Lidar com Outliers
Não Delete Automaticamente!