¿Qué son los valores atípicos?
Los valores atípicos son puntos de datos que difieren significativamente de otras observaciones. Pueden ser causados por errores de medición, errores de ingreso de datos, o podrían representar casos genuinamente inusuales que merecen investigación.
El punto naranja en (10, 50) es un valor atípico
La regla de 3 sigma
Para datos con distribución normal, los puntos que se encuentran más allá de 3 desviaciones estándar de la media se consideran valores atípicos. Ocurren menos del 0.3% de las veces por azar.
Valor atípico si
Ejemplo
Método de puntuación Z
Calcule la puntuación Z para cada dato. Si |z| > 3 (o a veces 2.5), se trata de un valor atípico.
Puntuación Z
Opciones de umbral
Método IQR (alternativa)
El método del rango intercuartílico (IQR) es más robusto frente a valores atípicos porque no utiliza la media ni la desviación estándar.
Paso 1
Paso 2
Paso 3
Paso 4
Paso 5
Tratamiento de valores atípicos
No elimine automáticamente