¿Qué Son los Valores Atípicos?
Los valores atípicos son puntos de datos que difieren significativamente de otras observaciones. Pueden ser causados por errores de medición, errores en la captura de datos, o pueden representar casos genuinamente inusuales que vale la pena investigar.
El punto naranja en (10, 50) es un valor atípico
La Regla de 3 Sigma
Para datos con distribución normal, los puntos más allá de 3 desviaciones estándar de la media se consideran valores atípicos. Ocurren menos del 0.3% del tiempo por azar.
Es valor atípico si
Ejemplo
Método de Puntuación Z
Calcula la puntuación z para cada dato. Si |z| > 3 (o a veces 2.5), es un valor atípico.
Puntuación Z
Opciones de Umbral
Método IQR (Alternativa)
El método del Rango Intercuartílico (IQR) es más robusto ante valores atípicos porque no usa la media ni la desviación estándar.
Paso 1
Paso 2
Paso 3
Paso 4
Paso 5
Manejo de Valores Atípicos
¡No los Elimines Automáticamente!