Dos formas de medir la dispersión
Tanto el rango como el desvío estándar miden cuán dispersos están los datos, pero capturan aspectos fundamentalmente diferentes de la dispersión. Comprender cuándo usar cada uno es esencial para un análisis de datos adecuado.
El rango te informa sobre los extremos: cuán lejos están el valor más alto y el más bajo. El desvío estándar te indica la dispersión típica alrededor del promedio. Ambos son útiles, pero para propósitos distintos.
Guía rápida de decisión
Usá el rango cuando te importen los extremos (límites de control de calidad, variación de temperatura). Usá el desvío estándar cuando te interese la variabilidad típica y necesites rigor estadístico.
Definiciones y fórmulas
Rango
Rango = Máximo - Mínimo
La medida de dispersión más simple. Solo considera dos valores, independientemente del tamaño del conjunto de datos.
Desvío estándar
s = √[Σ(xᵢ - x̄)² / (n-1)]
Utiliza todos los datos para medir la distancia promedio respecto a la media.
Comparación directa
Ventajas y desventajas del rango
Ventajas:
- Extremadamente simple de calcular: solo una resta
- Fácil de entender y comunicar
- Muestra directamente la amplitud de los datos
- Útil para verificaciones rápidas de calidad
Desventajas:
- Ignora todos los valores intermedios
- Extremadamente sensible a valores atípicos
- Tiende a aumentar con el tamaño de la muestra
- Estadísticamente ineficiente
Ventajas y desventajas del DE
Ventajas:
- Utiliza todos los datos
- Estadísticamente eficiente y robusto
- Estable a medida que aumenta el tamaño de la muestra
- Base para la estadística avanzada
Desventajas:
- Más complejo de calcular a mano
- Menos intuitivo para no estadísticos
- Puede ocultar valores extremos importantes
- Aún se ve afectado por valores atípicos (usá MAD en su lugar)
Cuándo usar cada medida
Usá el rango cuando:
- Necesitás una estimación rápida y aproximada de la dispersión
- Los valores extremos son lo que importa (por ejemplo, rango de temperatura para diseño de climatización)
- Los datos son limpios y no tienen valores atípicos
- Te comunicás con audiencias no familiarizadas con la estadística
- El tamaño de muestra es pequeño y fijo (igual para todas las comparaciones)
Usá el desvío estándar cuando:
- Realizás análisis estadísticos o pruebas de hipótesis
- Comparás variabilidad entre diferentes tamaños de muestra
- Calculás intervalos de confianza o valores p
- Evaluás la variación típica en lugar de los extremos
- Los datos pueden contener valores atípicos que no deberían dominar la medida
Ejemplos prácticos
Ejemplo: Temperaturas diarias
Datos: 22°C, 24°C, 23°C, 23°C, 24°C, 22°C, 23°C
Rango: 24 - 22 = 2°C (la oscilación térmica)
DE: 0,82°C (la variación típica día a día)
Ambos son útiles: el rango para la capacidad de climatización, el DE para la consistencia del confort.
Ejemplo: Calificaciones con valor atípico
Datos: 85, 88, 87, 86, 89, 42 (un estudiante no estudió)
Rango: 89 - 42 = 47 puntos (dominado por el valor atípico)
DE: 17,4 puntos (aún afectado pero en menor medida)
El rango es engañoso en este caso. Considerá usar el DE o eliminar el valor atípico.
Consideraciones avanzadas
Relación entre rango y DE: Para datos distribuidos normalmente, Rango ≈ 4-6 × DE para tamaños de muestra típicos. Esto permite una conversión aproximada entre ambos.
Rango Intercuartílico (RIC): Un punto intermedio que usa Q3 - Q1 en lugar de máximo - mínimo. Es más robusto que el rango y más simple que el DE.
Buena práctica
Reportá ambas medidas cuando sea apropiado. “El rango de temperatura fue de 15°C (DE = 4,2°C)” da a los lectores información completa tanto de los extremos como de la variación típica.