¿Qué es la varianza?
La varianza mide qué tan disperso está un conjunto de números respecto a su valor promedio. Es el promedio de las diferencias al cuadrado respecto a la media, y es la base sobre la cual se construye el desvío estándar.
Cada barra muestra la desviación al cuadrado respecto a la media. Varianza = promedio de estas barras.
Fórmula de la varianza
Varianza poblacional
σ² = Σ(xᵢ - μ)² / N
Varianza muestral
s² = Σ(xᵢ - x̄)² / (n-1)
1
Calcular la media
Sumar todos los valores y dividir por la cantidad.
2
Encontrar cada desviación
Restar la media de cada dato.
3
Elevar al cuadrado cada desviación
Esto elimina los valores negativos y enfatiza las desviaciones grandes.
4
Promediar las desviaciones al cuadrado
Dividir por N (población) o n-1 (muestra).
¿Por qué elevamos al cuadrado las desviaciones?
Tres razones clave
1. Eliminar negativos: Sin elevar al cuadrado, las desviaciones positivas y negativas se cancelarían, haciendo que la suma sea cero.
2. Penalizar valores atípicos: Elevar al cuadrado otorga más peso a los valores alejados de la media.
3. Propiedades matemáticas: La varianza tiene propiedades algebraicas útiles para la inferencia estadística.
Ejemplo: ¿Por qué no usar simplemente valores absolutos?
Conjunto de datos: 2, 4, 4, 4, 5, 5, 7, 9 (Media = 5)
Desviación absoluta media:
|2-5| + |4-5| + ... = 14
DAM = 14/8 = 1,75
Varianza (al cuadrado):
(2-5)² + (4-5)² + ... = 32
Var = 32/8 = 4
Varianza vs. desvío estándar
La relación
Standard Deviation = √Variance → σ = √σ²
Varianza (σ²)
- Las unidades están al cuadrado (ej., cm², $²)
- Más difícil de interpretar directamente
- Útil para operaciones matemáticas
- Aditiva para variables independientes
Desvío estándar (σ)
- Mismas unidades que los datos originales
- Más fácil de interpretar
- Mejor para comunicar resultados
- Se usa en puntuaciones Z e intervalos de confianza
Aplicaciones de la varianza
Aunque el desvío estándar se reporta con más frecuencia, la varianza tiene usos específicos:
- ANOVA:El análisis de varianza compara medias entre grupos
- Teoría de carteras:Las varianzas de los rendimientos se utilizan en la optimización
- Regresión:R² es la varianza explicada dividida por la varianza total
- ACP:El análisis de componentes principales maximiza la varianza explicada