Σ
SDCalc
IntermedioConceptos·8 min

Desvío Estándar Muestral vs. Poblacional: Cuándo Usar Cada Uno

Aprendé la diferencia entre el desvío estándar muestral y poblacional. Entendé la corrección de Bessel, cuándo usar n-1 vs n, con ejemplos claros.

Descripción general

Una de las preguntas más frecuentes en estadística es: “¿Debo dividir por n o por n-1?” La respuesta depende de si estás trabajando con una población completa o solo con una muestra.

Población (N)

Se usa cuando tenés datos de todos los miembros del grupo que estás estudiando. σ = √[Σ(x-μ)² / N]

Muestra (n-1)

Se usa cuando tenés datos de un subconjunto de la población más grande. s = √[Σ(x-x̄)² / (n-1)]

Desvío estándar poblacional (σ)

El desvío estándar poblacional se usa cuando tenés mediciones de cada miembro individual del grupo que estás analizando. Esto es relativamente poco común en la práctica.

Ejemplos de poblaciones reales:

  • Los 50 empleados de una empresa pequeña
  • Todos los estudiantes de una clase específica de 30
  • Todas las transacciones de un año fiscal cerrado
  • Datos censales completos de un país

Desvío estándar muestral (s)

El desvío estándar muestral se usa cuando estás trabajando con un subconjunto de una población mayor. Este es el escenario más común en el análisis del mundo real.

Ejemplos de muestras:

  • Encuestar a 1.000 votantes para predecir resultados electorales
  • Probar 50 productos de un lote de producción de 10.000
  • Medir la presión arterial de 200 pacientes en un estudio clínico
  • Analizar 5 años de datos bursátiles para predecir volatilidad futura

La corrección de Bessel explicada

La corrección de Bessel es la razón por la que usamos (n-1) en lugar de n al calcular el desvío estándar muestral. Nombrada en honor al matemático alemán Friedrich Bessel, este ajuste produce una estimación insesgada de la varianza poblacional.

Por qué funciona (n-1)

Cuando calculás una media muestral, “usás” un grado de libertad. La media muestral restringe los datos: una vez que conocés n-1 valores y la media, el último valor queda determinado. Dividir por (n-1) corrige esta pérdida de libertad.

Intuición matemática

Los datos muestrales tienden a agruparse más cerca de la media muestral que de la verdadera media poblacional. Esto hace que la suma de desviaciones al cuadrado sea sistemáticamente menor de lo que debería ser.

Dividir por (n-1) en lugar de n infla ligeramente el resultado, compensando esta subestimación y produciendo una estimación insesgada.

Cuándo usar cada uno

EscenarioUsarDividir por
Tenés todos los datos existentesDE poblacional (σ)N
Estás describiendo solo los datos que tenésDE poblacional (σ)N
Estás estimando para una población mayorDE muestral (s)n-1
Vas a usar el DE para estadística inferencialDE muestral (s)n-1

Regla general

En caso de duda, usá el desvío estándar muestral (n-1). Es más seguro porque: - La mayoría de los datos del mundo real provienen de muestras, no de poblaciones completas - Usar n-1 en una población real sobreestima ligeramente (más seguro que subestimar) - Para n grande, la diferencia es insignificante

Ejemplos prácticos

Ejemplo: Control de calidad

Una fábrica produce 10.000 piezas por día. El control de calidad analiza 100 piezas y encuentra que sus pesos tienen una media de 50 g. Respuesta: Usá el DE muestral (n-1) porque las 100 piezas son una muestra de las 10.000 producidas. Estás usando esta muestra para estimar la variabilidad de todas las piezas.

Ejemplo: Notas de una clase

Una profesora quiere describir la variabilidad de las notas de un examen de su clase de 25 estudiantes. No está intentando generalizar a otras clases. Respuesta: Usá el DE poblacional (N) porque tiene las notas de toda la clase (su población de interés) y no está haciendo inferencias sobre otros grupos.