Σ
SDCalc
IntermedioFundamentals·9 min

Fórmula de la desviación estándar: guía paso a paso

Domina la fórmula de la desviación estándar con nuestra guía paso a paso. Aprende la diferencia entre fórmulas de población y muestra, cálculos y usos.

By Standard Deviation Calculator Team · Data Science Team·Published

¿Qué es la fórmula de la desviación estándar?

La fórmula de la desviación estándar es la ecuación matemática que se utiliza para cuantificar la cantidad de variación o dispersión en un conjunto de valores de datos. Una desviación estándar baja indica que los datos tienden a estar cerca de la media (μ o x̄), mientras que una desviación estándar alta indica que los puntos de datos están más dispersos en un rango más amplio de valores.

En estadística, la fórmula que debes usar depende de si estás trabajando con una población entera o con una muestra extraída de esa población. El concepto central consiste en calcular la media de las desviaciones al cuadrado respecto a la media, lo que se conoce como varianza (σ²), y luego calcular la raíz cuadrada para devolver la medida a las unidades originales.

Desviación estándar poblacional

σ = √[ Σ (xi - μ)² / N ]
  • σ (sigma): Desviación estándar poblacional
  • Σ (sigma): Sumatorio de...
  • xi: Cada valor individual del conjunto de datos
  • μ (mu): Media poblacional
  • N: Número total de datos en la población

Desviación estándar poblacional frente a muestral

En el análisis de datos del mundo real, es raro disponer de los datos de toda una población. La mayoría de las veces, recogemos una muestra para hacer inferencias sobre la población más amplia. Como la muestra solo estima la media poblacional, calcular la desviación estándar usando la fórmula poblacional en una muestra subestima sistemáticamente la variabilidad real. Para corregir este sesgo, utilizamos la fórmula de la desviación estándar muestral.

Desviación estándar muestral

s = √[ Σ (xi - x̄)² / (n - 1) ]

¡No confundas las fórmulas!

Usar 'N' para una muestra o 'n-1' para una población dará como resultado una medida de dispersión incorrecta. La fórmula muestral con n-1 se conoce como corrección de Bessel y es estrictamente necesaria para obtener una estimación insesgada de la varianza poblacional.

Cálculo paso a paso de la fórmula

Calcular la desviación estándar a mano requiere un enfoque sistemático. Siguiendo estos pasos, podrás calcular con precisión la desviación estándar poblacional o muestral de cualquier conjunto de datos.

1

Calcular la media

Suma todos los puntos de datos (Σxi) y divídelos por el número total de puntos (N o n) para encontrar la media (μ o x̄).
2

Encontrar las desviaciones

Réstale la media a cada punto de datos individual para encontrar la desviación: (xi - media).
3

Elevar las desviaciones al cuadrado

Eleva al cuadrado cada una de las desviaciones calculadas en el paso anterior: (xi - media)². Esto asegura que todos los valores sean positivos.
4

Sumar las desviaciones al cuadrado

Suma todas las desviaciones al cuadrado para encontrar la suma de cuadrados: Σ(xi - media)².
5

Dividir entre N o n-1

Para una población, divide entre N. Para una muestra, divide entre (n - 1). Esto te da la varianza (σ² o s²).
6

Calcular la raíz cuadrada

Calcula la raíz cuadrada de la varianza para encontrar la desviación estándar (σ o s).

¿Por qué la fórmula muestral divide entre n-1?

Dividir entre n-1 en lugar de n es un concepto conocido como corrección de Bessel. Como la media muestral (x̄) se calcula a partir de los propios datos de la muestra, las desviaciones (xi - x̄) están matemáticamente obligadas a sumar cero. Esto significa que los puntos de datos están un poco más cerca de la media muestral de lo que lo están de la verdadera media poblacional (μ).

Al dividir entre n-1 (los grados de libertad), aumentamos la varianza lo suficiente para compensar esta subestimación, proporcionando un estimador insesgado de la varianza poblacional.

Further Reading

Sources

References and further authoritative reading used in preparing this article.

  1. Manual electrónico de Métodos Estadísticos NIST/SEMATECH
  2. Desviación estándar - Wikipedia
  3. Corrección de Bessel