¿Qué es la fórmula de la desviación estándar?
La fórmula de la desviación estándar es la ecuación matemática que nos permite cuantificar qué tanta variación o dispersión hay en un conjunto de datos. Una desviación estándar baja indica que los valores tienden a estar cerca de la media (μ o x̄), mientras que una alta nos dice que los datos están más esparcidos en un rango más amplio de valores.
En estadística, la fórmula que debes usar depende de si estás trabajando con toda una población o con una muestra extraída de ella. La idea central consiste en calcular el promedio de las desviaciones al cuadrado respecto a la media, lo cual se conoce como varianza (σ²), y luego sacar la raíz cuadrada para regresar la medida a sus unidades originales.
Desviación estándar poblacional
- σ (sigma): Desviación estándar poblacional
- Σ (sigma): Sumatoria de...
- xi: Cada valor individual en el conjunto de datos
- μ (mu): Media poblacional
- N: Número total de datos en la población
Desviación estándar poblacional vs. muestral
En el análisis de datos del mundo real, es raro tener la información de toda una población. La mayor parte del tiempo, recolectamos una muestra para hacer inferencias sobre la población más grande. Como la muestra solo estima la media poblacional, si calculamos la desviación estándar usando la fórmula poblacional en una muestra, subestimaremos la variabilidad real. Para corregir este sesgo, utilizamos la fórmula de la desviación estándar muestral.
Desviación estándar muestral
¡No mezcles tus fórmulas!
Cálculo de la fórmula paso a paso
Calcular la desviación estándar a mano requiere un método sistemático. Siguiendo estos pasos, podrás calcular con precisión la desviación estándar poblacional o muestral de cualquier conjunto de datos.
Calcula la media
Encuentra las desviaciones
Eleva al cuadrado las desviaciones
Suma las desviaciones al cuadrado
Divide entre N o n-1
Obtén la raíz cuadrada
¿Por qué la fórmula muestral divide entre n-1?
Dividir entre n-1 en lugar de n es un concepto conocido como corrección de Bessel. Como la media muestral (x̄) se calcula a partir de los propios datos de la muestra, las desviaciones (xi - x̄) están obligadas matemáticamente a sumar cero. Esto significa que los datos están un poco más cerca de la media muestral de lo que lo están de la verdadera media poblacional (μ).
Al dividir entre n-1 (los grados de libertad), inflamos la varianza lo suficiente para compensar esta subestimación, obteniendo así un estimador insesgado de la varianza poblacional.
Further Reading
Sources
References and further authoritative reading used in preparing this article.