¿Qué es la fórmula de la desviación estándar?
La fórmula de la desviación estándar es la ecuación matemática que se utiliza para cuantificar la cantidad de variación o dispersión en un conjunto de datos. Una desviación estándar baja indica que los datos tienden a estar cerca de la media (μ o x̄), mientras que una desviación estándar alta indica que los valores están más dispersos.
En estadística, la fórmula que debes usar depende de si estás trabajando con una población completa o con una muestra extraída de esa población. El concepto central consiste en calcular el promedio de las desviaciones cuadradas respecto a la media, lo que se conoce como varianza (σ²), y luego tomar la raíz cuadrada para volver a las unidades originales de medición.
Desviación estándar de la población
- σ (sigma): Desviación estándar de la población
- Σ (sigma): Sumatoria de...
- xi: Cada valor individual del conjunto de datos
- μ (mu): Media de la población
- N: Cantidad total de datos en la población
Desviación estándar de población vs. muestra
En el análisis de datos del mundo real, es poco frecuente tener información de toda una población. Por lo general, tomamos una muestra para hacer inferencias sobre la población más grande. Como la muestra solo estima la media poblacional, calcular la desviación estándar usando la fórmula de la población sobre una muestra subestima la variabilidad real de forma sistemática. Para corregir este sesgo, usamos la fórmula de la desviación estándar de la muestra.
Desviación estándar de la muestra
¡No confundas las fórmulas!
Cálculo paso a paso de la fórmula
Calcular la desviación estándar manualmente requiere un método sistemático. Siguiendo estos pasos, podrás calcular con precisión la desviación estándar poblacional o muestral para cualquier conjunto de datos.
Calcular la media
Encontrar las desviaciones
Elevar las desviaciones al cuadrado
Sumar las desviaciones cuadradas
Dividir por N o n-1
Calcular la raíz cuadrada
¿Por qué la fórmula de la muestra divide por n-1?
Dividir por n-1 en lugar de n es un concepto conocido como corrección de Bessel. Como la media muestral (x̄) se calcula a partir de los datos de la muestra misma, las desviaciones (xi - x̄) están condicionadas matemáticamente a sumar cero. Esto significa que los datos están un poco más cerca de la media muestral que de la verdadera media poblacional (μ).
Al dividir por n-1 (los grados de libertad), aumentamos la varianza lo justo para compensar esta subestimación, lo que nos da un estimador insesgado de la varianza poblacional.
Further Reading
Sources
References and further authoritative reading used in preparing this article.