¿Qué es la fórmula de la desviación estándar?
La fórmula de la desviación estándar es la ecuación matemática que se utiliza para cuantificar la cantidad de variación o dispersión en un conjunto de valores de datos. Una desviación estándar baja indica que los datos tienden a estar cerca de la media (μ o x̄), mientras que una desviación estándar alta indica que los puntos de datos están más dispersos en un rango más amplio de valores.
En estadística, la fórmula que debes usar depende de si estás trabajando con una población entera o con una muestra extraída de esa población. El concepto central consiste en calcular la media de las desviaciones al cuadrado respecto a la media, lo que se conoce como varianza (σ²), y luego calcular la raíz cuadrada para devolver la medida a las unidades originales.
Desviación estándar poblacional
- σ (sigma): Desviación estándar poblacional
- Σ (sigma): Sumatorio de...
- xi: Cada valor individual del conjunto de datos
- μ (mu): Media poblacional
- N: Número total de datos en la población
Desviación estándar poblacional frente a muestral
En el análisis de datos del mundo real, es raro disponer de los datos de toda una población. La mayoría de las veces, recogemos una muestra para hacer inferencias sobre la población más amplia. Como la muestra solo estima la media poblacional, calcular la desviación estándar usando la fórmula poblacional en una muestra subestima sistemáticamente la variabilidad real. Para corregir este sesgo, utilizamos la fórmula de la desviación estándar muestral.
Desviación estándar muestral
¡No confundas las fórmulas!
Cálculo paso a paso de la fórmula
Calcular la desviación estándar a mano requiere un enfoque sistemático. Siguiendo estos pasos, podrás calcular con precisión la desviación estándar poblacional o muestral de cualquier conjunto de datos.
Calcular la media
Encontrar las desviaciones
Elevar las desviaciones al cuadrado
Sumar las desviaciones al cuadrado
Dividir entre N o n-1
Calcular la raíz cuadrada
¿Por qué la fórmula muestral divide entre n-1?
Dividir entre n-1 en lugar de n es un concepto conocido como corrección de Bessel. Como la media muestral (x̄) se calcula a partir de los propios datos de la muestra, las desviaciones (xi - x̄) están matemáticamente obligadas a sumar cero. Esto significa que los puntos de datos están un poco más cerca de la media muestral de lo que lo están de la verdadera media poblacional (μ).
Al dividir entre n-1 (los grados de libertad), aumentamos la varianza lo suficiente para compensar esta subestimación, proporcionando un estimador insesgado de la varianza poblacional.
Further Reading
Sources
References and further authoritative reading used in preparing this article.