How should I interpret a high standard deviation?

A high standard deviation means the observations are spread farther from the mean on average. Whether that spread is acceptable depends on the context: wide dispersion might signal risk in finance, instability in manufacturing, or genuine natural variation in scientific data.

Why do some articles mention n while others mention n-1?

The denominator reflects the difference between population and sample formulas. Population variance and population standard deviation use N because the full dataset is known. Sample variance and sample standard deviation often use n-1 because Bessel’s correction reduces bias when estimating population spread from a sample.

What is a statistical interpretation guide?

A statistical interpretation guide is a page that moves beyond arithmetic and explains meaning. It tells you what a metric is, when the formula applies, and how to describe the result in plain English without overstating certainty.

Can I cite this article in a report?

You should cite the underlying authoritative reference for formal work whenever possible. This page is best used as an explanatory bridge that helps you understand the concept before quoting the original standard or handbook.

Why include direct citations on every article page?

Direct citations give readers a route to verify the definition, notation, and assumptions. That improves trust and reduces the chance that a simplified explanation is mistaken for the entire technical standard.

¿Qué es el desvío estándar? Definición, fórmula y ejemplos

¿Qué es el desvío estándar?

El desvío estándar es una medida estadística que cuantifica la cantidad de variación o dispersión en un conjunto de datos. Un desvío estándar bajo indica que los valores tienden a estar cerca de la media (valor esperado) del conjunto, mientras que un desvío alto indica que los datos están más dispersos. Se representa con la letra griega σ (sigma) para poblaciones y con s para muestras, y es uno de los conceptos más fundamentales de la estadística descriptiva.

Definición clave

El desvío estándar mide la distancia típica de cada dato respecto a la media. Te indica, en promedio, cuánto varían tus datos respecto al centro.

Desvío estándar poblacional vs. muestral

Antes de calcular el desvío estándar, tenés que determinar si tus datos representan a toda una población o a una muestra de ella. Una población incluye a todos los miembros de un grupo definido, mientras que una muestra es un subconjunto representativo de ese grupo. Calcular el desvío estándar de una muestra requiere un ajuste matemático: usar n - 1 (grados de libertad, o df) en lugar de N, para asegurar que el resultado sea un estimador insesgado de la varianza poblacional.

Desvío estándar poblacional

Se usa cuando tenés los datos de todo el grupo. Se denota con σ. El denominador en la fórmula de la varianza es N (el tamaño total de la población).

Desvío estándar muestral

Se usa cuando tenés un subconjunto del grupo. Se denota con s. El denominador en la fórmula de la varianza es n - 1 (tamaño de la muestra menos uno) para corregir el sesgo.

Explicación de la fórmula del desvío estándar

Las fórmulas del desvío estándar se basan en calcular primero la varianza y luego sacar la raíz cuadrada. Este paso es clave porque devuelve la medida de dispersión a las unidades originales de los datos. Los componentes principales son xᵢ (cada valor individual), μ o x̄ (la media poblacional o muestral) y N o n (la cantidad total de valores).

Desvío poblacional

σ = √[ Σ(xᵢ - μ)² / N ]

Desvío muestral

s = √[ Σ(xᵢ - x̄)² / (n - 1) ]

Ejemplo de cálculo paso a paso

Vamos a calcular el desvío estándar muestral para un conjunto pequeño de notas de un examen: [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]. Siguiendo la fórmula paso a paso, se ve cómo se acumula la varianza antes de sacar la raíz cuadrada final.

Calculá la media (x̄)

Sumá todos los valores y dividilos por la cantidad: (4+8+6+5+3+2+8+9+2+5) / 10 = 52 / 10 = 5.2

Restá la media y elevá al cuadrado

Para cada valor, calculá la diferencia al cuadrado: (4-5.2)² = 1.44, (8-5.2)² = 7.84, (6-5.2)² = 0.64, etc.

Sumá las diferencias al cuadrado

Sumá todos los resultados al cuadrado: 1.44 + 7.84 + 0.64 + 0.04 + 4.84 + 10.24 + 7.84 + 14.44 + 10.24 + 0.04 = 57.6

Dividí por n - 1 (grados de libertad)

Dividí la suma por el tamaño de la muestra menos uno: 57.6 / (10 - 1) = 57.6 / 9 = 6.4. Esta es la varianza muestral (σ²).

Sacá la raíz cuadrada

Calculá la raíz cuadrada de la varianza: √6.4 ≈ 2.53. El desvío estándar muestral es 2.53.

Cálculo del desvío estándar en Python

Calcular el desvío estándar a mano es propenso a errores, sobre todo con conjuntos de datos grandes. En la práctica, los estadísticos y científicos de datos usan lenguajes de programación como Python para calcularlo al instante usando librerías nativas.

python

import statistics

data = [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]

# Calcular el desvío estándar muestral (por defecto)
sample_sd = statistics.stdev(data)
print(f"Sample SD: {sample_sd:.2f}")

# Calcular el desvío estándar poblacional
pop_sd = statistics.pstdev(data)
print(f"Population SD: {pop_sd:.2f}")

La regla empírica y el desvío estándar

Cuando los datos siguen una distribución normal (campana de Gauss), el desvío estándar se vuelve muy predictivo. La regla empírica, también conocida como regla 68-95-99.7, establece que casi todos los datos caerán dentro de tres desvíos estándar de la media. Esto permite a los analistas identificar rápidamente valores atípicos (outliers) y entender la probabilidad de que ocurra una observación específica.

Intervalo desde la media	Porcentaje de datos	Aplicación
±1σ	68.27%	Identificar valores típicos y cotidianos
±2σ	95.45%	Construir intervalos de confianza
±3σ	99.73%	Detectar valores atípicos extremos

Desvío estándar vs. Varianza

La varianza y el desvío estándar son medidas de dispersión estrechamente relacionadas. La varianza (σ² o s²) es el promedio de las diferencias al cuadrado respecto a la media, mientras que el desvío estándar es la raíz cuadrada de la varianza. Como la varianza se expresa en unidades al cuadrado (por ejemplo, pesos al cuadrado, centímetros al cuadrado), puede ser difícil de interpretar en el contexto de los datos originales. El desvío estándar resuelve esto al convertir la medida de vuelta a las unidades originales.

Al reportar tus datos

Siempre reportá el desvío estándar junto con la media al describir tus datos. Como el desvío está en las mismas unidades que la media (por ejemplo, pesos, centímetros, kilogramos), provee una medida de dispersión intuitiva que tu audiencia puede entender de inmediato.

Errores comunes a evitar

Si bien el desvío estándar es una herramienta poderosa, suele usarse mal. Aplicar las fórmulas de forma incorrecta o malinterpretar lo que representa el valor puede llevar a un análisis de datos defectuoso y a conclusiones erróneas.

Usar la fórmula poblacional para una muestra: Olvidar usar n - 1 en las muestras reduce artificialmente la dispersión calculada, subestimando la verdadera varianza poblacional.
Aplicar el desvío a distribuciones no normales: La regla empírica solo aplica a distribuciones normales. Para datos muy asimétricos, el desvío podría no reflejar con precisión la dispersión.
Confundir el desvío con el error estándar: El error estándar mide la precisión de la estimación de la media muestral, mientras que el desvío estándar mide la dispersión de los datos subyacentes en sí.

Ojo con los valores atípicos

El desvío estándar es muy sensible a los valores atípicos extremos. Como la fórmula eleva al cuadrado las diferencias respecto a la media, un solo outlier muy grande puede inflar desproporcionadamente el desvío, haciendo que los datos parezcan más variables de lo que realmente son.

Sources

References and further authoritative reading used in preparing this article.

← Centro de Aprendizaje

Reading goal	What to focus on	Common mistake
Definition	What the metric is and what quantity it summarizes	Treating the formula as self-explanatory
Formula choice	Sample versus population assumptions and notation	Using n when n-1 is required or vice versa
Interpretation	Whether the result indicates concentration, spread, or risk	Calling a large value good or bad without context