Σ
SDCalc
PrincipianteFundamentals·9 min

¿Qué es la desviación típica? Definición, fórmula y ejemplos

Aprende qué es la desviación típica, cómo calcularla para muestras y poblaciones, y por qué es crucial en análisis de datos. Domina las fórmulas hoy.

By Standard Deviation Calculator Team · Data Science Team·Published

¿Qué es la desviación típica?

La desviación típica es una medida estadística que cuantifica la cantidad de variación o dispersión en un conjunto de valores. Una desviación típica baja indica que los datos tienden a estar cerca de la media (valor esperado) del conjunto, mientras que una alta indica que los datos están más dispersos en un rango más amplio. Representada por la letra griega σ (sigma) para poblaciones y por s para muestras, es uno de los conceptos más fundamentales en estadística descriptiva.

Definición clave

La desviación típica mide la distancia habitual de cada dato respecto a la media. Te indica, por término medio, cuánto se desvían tus datos del centro.

Desviación típica poblacional frente a muestral

Antes de calcular la desviación típica, debes determinar si tus datos representan una población entera o una muestra de dicha población. Una población incluye a todos los miembros de un grupo definido, mientras que una muestra es un subconjunto representativo de ese grupo. Calcular la desviación típica de una muestra requiere un ajuste matemático: usar n - 1 (grados de libertad, o df) en lugar de N, para asegurar que el resultado sea un estimador insesgado de la varianza poblacional.

Desviación típica poblacional

Se usa cuando tienes los datos de todo el grupo. Se denota con σ. El denominador en la fórmula de la varianza es N (el tamaño total de la población).

Desviación típica muestral

Se usa cuando tienes un subconjunto del grupo. Se denota con s. El denominador en la fórmula de la varianza es n - 1 (tamaño de la muestra menos uno) para corregir el sesgo.

Explicación de la fórmula de la desviación típica

Las fórmulas de la desviación típica se basan en calcular primero la varianza y luego sacar la raíz cuadrada. Este paso es crucial porque devuelve la medida de dispersión a las unidades originales de los datos. Los componentes clave son xᵢ (cada valor individual), μ o (la media poblacional o muestral) y N o n (el número total de valores).

Desviación típica poblacional

σ = √[ Σ(xᵢ - μ)² / N ]

Desviación típica muestral

s = √[ Σ(xᵢ - x̄)² / (n - 1) ]

Ejemplo de cálculo paso a paso

Vamos a calcular la desviación típica muestral para un pequeño conjunto de notas de un examen: [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]. Siguiendo la fórmula paso a paso se observa cómo se acumula la varianza antes de sacar la raíz cuadrada final.

1

Calcular la media (x̄)

Suma todos los valores y divide por la cantidad: (4+8+6+5+3+2+8+9+2+5) / 10 = 52 / 10 = 5,2
2

Restar la media y elevar al cuadrado

Para cada valor, halla la diferencia al cuadrado: (4-5,2)² = 1,44, (8-5,2)² = 7,84, (6-5,2)² = 0,64, etc.
3

Sumar las diferencias al cuadrado

Suma todos los resultados al cuadrado: 1,44 + 7,84 + 0,64 + 0,04 + 4,84 + 10,24 + 7,84 + 14,44 + 10,24 + 0,04 = 57,6
4

Dividir por n - 1 (grados de libertad)

Divide la suma entre el tamaño de la muestra menos uno: 57,6 / (10 - 1) = 57,6 / 9 = 6,4. Esta es la varianza muestral (σ²).
5

Calcular la raíz cuadrada

Halla la raíz cuadrada de la varianza: √6,4 ≈ 2,53. La desviación típica muestral es 2,53.

Cálculo de la desviación típica en Python

Calcular la desviación típica a mano es propenso a errores, sobre todo con conjuntos de datos grandes. En la práctica, los estadísticos y científicos de datos usan lenguajes de programación como Python para calcularla al instante mediante librerías integradas.

python
import statistics

data = [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]

# Calcular la desviación típica muestral (por defecto)
sample_sd = statistics.stdev(data)
print(f"Sample SD: {sample_sd:.2f}")

# Calcular la desviación típica poblacional
pop_sd = statistics.pstdev(data)
print(f"Population SD: {pop_sd:.2f}")

La regla empírica y la desviación típica

Cuando los datos siguen una distribución normal (campana de Gauss), la desviación típica se vuelve sumamente predictiva. La regla empírica, también conocida como la regla 68-95-99,7, establece que casi todos los datos caerán dentro de tres desviaciones típicas respecto a la media. Esto permite a los analistas identificar rápidamente valores atípicos y comprender la probabilidad de que ocurra una observación específica.

Intervalo desde la mediaPorcentaje de datosAplicación
±1σ68,27%Identificar valores habituales del día a día
±2σ95,45%Establecer intervalos de confianza
±3σ99,73%Detectar valores atípicos extremos

Desviación típica frente a varianza

La varianza y la desviación típica son medidas de dispersión estrechamente relacionadas. La varianza (σ² o s²) es el promedio de las diferencias al cuadrado respecto a la media, mientras que la desviación típica es la raíz cuadrada de la varianza. Como la varianza se expresa en unidades al cuadrado (por ejemplo, euros al cuadrado, centímetros al cuadrado), puede ser difícil de interpretar en el contexto de los datos originales. La desviación típica resuelve esto devolviendo la medida a las unidades originales.

Al presentar tus datos

Siempre informa de la desviación típica junto a la media al describir tus datos. Como la DT está en las mismas unidades que la media (por ejemplo, euros, centímetros, kilogramos), proporciona una medida de dispersión intuitiva que tu audiencia entenderá de inmediato.

Errores comunes a evitar

Aunque la desviación típica es una herramienta muy potente, a menudo se usa mal. Aplicar mal las fórmulas o malinterpretar el valor puede llevar a análisis de datos defectuosos y conclusiones erróneas.

  • Usar la fórmula poblacional para una muestra: Olvidar usar n - 1 en las muestras reduce artificialmente la dispersión calculada, subestimando la varianza real de la población.
  • Aplicar la DT a distribuciones no normales: La regla empírica solo aplica a distribuciones normales. En datos muy asimétricos, la DT podría no reflejar bien la dispersión.
  • Confundir la DT con el Error Estándar: El error estándar mide la precisión de la estimación de una media muestral, mientras que la desviación típica mide la dispersión de los datos subyacentes en sí.

Cuidado con los valores atípicos

La desviación típica es muy sensible a los valores atípicos extremos. Como la fórmula eleva al cuadrado las diferencias respecto a la media, un solo valor atípico enorme puede desproporcionadamente inflar la desviación típica, haciendo que los datos parezcan más variables de lo que realmente son.

Further Reading

Sources

References and further authoritative reading used in preparing this article.

  1. Wikipedia: Desviación típica
  2. Manual electrónico de Métodos Estadísticos NIST/SEMATECH
  3. Khan Academy: Estadística y probabilidad