Glosario Estadístico

Términos y definiciones estadísticas clave

general

Desviación Estándar (σ / s)

Una medida de la cantidad de variación o dispersión en un conjunto de valores. Es la raíz cuadrada de la varianza y se expresa en las mismas unidades que los datos.

Varianza (σ² / s²)

El promedio de las diferencias al cuadrado respecto a la media. La varianza cuantifica el grado de dispersión en un conjunto de datos y es el cuadrado de la desviación estándar.

Media (μ / x̄)

El promedio aritmético de un conjunto de valores, calculado sumando todos los valores y dividiendo por la cantidad. Representa la tendencia central de los datos.

Mediana

El valor central en un conjunto de datos ordenado. Si hay un número par de valores, la mediana es el promedio de los dos valores centrales. Es resistente a los valores atípicos.

Moda

El valor que aparece con más frecuencia en un conjunto de datos. Un conjunto de datos puede tener una moda (unimodal), varias modas (multimodal) o ninguna moda.

Rango

La diferencia entre el valor más grande y el más pequeño en un conjunto de datos. Aunque es simple de calcular, solo considera los dos valores extremos y es sensible a los valores atípicos.

Población

El conjunto completo de todos los individuos u observaciones de interés en un estudio. Los parámetros poblacionales se denotan típicamente con letras griegas (μ, σ).

Muestra

Un subconjunto de una población seleccionado para su análisis. Las estadísticas muestrales se denotan típicamente con letras latinas (x̄, s) y se utilizan para estimar los parámetros poblacionales.

Corrección de Bessel

El uso de n−1 en lugar de n en el denominador al calcular la varianza muestral. Esta corrección proporciona una estimación insesgada de la varianza poblacional a partir de una muestra.

Distribución Normal

Una distribución de probabilidad simétrica en forma de campana donde la media, la mediana y la moda son iguales. Muchos fenómenos naturales siguen una distribución aproximadamente normal.

Regla Empírica (68-95-99,7)

Para datos con distribución normal, aproximadamente el 68 % de los valores caen dentro de ±1σ, el 95 % dentro de ±2σ y el 99,7 % dentro de ±3σ de la media.

Puntuación Z (Z-Score)

El número de desviaciones estándar que un punto de datos dista de la media, calculado como Z = (X − μ) / σ. Las puntuaciones Z permiten comparar valores de diferentes distribuciones.

Error Estándar (SE)

La desviación estándar de la distribución muestral de una estadística, más comúnmente la media. SE = σ/√n, disminuye a medida que aumenta el tamaño de la muestra.

Intervalo de Confianza

Un rango de valores que probablemente contiene el verdadero parámetro poblacional con un nivel de confianza especificado (por ejemplo, 95 %). Intervalos más amplios indican menor precisión.

Valor Atípico

Un punto de datos significativamente diferente de otras observaciones. Los métodos de detección comunes incluyen valores más allá de ±2 o ±3 desviaciones estándar de la media.

Coeficiente de Variación (CV)

La razón entre la desviación estándar y la media, expresada como porcentaje (CV = σ/μ × 100 %). Permite comparar la variabilidad entre conjuntos de datos con diferentes escalas.

Asimetría

Una medida de la asimetría de una distribución de probabilidad. La asimetría positiva significa que la cola se extiende hacia la derecha; la asimetría negativa significa que se extiende hacia la izquierda.

Curtosis

Una medida del peso de las colas de una distribución de probabilidad. Alta curtosis indica colas pesadas y un pico pronunciado; baja curtosis indica colas ligeras y un pico plano.

Grados de Libertad (df)

El número de valores independientes que pueden variar en un cálculo estadístico. Para la desviación estándar muestral, df = n − 1, reflejando la corrección de Bessel.

Teorema del Límite Central

Establece que la distribución muestral de la media muestral se aproxima a una distribución normal a medida que aumenta el tamaño de la muestra, independientemente de la distribución de la población.

Prueba de Hipótesis

Un método estadístico para tomar decisiones basadas en datos. Implica comparar un estadístico de prueba con un valor crítico o valor p para determinar si se debe rechazar la hipótesis nula.

Valor P

La probabilidad de observar un resultado tan extremo como el estadístico de prueba, suponiendo que la hipótesis nula es verdadera. Valores p más pequeños proporcionan evidencia más fuerte contra la hipótesis nula.

Coeficiente de Correlación (r)

Un valor entre −1 y 1 que mide la fuerza y dirección de la relación lineal entre dos variables. Valores cercanos a ±1 indican una fuerte relación lineal.

Rango Intercuartílico (IQR)

La diferencia entre el percentil 75 (Q3) y el percentil 25 (Q1). El IQR mide la dispersión del 50 % central de los datos y es resistente a los valores atípicos.

Percentil

Un valor por debajo del cual cae un porcentaje dado de observaciones. Por ejemplo, el percentil 90 es el valor por debajo del cual se encuentran el 90 % de los puntos de datos.