Glosario Estadístico
Términos y definiciones estadísticas clave
Desviación Estándar (σ / s)
Una medida de la cantidad de variación o dispersión en un conjunto de valores. Es la raíz cuadrada de la varianza y se expresa en las mismas unidades que los datos.
Varianza (σ² / s²)
El promedio de las diferencias al cuadrado respecto a la media. La varianza cuantifica el grado de dispersión en un conjunto de datos y es el cuadrado de la desviación estándar.
Media (μ / x̄)
El promedio aritmético de un conjunto de valores, calculado sumando todos los valores y dividiendo entre la cantidad. Representa la tendencia central de los datos.
Mediana
El valor central en un conjunto de datos ordenado. Si hay un número par de valores, la mediana es el promedio de los dos valores centrales. Es resistente a los valores atípicos.
Moda
El valor que aparece con más frecuencia en un conjunto de datos. Un conjunto de datos puede tener una moda (unimodal), varias modas (multimodal) o ninguna moda.
Rango
La diferencia entre el valor más grande y el más pequeño en un conjunto de datos. Aunque es simple de calcular, solo toma en cuenta los dos valores extremos y es sensible a los valores atípicos.
Población
El conjunto completo de todos los individuos u observaciones de interés en un estudio. Los parámetros poblacionales se denotan típicamente con letras griegas (μ, σ).
Muestra
Un subconjunto de una población seleccionado para su análisis. Las estadísticas muestrales se denotan típicamente con letras latinas (x̄, s) y se usan para estimar los parámetros poblacionales.
Corrección de Bessel
El uso de n−1 en lugar de n en el denominador al calcular la varianza muestral. Esta corrección proporciona una estimación insesgada de la varianza poblacional a partir de una muestra.
Distribución Normal
Una distribución de probabilidad simétrica en forma de campana donde la media, la mediana y la moda son iguales. Muchos fenómenos naturales siguen una distribución aproximadamente normal.
Regla Empírica (68-95-99.7)
Para datos con distribución normal, aproximadamente el 68 % de los valores caen dentro de ±1σ, el 95 % dentro de ±2σ y el 99.7 % dentro de ±3σ de la media.
Puntaje Z (Z-Score)
El número de desviaciones estándar que un punto de datos dista de la media, calculado como Z = (X − μ) / σ. Los puntajes Z permiten comparar valores de diferentes distribuciones.
Error Estándar (SE)
La desviación estándar de la distribución muestral de una estadística, más comúnmente la media. SE = σ/√n, disminuye conforme aumenta el tamaño de la muestra.
Intervalo de Confianza
Un rango de valores que probablemente contiene el verdadero parámetro poblacional con un nivel de confianza especificado (por ejemplo, 95 %). Intervalos más amplios indican menor precisión.
Valor Atípico
Un punto de datos significativamente diferente de otras observaciones. Los métodos de detección comunes incluyen valores más allá de ±2 o ±3 desviaciones estándar de la media.
Coeficiente de Variación (CV)
La razón entre la desviación estándar y la media, expresada como porcentaje (CV = σ/μ × 100 %). Permite comparar la variabilidad entre conjuntos de datos con diferentes escalas.
Asimetría
Una medida de la asimetría de una distribución de probabilidad. La asimetría positiva significa que la cola se extiende hacia la derecha; la asimetría negativa significa que se extiende hacia la izquierda.
Curtosis
Una medida del peso de las colas de una distribución de probabilidad. Alta curtosis indica colas pesadas y un pico pronunciado; baja curtosis indica colas ligeras y un pico plano.
Grados de Libertad (df)
El número de valores independientes que pueden variar en un cálculo estadístico. Para la desviación estándar muestral, df = n − 1, reflejando la corrección de Bessel.
Teorema del Límite Central
Establece que la distribución muestral de la media muestral se aproxima a una distribución normal conforme aumenta el tamaño de la muestra, sin importar la distribución de la población.
Prueba de Hipótesis
Un método estadístico para tomar decisiones basadas en datos. Implica comparar un estadístico de prueba con un valor crítico o valor p para determinar si se debe rechazar la hipótesis nula.
Valor P
La probabilidad de observar un resultado tan extremo como el estadístico de prueba, suponiendo que la hipótesis nula es verdadera. Valores p más pequeños proporcionan evidencia más fuerte contra la hipótesis nula.
Coeficiente de Correlación (r)
Un valor entre −1 y 1 que mide la fuerza y dirección de la relación lineal entre dos variables. Valores cercanos a ±1 indican una fuerte relación lineal.
Rango Intercuartílico (IQR)
La diferencia entre el percentil 75 (Q3) y el percentil 25 (Q1). El IQR mide la dispersión del 50 % central de los datos y es resistente a los valores atípicos.
Percentil
Un valor por debajo del cual cae un porcentaje dado de observaciones. Por ejemplo, el percentil 90 es el valor por debajo del cual se encuentran el 90 % de los puntos de datos.