Desviación Estándar (σ / s)
Una medida de la cantidad de variación o dispersión en un conjunto de valores. Es la raíz cuadrada de la varianza y se expresa en las mismas unidades que los datos.
Términos y definiciones estadísticas clave
Una medida de la cantidad de variación o dispersión en un conjunto de valores. Es la raíz cuadrada de la varianza y se expresa en las mismas unidades que los datos.
El promedio de las diferencias al cuadrado respecto a la media. La varianza cuantifica el grado de dispersión en un conjunto de datos y es el cuadrado de la desviación estándar.
El promedio aritmético de un conjunto de valores, calculado sumando todos los valores y dividiendo por la cantidad. Representa la tendencia central de los datos.
El valor central en un conjunto de datos ordenado. Si hay un número par de valores, la mediana es el promedio de los dos valores centrales. Es resistente a los valores atípicos.
El valor que aparece con más frecuencia en un conjunto de datos. Un conjunto de datos puede tener una moda (unimodal), varias modas (multimodal) o ninguna moda.
La diferencia entre el valor más grande y el más pequeño en un conjunto de datos. Aunque es simple de calcular, solo considera los dos valores extremos y es sensible a los valores atípicos.
El conjunto completo de todos los individuos u observaciones de interés en un estudio. Los parámetros poblacionales se denotan típicamente con letras griegas (μ, σ).
Un subconjunto de una población seleccionado para su análisis. Las estadísticas muestrales se denotan típicamente con letras latinas (x̄, s) y se utilizan para estimar los parámetros poblacionales.
El uso de n−1 en lugar de n en el denominador al calcular la varianza muestral. Esta corrección proporciona una estimación insesgada de la varianza poblacional a partir de una muestra.
Una distribución de probabilidad simétrica en forma de campana donde la media, la mediana y la moda son iguales. Muchos fenómenos naturales siguen una distribución aproximadamente normal.
Para datos con distribución normal, aproximadamente el 68 % de los valores caen dentro de ±1σ, el 95 % dentro de ±2σ y el 99,7 % dentro de ±3σ de la media.
El número de desviaciones estándar que un punto de datos dista de la media, calculado como Z = (X − μ) / σ. Las puntuaciones Z permiten comparar valores de diferentes distribuciones.
La desviación estándar de la distribución muestral de una estadística, más comúnmente la media. SE = σ/√n, disminuye a medida que aumenta el tamaño de la muestra.
Un rango de valores que probablemente contiene el verdadero parámetro poblacional con un nivel de confianza especificado (por ejemplo, 95 %). Intervalos más amplios indican menor precisión.
Un punto de datos significativamente diferente de otras observaciones. Los métodos de detección comunes incluyen valores más allá de ±2 o ±3 desviaciones estándar de la media.
La razón entre la desviación estándar y la media, expresada como porcentaje (CV = σ/μ × 100 %). Permite comparar la variabilidad entre conjuntos de datos con diferentes escalas.
Una medida de la asimetría de una distribución de probabilidad. La asimetría positiva significa que la cola se extiende hacia la derecha; la asimetría negativa significa que se extiende hacia la izquierda.
Una medida del peso de las colas de una distribución de probabilidad. Alta curtosis indica colas pesadas y un pico pronunciado; baja curtosis indica colas ligeras y un pico plano.
El número de valores independientes que pueden variar en un cálculo estadístico. Para la desviación estándar muestral, df = n − 1, reflejando la corrección de Bessel.
Establece que la distribución muestral de la media muestral se aproxima a una distribución normal a medida que aumenta el tamaño de la muestra, independientemente de la distribución de la población.
Un método estadístico para tomar decisiones basadas en datos. Implica comparar un estadístico de prueba con un valor crítico o valor p para determinar si se debe rechazar la hipótesis nula.
La probabilidad de observar un resultado tan extremo como el estadístico de prueba, suponiendo que la hipótesis nula es verdadera. Valores p más pequeños proporcionan evidencia más fuerte contra la hipótesis nula.
Un valor entre −1 y 1 que mide la fuerza y dirección de la relación lineal entre dos variables. Valores cercanos a ±1 indican una fuerte relación lineal.
La diferencia entre el percentil 75 (Q3) y el percentil 25 (Q1). El IQR mide la dispersión del 50 % central de los datos y es resistente a los valores atípicos.
Un valor por debajo del cual cae un porcentaje dado de observaciones. Por ejemplo, el percentil 90 es el valor por debajo del cual se encuentran el 90 % de los puntos de datos.