Écart-type (σ / s)
Une mesure de la quantité de variation ou de dispersion dans un ensemble de valeurs. C'est la racine carrée de la variance et il est exprimé dans les mêmes unités que les données.
Termes et définitions statistiques clés
Une mesure de la quantité de variation ou de dispersion dans un ensemble de valeurs. C'est la racine carrée de la variance et il est exprimé dans les mêmes unités que les données.
La moyenne des carrés des écarts par rapport à la moyenne. La variance quantifie le degré de dispersion dans un ensemble de données et est le carré de l'écart-type.
La moyenne arithmétique d'un ensemble de valeurs, calculée en additionnant toutes les valeurs et en divisant par le nombre total. Elle représente la tendance centrale des données.
La valeur centrale dans un ensemble de données trié. S'il y a un nombre pair de valeurs, la médiane est la moyenne des deux valeurs centrales. Elle est résistante aux valeurs aberrantes.
La valeur qui apparaît le plus fréquemment dans un ensemble de données. Un ensemble de données peut avoir un mode (unimodal), plusieurs modes (multimodal) ou aucun mode du tout.
La différence entre la plus grande et la plus petite valeur dans un ensemble de données. Bien que simple à calculer, elle ne considère que les deux valeurs extrêmes et est sensible aux valeurs aberrantes.
L'ensemble complet de tous les individus ou observations d'intérêt dans une étude. Les paramètres de population sont généralement désignés par des lettres grecques (μ, σ).
Un sous-ensemble d'une population sélectionné pour analyse. Les statistiques d'échantillon sont généralement désignées par des lettres latines (x̄, s) et sont utilisées pour estimer les paramètres de la population.
L'utilisation de n−1 au lieu de n au dénominateur lors du calcul de la variance d'échantillon. Cette correction fournit une estimation non biaisée de la variance de la population à partir d'un échantillon.
Une distribution de probabilité symétrique en forme de cloche où la moyenne, la médiane et le mode sont tous égaux. De nombreux phénomènes naturels suivent une distribution approximativement normale.
Pour des données normalement distribuées, environ 68 % des valeurs se situent dans ±1σ, 95 % dans ±2σ et 99,7 % dans ±3σ de la moyenne.
Le nombre d'écarts-types entre un point de données et la moyenne, calculé comme Z = (X − μ) / σ. Les scores Z permettent de comparer des valeurs provenant de différentes distributions.
L'écart-type de la distribution d'échantillonnage d'une statistique, le plus souvent la moyenne. SE = σ/√n, diminuant à mesure que la taille de l'échantillon augmente.
Une plage de valeurs susceptible de contenir le vrai paramètre de population avec un niveau de confiance spécifié (par ex., 95 %). Des intervalles plus larges indiquent moins de précision.
Un point de données significativement différent des autres observations. Les méthodes de détection courantes incluent les valeurs au-delà de ±2 ou ±3 écarts-types de la moyenne.
Le rapport de l'écart-type à la moyenne, exprimé en pourcentage (CV = σ/μ × 100%). Il permet de comparer la variabilité entre des ensembles de données ayant des échelles différentes.
Une mesure de l'asymétrie d'une distribution de probabilité. Une asymétrie positive signifie que la queue s'étend vers la droite ; une asymétrie négative signifie qu'elle s'étend vers la gauche.
Une mesure de l'épaisseur des queues d'une distribution de probabilité. Un kurtosis élevé indique des queues lourdes et un pic prononcé ; un kurtosis faible indique des queues légères et un pic aplati.
Le nombre de valeurs indépendantes pouvant varier dans un calcul statistique. Pour l'écart-type d'échantillon, df = n − 1, reflétant la correction de Bessel.
Stipule que la distribution d'échantillonnage de la moyenne d'échantillon tend vers une distribution normale à mesure que la taille de l'échantillon augmente, quelle que soit la distribution de la population.
Une méthode statistique pour prendre des décisions basées sur les données. Elle consiste à comparer une statistique de test à une valeur critique ou une valeur p pour déterminer s'il faut rejeter l'hypothèse nulle.
La probabilité d'observer un résultat aussi extrême que la statistique de test, en supposant que l'hypothèse nulle est vraie. Des valeurs p plus petites fournissent des preuves plus fortes contre l'hypothèse nulle.
Une valeur entre −1 et 1 qui mesure la force et la direction de la relation linéaire entre deux variables. Des valeurs proches de ±1 indiquent une forte relation linéaire.
La différence entre le 75e percentile (Q3) et le 25e percentile (Q1). L'IQR mesure la dispersion des 50 % centraux des données et est résistant aux valeurs aberrantes.
Une valeur en dessous de laquelle un pourcentage donné d'observations se situe. Par exemple, le 90e percentile est la valeur en dessous de laquelle se trouvent 90 % des points de données.