Qu'est-ce que la formule de l'écart type ?
La formule de l'écart type est l'équation mathématique utilisée pour quantifier l'ampleur de la variation ou de la dispersion dans un ensemble de données. Un écart type faible indique que les valeurs ont tendance à être proches de la moyenne (μ ou x̄), tandis qu'un écart type élevé indique qu'elles sont réparties sur une plage de valeurs plus large.
En statistiques, la formule à utiliser dépend du fait que vous travailliez sur une population entière ou sur un échantillon issu de cette population. Le concept clé consiste à calculer la moyenne des carrés des écarts par rapport à la moyenne, connue sous le nom de variance (σ²), puis à en prendre la racine carrée pour ramener la mesure aux unités d'origine.
Écart type de la population
- σ (sigma) : Écart type de la population
- Σ (sigma) : Somme de...
- xi : Chaque valeur individuelle du jeu de données
- μ (mu) : Moyenne de la population
- N : Nombre total de valeurs dans la population
Écart type de la population vs. de l'échantillon
Dans l'analyse de données réelles, il est rare de disposer des données d'une population entière. La plupart du temps, nous collectons un échantillon pour faire des déductions sur la population plus large. Étant donné qu'un échantillon ne fait qu'estimer la moyenne de la population, le calcul de l'écart type à l'aide de la formule de la population sur un échantillon sous-estime systématiquement la variabilité réelle. Pour corriger ce biais, nous utilisons la formule de l'écart type de l'échantillon.
Écart type de l'échantillon
Ne confondez pas les formules !
Calcul de la formule étape par étape
Calculer l'écart type à la main nécessite une approche systématique. En suivant ces étapes, vous pouvez calculer avec précision l'écart type de la population ou de l'échantillon pour n'importe quel jeu de données.
Calculez la moyenne
Trouvez les écarts
Élevez les écarts au carré
Faites la somme des écarts au carré
Divisez par N ou n-1
Prenez la racine carrée
Pourquoi la formule de l'échantillon divise-t-elle par n-1 ?
Diviser par n-1 au lieu de n est un concept connu sous le nom de correction de Bessel. Étant donné que la moyenne de l'échantillon (x̄) est calculée à partir des données de l'échantillon elles-mêmes, les écarts (xi - x̄) sont mathématiquement contraints de s'additionner à zéro. Cela signifie que les valeurs sont légèrement plus proches de la moyenne de l'échantillon qu'elles ne le sont de la véritable moyenne de la population (μ).
En divisant par n-1 (les degrés de liberté), nous gonflons la variance juste assez pour compenser cette sous-estimation, fournissant ainsi un estimateur sans biais de la variance de la population.
Further Reading
Sources
References and further authoritative reading used in preparing this article.