Qu'est-ce que la formule de l'écart type ?
La formule de l'écart type est l'équation mathématique utilisée pour quantifier l'ampleur de la variation ou de la dispersion dans un ensemble de données. Un écart type faible indique que les données tendent à se regrouper près de la moyenne (μ ou x̄), tandis qu'un écart type élevé indique que les données sont dispersées sur une plus grande plage de valeurs.
En statistiques, la formule utilisée dépend de si vous travaillez avec une population entière ou avec un échantillon tiré de cette population. Le concept fondamental consiste à calculer la moyenne des écarts carrés par rapport à la moyenne, appelée la variance (σ²), puis à extraire la racine carrée pour ramener la mesure dans les unités d'origine.
Écart type de la population
- σ (sigma) : Écart type de la population
- Σ (sigma) : Somme de...
- xi : Chaque valeur individuelle dans l'ensemble de données
- μ (mu) : Moyenne de la population
- N : Nombre total de points de données dans la population
Écart type de la population vs. de l'échantillon
Dans l'analyse de données réelles, il est rare d'avoir des données pour une population entière. La plupart du temps, nous recueillons un échantillon pour faire des inférences sur la population plus vaste. Puisqu'un échantillon ne fait qu'estimer la moyenne de la population, calculer l'écart type en appliquant la formule de la population à un échantillon sous-estime systématiquement la variabilité réelle. Pour corriger ce biais, nous utilisons la formule de l'écart type de l'échantillon.
Écart type de l'échantillon
Ne mélangez pas vos formules !
Calcul de la formule étape par étape
Calculer l'écart type manuellement exige une approche systématique. En suivant ces étapes, vous pouvez calculer avec précision l'écart type — de la population ou de l'échantillon — pour n'importe quel ensemble de données.
Calculer la moyenne
Trouver les écarts
Calculer le carré des écarts
Sommer les écarts carrés
Diviser par N ou n-1
Prendre la racine carrée
Pourquoi la formule de l'échantillon divise-t-elle par n-1 ?
Diviser par n-1 plutôt que par n est un concept appelé correction de Bessel. Puisque la moyenne de l'échantillon (x̄) est calculée à partir des données de l'échantillon elles-mêmes, les écarts (xi - x̄) sont mathématiquement forcés de s'additionner à zéro. Cela signifie que les points de données sont légèrement plus près de la moyenne de l'échantillon que de la véritable moyenne de la population (μ).
En divisant par n-1 (les degrés de liberté), nous augmentons la variance juste assez pour compenser cette sous-estimation, ce qui fournit un estimateur sans biais de la variance de la population.
Further Reading
Sources
References and further authoritative reading used in preparing this article.