Σ
SDCalc
IntermédiaireFundamentals·9 min

Formule de l'écart type expliquée : guide étape par étape

Maîtrisez la formule de l'écart type grâce à notre guide étape par étape. Apprenez la différence entre les formules de population et d'échantillon, les calculs et les applications.

By Standard Deviation Calculator Team · Data Science Team·Published

Qu'est-ce que la formule de l'écart type ?

La formule de l'écart type est l'équation mathématique utilisée pour quantifier l'ampleur de la variation ou de la dispersion dans un ensemble de données. Un écart type faible indique que les données tendent à se regrouper près de la moyenne (μ ou x̄), tandis qu'un écart type élevé indique que les données sont dispersées sur une plus grande plage de valeurs.

En statistiques, la formule utilisée dépend de si vous travaillez avec une population entière ou avec un échantillon tiré de cette population. Le concept fondamental consiste à calculer la moyenne des écarts carrés par rapport à la moyenne, appelée la variance (σ²), puis à extraire la racine carrée pour ramener la mesure dans les unités d'origine.

Écart type de la population

σ = √[ Σ (xi - μ)² / N ]
  • σ (sigma) : Écart type de la population
  • Σ (sigma) : Somme de...
  • xi : Chaque valeur individuelle dans l'ensemble de données
  • μ (mu) : Moyenne de la population
  • N : Nombre total de points de données dans la population

Écart type de la population vs. de l'échantillon

Dans l'analyse de données réelles, il est rare d'avoir des données pour une population entière. La plupart du temps, nous recueillons un échantillon pour faire des inférences sur la population plus vaste. Puisqu'un échantillon ne fait qu'estimer la moyenne de la population, calculer l'écart type en appliquant la formule de la population à un échantillon sous-estime systématiquement la variabilité réelle. Pour corriger ce biais, nous utilisons la formule de l'écart type de l'échantillon.

Écart type de l'échantillon

s = √[ Σ (xi - x̄)² / (n - 1) ]

Ne mélangez pas vos formules !

Utiliser « N » pour un échantillon ou « n-1 » pour une population donnera une mesure de dispersion incorrecte. La formule de l'échantillon avec n-1 est connue sous le nom de correction de Bessel et est absolument nécessaire pour obtenir une estimation sans biais de la variance de la population.

Calcul de la formule étape par étape

Calculer l'écart type manuellement exige une approche systématique. En suivant ces étapes, vous pouvez calculer avec précision l'écart type — de la population ou de l'échantillon — pour n'importe quel ensemble de données.

1

Calculer la moyenne

Additionnez tous les points de données (Σxi) et divisez par le nombre total de points (N ou n) pour trouver la moyenne (μ ou x̄).
2

Trouver les écarts

Soustrayez la moyenne de chaque point de données individuel pour trouver l'écart : (xi - moyenne).
3

Calculer le carré des écarts

Élevez au carré chacun des écarts calculés à l'étape précédente : (xi - moyenne)². Cela garantit que toutes les valeurs sont positives.
4

Sommer les écarts carrés

Additionnez tous les écarts carrés pour trouver la somme des carrés : Σ(xi - moyenne)².
5

Diviser par N ou n-1

Pour une population, divisez par N. Pour un échantillon, divisez par (n - 1). Cela vous donne la variance (σ² ou s²).
6

Prendre la racine carrée

Extrayez la racine carrée de la variance pour trouver l'écart type (σ ou s).

Pourquoi la formule de l'échantillon divise-t-elle par n-1 ?

Diviser par n-1 plutôt que par n est un concept appelé correction de Bessel. Puisque la moyenne de l'échantillon (x̄) est calculée à partir des données de l'échantillon elles-mêmes, les écarts (xi - x̄) sont mathématiquement forcés de s'additionner à zéro. Cela signifie que les points de données sont légèrement plus près de la moyenne de l'échantillon que de la véritable moyenne de la population (μ).

En divisant par n-1 (les degrés de liberté), nous augmentons la variance juste assez pour compenser cette sous-estimation, ce qui fournit un estimateur sans biais de la variance de la population.

Further Reading

Sources

References and further authoritative reading used in preparing this article.

  1. e-Manuel des méthodes statistiques NIST/SEMATECH
  2. Écart type — Wikipédia
  3. Correction de Bessel