Σ
SDCalc
DébutantFundamentals·9 min

Qu'est-ce que l'écart type ? Définition, formule et exemples

Découvrez ce qu'est l'écart type, comment le calculer pour des échantillons et des populations, et pourquoi il est crucial en analyse de données. Maîtrisez les formules dès aujourd'hui.

By Standard Deviation Calculator Team · Data Science Team·Published

Qu'est-ce que l'écart type ?

L'écart type est une mesure statistique qui quantifie l'ampleur de la variation ou de la dispersion dans un ensemble de valeurs. Un faible écart type indique que les données ont tendance à être proches de la moyenne (valeur attendue) de l'ensemble, tandis qu'un écart type élevé indique que les données sont réparties sur une plage de valeurs plus large. Représenté par la lettre grecque σ (sigma) pour les populations et par s pour les échantillons, il s'agit de l'un des concepts les plus fondamentaux en statistiques descriptives.

Définition de base

L'écart type mesure la distance typique entre chaque donnée et la moyenne. Il vous indique, en moyenne, dans quelle mesure vos données s'éloignent du centre.

Écart type de population vs écart type d'échantillon

Avant de calculer l'écart type, vous devez déterminer si vos données représentent une population entière ou un échantillon d'une population. Une population inclut tous les membres d'un groupe donné, alors qu'un échantillon est un sous-ensemble représentatif de ce groupe. Le calcul de l'écart type pour un échantillon nécessite un ajustement mathématique — utiliser n - 1 (degrés de liberté, ou df) au lieu de N — pour s'assurer que le résultat est un estimateur sans biais de la variance de la population.

Écart type de la population

Utilisé lorsque vous possédez les données pour le groupe entier. Désigné par σ. Le dénominateur dans la formule de la variance est N (la taille totale de la population).

Écart type de l'échantillon

Utilisé lorsque vous possédez un sous-ensemble du groupe. Désigné par s. Le dénominateur dans la formule de la variance est n - 1 (taille de l'échantillon moins un) pour corriger le biais.

Explication de la formule de l'écart type

Les formules de l'écart type reposent sur le calcul de la variance en premier, puis sur l'extraction de la racine carrée. Cette étape de racine carrée est cruciale car elle ramène la mesure de la dispersion dans les unités d'origine des données. Les composantes clés sont xᵢ (chaque valeur individuelle), μ ou (la moyenne de la population ou de l'échantillon) et N ou n (le nombre total de valeurs).

Écart type de la population

σ = √[ Σ(xᵢ - μ)² / N ]

Écart type de l'échantillon

s = √[ Σ(xᵢ - x̄)² / (n - 1) ]

Exemple de calcul étape par étape

Calculons l'écart type d'un échantillon pour un petit jeu de données de résultats d'examens : [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]. En suivant la formule étape par étape, on voit comment la variance s'accumule avant de prendre la racine carrée finale.

1

Calculer la moyenne (x̄)

Additionner toutes les valeurs et diviser par le nombre total : (4+8+6+5+3+2+8+9+2+5) / 10 = 52 / 10 = 5,2
2

Soustraire la moyenne et élever le résultat au carré

Pour chaque valeur, trouver la différence au carré : (4-5,2)² = 1,44, (8-5,2)² = 7,84, (6-5,2)² = 0,64, etc.
3

Additionner les différences au carré

Additionner tous les résultats au carré : 1,44 + 7,84 + 0,64 + 0,04 + 4,84 + 10,24 + 7,84 + 14,44 + 10,24 + 0,04 = 57,6
4

Diviser par n - 1 (degrés de liberté)

Diviser la somme par la taille de l'échantillon moins un : 57,6 / (10 - 1) = 57,6 / 9 = 6,4. Il s'agit de la variance de l'échantillon (σ²).
5

Prendre la racine carrée

Trouver la racine carrée de la variance : √6,4 ≈ 2,53. L'écart type de l'échantillon est donc de 2,53.

Calcul de l'écart type en Python

Calculer l'écart type manuellement est source d'erreurs, en particulier avec de grands jeux de données. En pratique, les statisticiens et les scientifiques des données utilisent des langages de programmation comme Python pour le calculer instantanément à l'aide de bibliothèques intégrées.

python
import statistics

data = [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]

# Calculer l'écart type de l'échantillon (par défaut)
sample_sd = statistics.stdev(data)
print(f"Sample SD: {sample_sd:.2f}")

# Calculer l'écart type de la population
pop_sd = statistics.pstdev(data)
print(f"Population SD: {pop_sd:.2f}")

La règle empirique et l'écart type

Lorsque les données suivent une distribution normale (courbe en cloche), l'écart type devient incroyablement prédictif. La règle empirique, également connue sous le nom de règle 68-95-99,7, stipule que presque toutes les données se situent à moins de trois écarts types de la moyenne. Cela permet aux analystes d'identifier rapidement les valeurs aberrantes et de comprendre la probabilité qu'une observation spécifique se produise.

Intervalle depuis la moyennePourcentage des donnéesApplication
±1σ68,27 %Identifier les valeurs typiques et quotidiennes
±2σ95,45 %Établir des intervalles de confiance
±3σ99,73 %Détecter les valeurs aberrantes extrêmes

Écart type vs variance

La variance et l'écart type sont des mesures de dispersion étroitement liées. La variance (σ² ou s²) est la moyenne des carrés des écarts à la moyenne, tandis que l'écart type est la racine carrée de la variance. Étant donné que la variance est exprimée en unités au carré (par exemple, en dollars carrés, en centimètres carrés), elle peut être difficile à interpréter dans le contexte des données d'origine. L'écart type résout ce problème en reconvertissant la mesure dans les unités d'origine.

Présenter vos données

Indiquez toujours l'écart type en même temps que la moyenne lorsque vous décrivez vos données. Étant donné que l'écart type est exprimé dans les mêmes unités que la moyenne (par exemple, en dollars, en centimètres, en kilogrammes), il fournit une mesure intuitive de la dispersion que votre public peut comprendre immédiatement.

Pièges courants à éviter

Bien que l'écart type soit un outil puissant, il est souvent mal utilisé. Une mauvaise application des formules ou une mauvaise compréhension de ce que la valeur représente peut entraîner une analyse de données biaisée et des conclusions incorrectes.

  • Utiliser la formule de la population pour un échantillon : Oublier d'utiliser n - 1 pour les échantillons réduit artificiellement la dispersion calculée, sous-estimant ainsi la véritable variance de la population.
  • Appliquer l'écart type à des distributions non normales : La règle empirique ne s'applique qu'aux distributions normales. Pour des données fortement asymétriques, l'écart type pourrait ne pas refléter avec précision la dispersion.
  • Confondre l'écart type avec l'erreur type : L'erreur type mesure la précision de l'estimation de la moyenne d'un échantillon, tandis que l'écart type mesure la dispersion des données sous-jacentes elles-mêmes.

Attention aux valeurs aberrantes

L'écart type est très sensible aux valeurs aberrantes extrêmes. Étant donné que la formule met au carré les écarts par rapport à la moyenne, une seule valeur aberrante massive peut gonfler disproportionnément l'écart type, donnant l'impression que les données sont plus variables qu'elles ne le sont en réalité.

Further Reading

Sources

References and further authoritative reading used in preparing this article.

  1. Wikipédia : Écart type
  2. Manuel électronique des méthodes statistiques du NIST/SEMATECH
  3. Khan Academy : Statistiques et probabilités