Σ
SDCalc
DébutantFundamentals·9 min

Qu'est-ce que l'écart type ? Définition, formule et exemples

Apprenez ce qu'est l'écart type, comment le calculer pour un échantillon et une population, et pourquoi il est crucial en analyse de données. Maîtrisez les formules.

By Standard Deviation Calculator Team · Data Science Team·Published

Qu'est-ce que l'écart type ?

L'écart type est une mesure statistique qui quantifie l'ampleur de la variation ou de la dispersion dans un ensemble de valeurs. Un écart type faible indique que les données tendent à être proches de la moyenne (espérance mathématique) de l'ensemble, tandis qu'un écart type élevé indique que les valeurs sont étalées sur une plage plus large. Représenté par la lettre grecque σ (sigma) pour les populations et s pour les échantillons, c'est l'un des concepts les plus fondamentaux en statistiques descriptives.

Définition clé

L'écart type mesure la distance typique de chaque point de données par rapport à la moyenne. Il vous indique, en moyenne, dans quelle mesure vos données s'écartent du centre.

Écart type de population vs échantillon

Avant de calculer l'écart type, vous devez déterminer si vos données représentent une population entière ou un échantillon d'une population. Une population inclut tous les membres d'un groupe spécifié, tandis qu'un échantillon est un sous-ensemble représentatif de ce groupe. Le calcul de l'écart type pour un échantillon nécessite un ajustement mathématique — utiliser n - 1 (degrés de liberté, ou df) au lieu de N — pour garantir que le résultat soit un estimateur sans biais de la variance de la population.

Écart type de population

Utilisé lorsque vous possédez les données de l'ensemble du groupe. Désigné par σ. Le dénominateur dans la formule de la variance est N (la taille totale de la population).

Écart type d'échantillon

Utilisé lorsque vous avez un sous-ensemble du groupe. Désigné par s. Le dénominateur dans la formule de la variance est n - 1 (taille de l'échantillon moins un) pour corriger le biais.

Explication de la formule de l'écart type

Les formules de l'écart type reposent sur le calcul préalable de la variance, puis sur l'extraction de la racine carrée. Cette étape de racine carrée est cruciale car elle ramène la mesure de dispersion dans les unités d'origine des données. Les composants clés sont xᵢ (chaque valeur individuelle), μ ou (la moyenne de la population ou de l'échantillon), et N ou n (le nombre total de valeurs).

Écart type de population

σ = √[ Σ(xᵢ - μ)² / N ]

Écart type d'échantillon

s = √[ Σ(xᵢ - x̄)² / (n - 1) ]

Exemple de calcul étape par étape

Calculons l'écart type d'échantillon pour un petit jeu de données de notes à un examen : [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]. En suivant la formule étape par étape, on voit comment la variance s'accumule avant que l'on ne prenne la racine carrée finale.

1

Calculer la moyenne (x̄)

Additionnez toutes les valeurs et divisez par l'effectif : (4+8+6+5+3+2+8+9+2+5) / 10 = 52 / 10 = 5,2
2

Soustraire la moyenne et élever au carré

Pour chaque valeur, calculez l'écart au carré : (4-5,2)² = 1,44, (8-5,2)² = 7,84, (6-5,2)² = 0,64, etc.
3

Additionner les écarts au carré

Faites la somme de tous les résultats au carré : 1,44 + 7,84 + 0,64 + 0,04 + 4,84 + 10,24 + 7,84 + 14,44 + 10,24 + 0,04 = 57,6
4

Diviser par n - 1 (Degrés de liberté)

Divisez la somme par la taille de l'échantillon moins un : 57,6 / (10 - 1) = 57,6 / 9 = 6,4. Il s'agit de la variance de l'échantillon (σ²).
5

Prendre la racine carrée

Calculez la racine carrée de la variance : √6,4 ≈ 2,53. L'écart type de l'échantillon est de 2,53.

Calcul de l'écart type en Python

Le calcul manuel de l'écart type est source d'erreurs, en particulier avec de grands jeux de données. En pratique, les statisticiens et les data scientists utilisent des langages de programmation comme Python pour le calculer instantanément à l'aide de bibliothèques intégrées.

python
import statistics

data = [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]

# Calcul de l'écart type de l'échantillon (par défaut)
sample_sd = statistics.stdev(data)
print(f"Sample SD: {sample_sd:.2f}")

# Calcul de l'écart type de la population
pop_sd = statistics.pstdev(data)
print(f"Population SD: {pop_sd:.2f}")

La règle empirique et l'écart type

Lorsque les données suivent une distribution normale (courbe en cloche), l'écart type devient extrêmement prédictif. La règle empirique, également connue sous le nom de règle 68-95-99,7, stipule que la quasi-totalité des données se situera à moins de trois écarts types de la moyenne. Cela permet aux analystes d'identifier rapidement les valeurs aberrantes et de comprendre la probabilité d'apparition d'une observation spécifique.

Intervalle depuis la moyennePourcentage des donnéesApplication
±1σ68,27 %Identifier les valeurs typiques du quotidien
±2σ95,45 %Définir des intervalles de confiance
±3σ99,73 %Détecter les valeurs aberrantes extrêmes

Écart type vs Variance

La variance et l'écart type sont des mesures de dispersion étroitement liées. La variance (σ² ou s²) est la moyenne des carrés des écarts à la moyenne, tandis que l'écart type est la racine carrée de la variance. Étant donné que la variance s'exprime en unités carrées (par exemple, des euros au carré, des centimètres carrés), elle peut être difficile à interpréter dans le contexte des données d'origine. L'écart type résout ce problème en reconvertissant la mesure dans les unités de départ.

Présenter vos données

Indiquez toujours l'écart type alongside la moyenne lors de la description de vos données. Comme l'écart type est exprimé dans les mêmes unités que la moyenne (par exemple, des euros, des centimètres, des kilogrammes), il fournit une mesure intuitive de la dispersion que votre public peut comprendre immédiatement.

Pièges courants à éviter

Bien que l'écart type soit un outil puissant, il est souvent mal utilisé. Une mauvaise application des formules ou une mauvaise compréhension de ce que la valeur représente peut conduire à des analyses de données erronées et à des conclusions incorrectes.

  • Utiliser la formule de population pour un échantillon : Oublier d'utiliser n - 1 pour les échantillons réduit artificiellement la dispersion calculée, sous-estimant ainsi la véritable variance de la population.
  • Appliquer l'écart type à des distributions non normales : La règle empirique ne s'applique qu'aux distributions normales. Pour des données fortement asymétriques, l'écart type peut ne pas refléter fidèlement la dispersion.
  • Confondre l'écart type avec l'erreur type : L'erreur type mesure la précision de l'estimation d'une moyenne d'échantillon, tandis que l'écart type mesure la dispersion des données sous-jacentes elles-mêmes.

Attention aux valeurs aberrantes

L'écart type est très sensible aux valeurs aberrantes extrêmes. Étant donné que la formule élève au carré les écarts par rapport à la moyenne, une seule valeur aberrante massive peut gonfler disproportionnellement l'écart type, donnant l'impression que les données sont plus variables qu'elles ne le sont réellement.

Further Reading

Sources

References and further authoritative reading used in preparing this article.

  1. Wikipédia : Écart type
  2. Manuel de méthodes statistiques NIST/SEMATECH e-Handbook
  3. Khan Academy : Statistiques et probabilités

How to Read This Article

A statistics tutorial is a practical interpretation guide, not just a formula dump. It refers to the assumptions, notation, and reporting language that analysts need when they explain a result to a teacher, manager, client, or reviewer. The article body covers the specific topic, while the sections below create a common interpretation frame that readers can reuse across related metrics.

Reading goalWhat to focus onCommon mistake
DefinitionWhat the metric is and what quantity it summarizesTreating the formula as self-explanatory
Formula choiceSample versus population assumptions and notationUsing n when n-1 is required or vice versa
InterpretationWhether the result indicates concentration, spread, or riskCalling a large value good or bad without context

Frequently Asked Questions

How should I interpret a high standard deviation?

A high standard deviation means the observations are spread farther from the mean on average. Whether that spread is acceptable depends on the context: wide dispersion might signal risk in finance, instability in manufacturing, or genuine natural variation in scientific data.

Why do some articles mention n while others mention n-1?

The denominator reflects the difference between population and sample formulas. Population variance and population standard deviation use N because the full dataset is known. Sample variance and sample standard deviation often use n-1 because Bessel’s correction reduces bias when estimating population spread from a sample.

What is a statistical interpretation guide?

A statistical interpretation guide is a page that moves beyond arithmetic and explains meaning. It tells you what a metric is, when the formula applies, and how to describe the result in plain English without overstating certainty.

Can I cite this article in a report?

You should cite the underlying authoritative reference for formal work whenever possible. This page is best used as an explanatory bridge that helps you understand the concept before quoting the original standard or handbook.

Why include direct citations on every article page?

Direct citations give readers a route to verify the definition, notation, and assumptions. That improves trust and reduces the chance that a simplified explanation is mistaken for the entire technical standard.

Authoritative References

These sources define the concepts referenced most often across our articles. Bessel's correction is a sample adjustment, variance is a squared measure of spread, and standard deviation is the square root of variance expressed in the same units as the data.