Deux façons de mesurer la dispersion
L’étendue et l’écart type mesurent toutes deux la dispersion des données, mais elles capturent des aspects fondamentalement différents. Savoir quand utiliser chacune est essentiel pour une analyse rigoureuse.
L’étendue vous informe sur les extrêmes — la distance entre la valeur la plus haute et la plus basse. L’écart type renseigne sur la dispersion typique autour de la moyenne. Les deux sont utiles, mais à des fins différentes.
Guide de décision rapide
Utilisez l’étendue quand ce sont les extrêmes qui comptent (limites de contrôle qualité, variation de température). Utilisez l’écart type quand vous vous intéressez à la variabilité typique et avez besoin de rigueur statistique.
Définitions et formules
Étendue
Étendue = Maximum - Minimum
La mesure de dispersion la plus simple. Ne considère que deux valeurs, quelle que soit la taille du jeu de données.
Écart type
s = √[Σ(xᵢ - x̄)² / (n-1)]
Utilise chaque observation pour mesurer la distance moyenne à la moyenne.
Comparaison directe
Avantages et inconvénients de l’étendue
Avantages :
- Calcul extrêmement simple — une soustraction
- Facile à comprendre et à communiquer
- Montre directement l’amplitude des données
- Utile pour les vérifications rapides de qualité
Inconvénients :
- Ignore toutes les valeurs intermédiaires
- Extrêmement sensible aux valeurs aberrantes
- Augmente avec la taille de l’échantillon
- Statistiquement inefficace
Avantages et inconvénients de l’écart type
Avantages :
- Utilise toutes les observations
- Statistiquement efficace et robuste
- Stable quand la taille de l’échantillon augmente
- Base des statistiques avancées
Inconvénients :
- Plus complexe à calculer à la main
- Moins intuitif pour les non-statisticiens
- Peut masquer des valeurs extrêmes importantes
- Toujours affecté par les valeurs aberrantes (utilisez le MAD)
Quand utiliser chacune
Utilisez l’étendue quand :
- Vous avez besoin d’une estimation rapide et approximative de la dispersion
- Ce sont les valeurs extrêmes qui importent (par ex. plage de température pour la climatisation)
- Les données sont connues comme étant propres, sans valeurs aberrantes
- Vous communiquez avec un public peu familier des statistiques
- La taille de l’échantillon est petite et fixe (même taille pour toutes les comparaisons)
Utilisez l’écart type quand :
- Vous effectuez une analyse statistique ou un test d’hypothèse
- Vous comparez la variabilité entre des échantillons de tailles différentes
- Vous calculez des intervalles de confiance ou des p-valeurs
- Vous évaluez la variation typique plutôt que les extrêmes
- Les données peuvent contenir des valeurs aberrantes qui ne doivent pas dominer la mesure
Exemples pratiques
Exemple : Températures quotidiennes
Données : 22 °C, 24 °C, 23 °C, 23 °C, 24 °C, 22 °C, 23 °C
Étendue : 24 - 22 = 2 °C (l’amplitude thermique)
Écart type : 0,82 °C (la variation typique au quotidien)
Les deux sont utiles — l’étendue pour le dimensionnement de la climatisation, l’écart type pour la régularité du confort.
Exemple : Notes d’examen avec valeur aberrante
Données : 85, 88, 87, 86, 89, 42 (un élève n’avait pas révisé)
Étendue : 89 - 42 = 47 points (dominée par la valeur aberrante !)
Écart type : 17,4 points (affecté mais dans une moindre mesure)
L’étendue est trompeuse ici. Envisagez l’écart type ou la suppression de la valeur aberrante.
Considérations avancées
Relation entre étendue et écart type : Pour des données normalement distribuées, Étendue ≈ 4-6 × écart type pour les tailles d’échantillon courantes. Cela permet une conversion approximative entre les deux.
Écart interquartile (IQR) : Un compromis qui utilise Q3 - Q1 au lieu de max - min. Plus robuste que l’étendue tout en étant plus simple que l’écart type.
Bonne pratique
Rapportez les deux mesures lorsque c’est pertinent. « La plage de température était de 8 °C (écart type = 2,3 °C) » donne aux lecteurs une information complète sur les extrêmes et la variation typique.