Qu’est-ce que la variance ?
La variance mesure à quel point un ensemble de valeurs est dispersé par rapport à leur moyenne. C’est la moyenne des carrés des écarts à la moyenne, et c’est le fondement sur lequel l’écart type est construit.
Chaque barre représente l’écart au carré par rapport à la moyenne. La variance est la moyenne de ces barres.
Formule de la variance
Variance de population
σ² = Σ(xᵢ - μ)² / N
Variance d’échantillon
s² = Σ(xᵢ - x̄)² / (n-1)
1
Calculer la moyenne
Additionner toutes les valeurs et diviser par le nombre d’observations.
2
Trouver chaque écart
Soustraire la moyenne de chaque observation.
3
Élever chaque écart au carré
Cela élimine les valeurs négatives et accentue les grands écarts.
4
Faire la moyenne des écarts au carré
Diviser par N (population) ou n-1 (échantillon).
Pourquoi élever les écarts au carré ?
Trois raisons clés
1. Éliminer les négatifs : Sans mise au carré, les écarts positifs et négatifs s’annuleraient, donnant une somme nulle.
2. Pénaliser les valeurs extrêmes : Le carré accorde plus de poids aux valeurs éloignées de la moyenne.
3. Propriétés mathématiques : La variance possède des propriétés algébriques utiles pour l’inférence statistique.
Exemple : Pourquoi ne pas utiliser les valeurs absolues ?
Jeu de données : 2, 4, 4, 4, 5, 5, 7, 9 (Moyenne = 5)
Écart absolu moyen :
|2-5| + |4-5| + ... = 14
EAM = 14/8 = 1,75
Variance (au carré) :
(2-5)² + (4-5)² + ... = 32
Var = 32/8 = 4
Variance vs écart type
La relation
Standard Deviation = √Variance → σ = √σ²
Variance (σ²)
- Les unités sont au carré (ex. : cm², €²)
- Plus difficile à interpréter directement
- Utile pour les opérations mathématiques
- Additive pour les variables indépendantes
Écart type (σ)
- Mêmes unités que les données d’origine
- Plus facile à interpréter
- Meilleur pour la communication
- Utilisé pour les scores Z et les intervalles de confiance
Applications de la variance
Bien que l’écart type soit plus souvent rapporté, la variance a des usages spécifiques :
- ANOVA:L’analyse de la variance compare les moyennes entre groupes
- Théorie du portefeuille:Les variances des rendements servent à l’optimisation
- Régression:Le R² est la variance expliquée divisée par la variance totale
- ACP:L’analyse en composantes principales maximise la variance expliquée