Qu’est-ce que la variance?
La variance mesure à quel point un ensemble de nombres est dispersé par rapport à sa valeur moyenne. C’est la moyenne des carrés des écarts par rapport à la moyenne — et c’est le fondement sur lequel l’écart type est construit.
Chaque barre montre l’écart au carré par rapport à la moyenne. Variance = moyenne de ces barres.
Formule de la variance
Variance de la population
σ² = Σ(xᵢ - μ)² / N
Variance de l’échantillon
s² = Σ(xᵢ - x̄)² / (n-1)
1
Calculer la moyenne
Additionnez toutes les valeurs et divisez par le nombre de valeurs.
2
Trouver chaque écart
Soustrayez la moyenne de chaque point de données.
3
Mettre chaque écart au carré
Cela élimine les valeurs négatives et accentue les grands écarts.
4
Calculer la moyenne des écarts au carré
Divisez par N (population) ou n-1 (échantillon).
Pourquoi met-on les écarts au carré?
Trois raisons principales
1. Éliminer les négatifs : Sans la mise au carré, les écarts positifs et négatifs s’annuleraient, rendant la somme nulle.
2. Pénaliser les valeurs extrêmes : La mise au carré donne plus de poids aux valeurs éloignées de la moyenne.
3. Propriétés mathématiques : La variance possède des propriétés algébriques utiles pour l’inférence statistique.
Exemple : Pourquoi ne pas simplement utiliser les valeurs absolues?
Ensemble de données : 2, 4, 4, 4, 5, 5, 7, 9 (Moyenne = 5)
Écart absolu moyen :
|2-5| + |4-5| + ... = 14
EAM = 14/8 = 1,75
Variance (au carré) :
(2-5)² + (4-5)² + ... = 32
Var = 32/8 = 4
Variance vs écart type
La relation
Standard Deviation = √Variance → σ = √σ²
Variance (σ²)
- Les unités sont au carré (p. ex., cm², $²)
- Plus difficile à interpréter directement
- Utile pour les opérations mathématiques
- Additive pour les variables indépendantes
Écart type (σ)
- Mêmes unités que les données originales
- Plus facile à interpréter
- Meilleur pour la communication
- Utilisé dans les cotes Z et les intervalles de confiance
Applications de la variance
Bien que l’écart type soit plus fréquemment rapporté, la variance a des usages spécifiques :
- ANOVA:L’analyse de la variance compare les moyennes entre plusieurs groupes
- Théorie du portefeuille:Les variances des rendements sont utilisées dans l’optimisation
- Régression:R² est la variance expliquée divisée par la variance totale
- ACP:L’analyse en composantes principales maximise la variance expliquée