Wat is variantie?
Variantie meet hoe ver een reeks getallen verspreid is ten opzichte van hun gemiddelde waarde. Het is het gemiddelde van de gekwadrateerde verschillen met het gemiddelde—en het is het fundament waarop standaardafwijking is gebouwd.
Elke balk toont de gekwadrateerde afwijking van het gemiddelde. Variantie = gemiddelde van deze balken.
Variantieformule
Populatievariantie
σ² = Σ(xᵢ - μ)² / N
Steekproefvariantie
s² = Σ(xᵢ - x̄)² / (n-1)
1
Bereken het gemiddelde
Tel alle waarden op en deel door het aantal.
2
Bepaal elke afwijking
Trek het gemiddelde af van elk gegevenspunt.
3
Kwadrateer elke afwijking
Dit elimineert negatieve waarden en benadrukt grote afwijkingen.
4
Neem het gemiddelde van de gekwadrateerde afwijkingen
Deel door N (populatie) of n-1 (steekproef).
Waarom kwadrateren we afwijkingen?
Drie belangrijke redenen
1. Elimineer negatieve waarden: Zonder kwadrateren zouden positieve en negatieve afwijkingen elkaar opheffen, waardoor de som nul wordt.
2. Bestraf uitschieters: Kwadrateren geeft meer gewicht aan waarden die ver van het gemiddelde liggen.
3. Wiskundige eigenschappen: Variantie heeft nuttige algebraïsche eigenschappen voor statistische inferentie.
Voorbeeld: waarom niet gewoon absolute waarden gebruiken?
Dataset: 2, 4, 4, 4, 5, 5, 7, 9 (Gemiddelde = 5)
Gemiddelde absolute afwijking:
|2-5| + |4-5| + ... = 14
MAD = 14/8 = 1,75
Variantie (gekwadrateerd):
(2-5)² + (4-5)² + ... = 32
Var = 32/8 = 4
Variantie vs. standaardafwijking
De relatie
Standard Deviation = √Variance → σ = √σ²
Variantie (σ²)
- Eenheden zijn gekwadrateerd (bijv. cm², €²)
- Moeilijker direct te interpreteren
- Nuttig voor wiskundige bewerkingen
- Additief voor onafhankelijke variabelen
Standaardafwijking (σ)
- Dezelfde eenheden als de oorspronkelijke gegevens
- Gemakkelijker te interpreteren
- Beter voor communicatie
- Gebruikt in z-scores en betrouwbaarheidsintervallen
Toepassingen van variantie
Hoewel standaardafwijking vaker wordt gerapporteerd, heeft variantie specifieke toepassingen:
- ANOVA:Variantieanalyse vergelijkt gemiddelden tussen groepen
- Portefeuilletheorie:Varianties van rendementen worden gebruikt bij optimalisatie
- Regressie:R² is verklaarde variantie gedeeld door totale variantie
- PCA:Principale Componentenanalyse maximaliseert verklaarde variantie