Hvad er varians?
Varians måler, hvor langt et sæt tal er spredt ud fra deres gennemsnitsværdi. Det er gennemsnittet af de kvadrerede forskelle fra gennemsnittet – og det er fundamentet, som standardafvigelse er bygget på.
Hver søjle viser den kvadrerede afvigelse fra gennemsnittet. Varians = gennemsnittet af disse søjler.
Variansformlen
Populationsvarians
σ² = Σ(xᵢ - μ)² / N
Stikprøvevarians
s² = Σ(xᵢ - x̄)² / (n-1)
1
Beregn gennemsnittet
Læg alle værdier sammen og divider med antallet.
2
Find hver afvigelse
Træk gennemsnittet fra hvert datapunkt.
3
Kvadrer hver afvigelse
Dette eliminerer negative værdier og fremhæver store afvigelser.
4
Tag gennemsnittet af de kvadrerede afvigelser
Divider med N (population) eller n-1 (stikprøve).
Hvorfor kvadrerer vi afvigelser?
Tre vigtige årsager
1. Eliminerer negative tal: Uden kvadrering ville positive og negative afvigelser ophæve hinanden, så summen bliver nul.
2. Straffer outliere: Kvadrering giver mere vægt til værdier langt fra gennemsnittet.
3. Matematiske egenskaber: Varians har nyttige algebraiske egenskaber for statistisk inferens.
Eksempel: Hvorfor ikke bare bruge absolutte værdier?
Datasæt: 2, 4, 4, 4, 5, 5, 7, 9 (Gennemsnit = 5)
Gennemsnitlig absolut afvigelse:
|2-5| + |4-5| + ... = 14
MAD = 14/8 = 1,75
Varians (kvadreret):
(2-5)² + (4-5)² + ... = 32
Var = 32/8 = 4
Varians vs. standardafvigelse
Forholdet
Standard Deviation = √Variance → σ = √σ²
Varians (σ²)
- Enheder er kvadrerede (f.eks. cm², kr²)
- Sværere at fortolke direkte
- Nyttig til matematiske operationer
- Additiv for uafhængige variable
Standardafvigelse (σ)
- Samme enheder som de oprindelige data
- Lettere at fortolke
- Bedre til kommunikation
- Bruges i z-scorer og konfidensintervaller
Anvendelser af varians
Selvom standardafvigelse oftere rapporteres, har varians specifikke anvendelser:
- ANOVA:Variansanalyse sammenligner gennemsnit på tværs af grupper
- Porteføljeteori:Varianser af afkast bruges i optimering
- Regression:R² er forklaret varians divideret med total varians
- PCA:Hovedkomponentanalyse maksimerer forklaret varians