Σ
SDCalc
BegynderGrundlæggende·10 min

Forståelse af varians: Fundamentet for SA

Mester begrebet varians og dets forhold til standardafvigelse. Lær formler, beregninger og praktiske anvendelser af varians i statistik.

Hvad er varians?

Varians måler, hvor langt et sæt tal er spredt ud fra deres gennemsnitsværdi. Det er gennemsnittet af de kvadrerede forskelle fra gennemsnittet – og det er fundamentet, som standardafvigelse er bygget på.

Hver søjle viser den kvadrerede afvigelse fra gennemsnittet. Varians = gennemsnittet af disse søjler.

Variansformlen

Populationsvarians

σ² = Σ(xᵢ - μ)² / N

Stikprøvevarians

s² = Σ(xᵢ - x̄)² / (n-1)
1

Beregn gennemsnittet

Læg alle værdier sammen og divider med antallet.
2

Find hver afvigelse

Træk gennemsnittet fra hvert datapunkt.
3

Kvadrer hver afvigelse

Dette eliminerer negative værdier og fremhæver store afvigelser.
4

Tag gennemsnittet af de kvadrerede afvigelser

Divider med N (population) eller n-1 (stikprøve).

Hvorfor kvadrerer vi afvigelser?

Tre vigtige årsager

1. Eliminerer negative tal: Uden kvadrering ville positive og negative afvigelser ophæve hinanden, så summen bliver nul. 2. Straffer outliere: Kvadrering giver mere vægt til værdier langt fra gennemsnittet. 3. Matematiske egenskaber: Varians har nyttige algebraiske egenskaber for statistisk inferens.

Eksempel: Hvorfor ikke bare bruge absolutte værdier?

Datasæt: 2, 4, 4, 4, 5, 5, 7, 9 (Gennemsnit = 5) Gennemsnitlig absolut afvigelse: |2-5| + |4-5| + ... = 14 MAD = 14/8 = 1,75 Varians (kvadreret): (2-5)² + (4-5)² + ... = 32 Var = 32/8 = 4

Varians vs. standardafvigelse

Forholdet

Standard Deviation = √Variance → σ = √σ²

Varians (σ²)

- Enheder er kvadrerede (f.eks. cm², kr²) - Sværere at fortolke direkte - Nyttig til matematiske operationer - Additiv for uafhængige variable

Standardafvigelse (σ)

- Samme enheder som de oprindelige data - Lettere at fortolke - Bedre til kommunikation - Bruges i z-scorer og konfidensintervaller

Anvendelser af varians

Selvom standardafvigelse oftere rapporteres, har varians specifikke anvendelser:

  • ANOVA:Variansanalyse sammenligner gennemsnit på tværs af grupper
  • Porteføljeteori:Varianser af afkast bruges i optimering
  • Regression:R² er forklaret varians divideret med total varians
  • PCA:Hovedkomponentanalyse maksimerer forklaret varians