Σ
SDCalc
ØvetFundamentals·9 min

Standardafvigelse vs. Varians: De vigtigste forskelle forklaret

Forstå de afgørende forskelle på standardafvigelse og varians. Lær hvornår du skal bruge dem, formlerne og deres betydning for dataanalyse.

By Standard Deviation Calculator Team · Data Science Team·Published

Hvad er varians?

Varians (betegnet som σ² for en population og s² for en stikprøve) er et statistisk mål for spredningen mellem tal i et datasæt. Den repræsenterer gennemsnittet af de kvadrerede afvigelser fra middelværdien (μ). Ved at kvadrere afvigelserne sikrer variansen, at negative og positive afvigelser ikke udligner hinanden, hvilket giver et sandt mål for spredning. Fordi afvigelserne dog er kvadreret, er den resulterende enhed for variansen kvadratet på den oprindelige datas enhed, hvilket gør den lidt abstrakt at fortolke direkte.

Populationsvarians

σ² = Σ(xᵢ - μ)² / N

Måleenheder

Hvis dine data repræsenterer højder i centimeter, udtrykkes variansen i centimeter i anden (cm²). Denne kvadrerede enhed er en af hovedårsagerne til, at varians kan være svær at fortolke i praktiske, virkelige sammenhænge.

Hvad er standardafvigelse?

Standardafvigelse (betegnet som σ for en population og s for en stikprøve) er kvadratroden af variansen. Den måler den gennemsnitlige mængde, hvormed individuelle datapunkter afviger fra middelværdien. Fordi den udledes ved at tage kvadratroden af variansen, udtrykkes standardafvigelsen i de samme enheder som de oprindelige data, hvilket gør den langt mere intuitiv og fortolkelig i virkelige applikationer. Det er det mest udbredte mål for statistisk spredning.

Populationsstandardafvigelse

σ = √(Σ(xᵢ - μ)² / N)

Standardafvigelse vs. varians: Kerneforskelle

Selvom begge metrikker kvantificerer spredningen af datapunkter omkring middelværdien, adskiller deres matematiske relation og praktiske anvendelighed sig markant. Den grundlæggende forskel ligger i deres enheder og fortolkelighed. Standardafvigelse er kvadratroden af variansen, hvilket bringer spredningsmålet tilbage til de oprindelige enheder for dataene. Varians, som er en kvadreret værdi, giver uforholdsmæssig vægt til outliers, hvilket gør den meget følsom over for ekstreme værdier.

EgenskabVarians (σ² / s²)Standardafvigelse (σ / s)
Matematisk grundlagGennemsnit af kvadrerede afvigelserKvadratroden af variansen
EnhederKvadrerede enheder (f.eks. cm², kr²)Oprindelige enheder (f.eks. cm, kr)
FortolkelighedAbstrakt; svær at relatere til dataIntuitiv; afbilder direkte dataene
Følsomhed over for outliersHøj (på grund af kvadrering)Moderat (kvadratroden dæmper effekten)
Primært anvendelsestilfældeStatistisk inferens, ANOVA, PorteføljeteoriBeskrivende statistik, Rapportering, Den empiriske regel

Formler for population og stikprøve

Når du beregner disse metrikker, skal du skelne mellem en population og en stikprøve. En population omfatter alle medlemmer af en bestemt gruppe, mens en stikprøve er en delmængde af denne population. Ved at bruge stikprøveformlen med en nævner på (n - 1) — kendt som Bessels korrektion — korrigerer man den iboende bias i estimatet af populationsvariansen ud fra en stikprøve, hvilket sikrer, at estimatoren er unbiased.

Stikprøvevarians

s² = Σ(xᵢ - x̄)² / (n - 1)

Undgå faldgruben med n vs. n-1

Hvis du bruger 'n' i stedet for '(n - 1)' for en stikprøvevarians, vil du systematisk undervurdere den sande populationsvarians. Brug altid frihedsgrader (df = n - 1), når du arbejder med stikprøvedata for at udlede populationsparametre.

Hvornår skal man bruge varians vs. standardafvigelse?

Valget mellem varians og standardafvigelse afhænger helt af dit analytiske formål. Hvis du skal formidle spredningen af dine data til et ikke-teknisk publikum, er standardafvigelse det klare valg, fordi den matcher dataenes naturlige enheder. Hvis du derimod udfører mellemliggende statistiske beregninger — som at beregne F-statistikker i ANOVA, vurdere risiko i moderne porteføljeteori eller udføre hypotesetest — er varians matematisk set mere praktisk.

Brug varians når...

- Du udfører ANOVA eller F-tests - Du beregner porteføljerisiko (kovariansmatricer) - Du udfører teoretiske statistiske beviser - Du udvikler maskinlærings-tabelfunktioner (f.eks. MSE)

Brug standardafvigelse når...

- Du rapporterer dataspredning i publikationer - Du anvender den empiriske regel (68-95-99.7) - Du opbygger kontrolkort til kvalitetssikring - Du kommunikerer variabilitet til ikke-tekniske interessenter

Beregning af standardafvigelse og varians i Python

Pythons `statistics`-modul indeholder indbyggede funktioner til både varians og standardafvigelse. Når du bruger disse funktioner, er det afgørende at vælge den korrekte metode baseret på, om dine data repræsenterer en population eller en stikprøve.

python
import statistics

# Sample dataset
data = [14, 18, 12, 15, 11]

# Calculate Sample Variance and SD
sample_var = statistics.variance(data)
sample_sd = statistics.stdev(data)

# Calculate Population Variance and SD
pop_var = statistics.pvariance(data)
pop_sd = statistics.pstdev(data)

print(f"Sample Variance: {sample_var:.2f}")
print(f"Sample SD: {sample_sd:.2f}")
print(f"Population Variance: {pop_var:.2f}")
print(f"Population SD: {pop_sd:.2f}")

Ofte stillede spørgsmål

  • Kan varians være negativ? Nej, fordi summen af kvadrerede afvigelser (xᵢ - μ)² altid er nul eller en positiv værdi, kan varians aldrig være negativ.
  • Hvorfor foretrækkes standardafvigelse frem for varians ved rapportering? Standardafvigelse foretrækkes, fordi den har de samme enheder som middelværdien, hvilket gør den meget nemmere at kontekstualisere og fortolke sammen med rådataene.
  • Er varians det samme som mean squared error (MSE)? De ligner hinanden, men MSE måler typisk den gennemsnitlige kvadrerede forskel mellem estimerede værdier og den faktiske værdi, mens varians måler spredningen omkring middelværdien. Hvis estimatoren er middelværdien, er MSE lig med variansen.

Further Reading

Sources

References and further authoritative reading used in preparing this article.

  1. Standardafvigelse - Wikipedia
  2. NIST/SEMATECH e-håndbog for statistiske metoder

How to Read This Article

A statistics tutorial is a practical interpretation guide, not just a formula dump. It refers to the assumptions, notation, and reporting language that analysts need when they explain a result to a teacher, manager, client, or reviewer. The article body covers the specific topic, while the sections below create a common interpretation frame that readers can reuse across related metrics.

Reading goalWhat to focus onCommon mistake
DefinitionWhat the metric is and what quantity it summarizesTreating the formula as self-explanatory
Formula choiceSample versus population assumptions and notationUsing n when n-1 is required or vice versa
InterpretationWhether the result indicates concentration, spread, or riskCalling a large value good or bad without context

Frequently Asked Questions

How should I interpret a high standard deviation?

A high standard deviation means the observations are spread farther from the mean on average. Whether that spread is acceptable depends on the context: wide dispersion might signal risk in finance, instability in manufacturing, or genuine natural variation in scientific data.

Why do some articles mention n while others mention n-1?

The denominator reflects the difference between population and sample formulas. Population variance and population standard deviation use N because the full dataset is known. Sample variance and sample standard deviation often use n-1 because Bessel’s correction reduces bias when estimating population spread from a sample.

What is a statistical interpretation guide?

A statistical interpretation guide is a page that moves beyond arithmetic and explains meaning. It tells you what a metric is, when the formula applies, and how to describe the result in plain English without overstating certainty.

Can I cite this article in a report?

You should cite the underlying authoritative reference for formal work whenever possible. This page is best used as an explanatory bridge that helps you understand the concept before quoting the original standard or handbook.

Why include direct citations on every article page?

Direct citations give readers a route to verify the definition, notation, and assumptions. That improves trust and reduces the chance that a simplified explanation is mistaken for the entire technical standard.

Authoritative References

These sources define the concepts referenced most often across our articles. Bessel's correction is a sample adjustment, variance is a squared measure of spread, and standard deviation is the square root of variance expressed in the same units as the data.