Σ
SDCalc
ØvetBegreber·8 min

Stikprøve vs. populationsstandardafvigelse: Hvornår skal man bruge hvad

Lær forskellen mellem stikprøve- og populationsstandardafvigelse. Forstå Bessels korrektion, hvornår du skal bruge n-1 vs. n, med klare eksempler.

Oversigt

Et af de mest almindelige spørgsmål i statistik er: “Skal jeg dividere med n eller n-1?” Svaret afhænger af, om du arbejder med en hel population eller kun en stikprøve.

Population (N)

Brug når du har data for hvert eneste medlem af den gruppe, du undersøger. σ = √[Σ(x-μ)² / N]

Stikprøve (n-1)

Brug når du har data fra en delmængde af den større population. s = √[Σ(x-x̄)² / (n-1)]

Populationsstandardafvigelse (σ)

Populationsstandardafvigelse bruges, når du har målinger fra hvert eneste medlem af den gruppe, du analyserer. Dette er relativt sjældent i praksis.

Eksempler på sande populationer:

  • Alle 50 medarbejdere i en lille virksomhed
  • Hver elev i en bestemt klasse med 30 elever
  • Alle transaktioner i et afsluttet regnskabsår
  • Komplette folketællingsdata for et land

Stikprøvestandardafvigelse (s)

Stikprøvestandardafvigelse bruges, når du arbejder med en delmængde af en større population. Dette er det mere almindelige scenarie i virkelighedens analyser.

Eksempler på stikprøver:

  • Spørgeundersøgelse blandt 1.000 vælgere for at forudsige valgresultater
  • Test af 50 produkter fra en produktionsbatch på 10.000
  • Måling af blodtryk hos 200 patienter i et klinisk studie
  • Analyse af 5 års aktiedata for at forudsige fremtidig volatilitet

Bessels korrektion forklaret

Bessels korrektion er årsagen til, at vi bruger (n-1) i stedet for n ved beregning af stikprøvestandardafvigelse. Opkaldt efter den tyske matematiker Friedrich Bessel producerer denne justering et forventningsret estimat af populationsvariansen.

Hvorfor (n-1) virker

Når du beregner et stikprøvegennemsnit, “bruger du” en frihedsgrad. Stikprøvegennemsnittet begrænser dataene – når du kender n-1 værdier og gennemsnittet, er den sidste værdi bestemt. Division med (n-1) korrigerer for dette tab af frihed.

Matematisk intuition

Stikprøvedatapunkter har en tendens til at samle sig tættere på stikprøvegennemsnittet end på det sande populationsgennemsnit. Dette medfører, at summen af kvadrerede afvigelser systematisk er mindre end den burde være.

Division med (n-1) i stedet for n oppuster resultatet en smule, hvilket kompenserer for denne underestimering og producerer et forventningsret estimat.

Hvornår skal man bruge hvad

ScenarieBrugDivider med
Du har alle eksisterende datapunkterPopulations-SA (σ)N
Du beskriver kun de data, du harPopulations-SA (σ)N
Du estimerer for en større populationStikprøve-SA (s)n-1
Du vil bruge SA til inferentiel statistikStikprøve-SA (s)n-1

Tommelfingerregel

Er du i tvivl, så brug stikprøvestandardafvigelse (n-1). Det er sikrere fordi: - De fleste data i den virkelige verden er stikprøver, ikke komplette populationer - At bruge n-1 på en sand population overestimerer en smule (sikrere end at underestimere) - For store n er forskellen ubetydelig

Praktiske eksempler

Eksempel: Kvalitetskontrol

En fabrik producerer 10.000 enheder om dagen. Kvalitetskontrol tester 100 enheder og finder, at deres vægt har et gennemsnit på 50 g. Svar: Brug stikprøve-SA (n-1), fordi 100 enheder er en stikprøve af de 10.000 producerede. Du bruger denne stikprøve til at estimere variabiliteten af alle enheder.

Eksempel: Klassekarakterer

En lærer vil beskrive variabiliteten af prøveresultater for sin klasse med 25 elever. Hun forsøger ikke at generalisere til andre klasser. Svar: Brug populations-SA (N), fordi hun har resultater for hele klassen (hendes population af interesse) og ikke drager slutninger om andre grupper.