Overzicht
Een van de meest voorkomende vragen in de statistiek is: “Moet ik delen door n of n-1?” Het antwoord hangt af van of u met een volledige populatie of slechts een steekproef werkt.
Populatie (N)
Steekproef (n-1)
Populatiestandaardafwijking (σ)
Populatiestandaardafwijking wordt gebruikt wanneer u metingen heeft van elk enkel lid van de groep die u analyseert. Dit komt in de praktijk relatief weinig voor.
Voorbeelden van werkelijke populaties:
- Alle 50 medewerkers in een klein bedrijf
- Elke leerling in een specifieke klas van 30
- Alle transacties in een afgesloten boekjaar
- Volledige volkstellingsgegevens van een land
Steekproefstandaardafwijking (s)
Steekproefstandaardafwijking wordt gebruikt wanneer u werkt met een deelverzameling van een grotere populatie. Dit is het meest voorkomende scenario in praktijkanalyses.
Voorbeelden van steekproeven:
- 1.000 kiezers ondervragen om verkiezingsresultaten te voorspellen
- 50 producten testen uit een productiepartij van 10.000
- Bloeddruk meten van 200 patiënten in een klinisch onderzoek
- 5 jaar aan beursgegevens analyseren om toekomstige volatiliteit te voorspellen
Correctie van Bessel uitgelegd
De correctie van Bessel is de reden waarom we (n-1) gebruiken in plaats van n bij het berekenen van de steekproefstandaardafwijking. Vernoemd naar de Duitse wiskundige Friedrich Bessel, levert deze aanpassing een zuivere schatting van de populatievariantie op.
Waarom (n-1) werkt
Wiskundige intuïtie
Steekproefgegevens clusteren doorgaans dichter rond het steekproefgemiddelde dan rond het werkelijke populatiegemiddelde. Dit zorgt ervoor dat de som van gekwadrateerde afwijkingen systematisch kleiner is dan zou moeten.
Delen door (n-1) in plaats van n vergroot het resultaat enigszins, wat compenseert voor deze onderschatting en een zuivere schatting oplevert.
Wanneer welke gebruiken
| Scenario | Gebruik | Deel door |
|---|---|---|
| U heeft alle bestaande gegevenspunten | Populatie-SD (σ) | N |
| U beschrijft alleen de gegevens die u heeft | Populatie-SD (σ) | N |
| U schat voor een grotere populatie | Steekproef-SD (s) | n-1 |
| U gebruikt SD voor inferentiële statistiek | Steekproef-SD (s) | n-1 |
Vuistregel