Áttekintés
A statisztikában az egyik leggyakoribb kérdés: “N-nel vagy n-1-gyel osszak?” A válasz attól függ, hogy teljes populációval vagy csak egy mintával dolgozol.
Populáció (N)
Minta (n-1)
Populációs szórás (σ)
A populációs szórást akkor használjuk, ha az elemzett csoport minden egyes tagjáról rendelkezünk méréssel. Ez a gyakorlatban viszonylag ritka.
Valódi populációk példái:
- Egy kisebb, 50 fős vállalat összes alkalmazottja
- Egy 30 fős osztály minden tanulója
- Egy lezárt pénzügyi év összes tranzakciója
- Egy ország teljes népszámlálási adatai
Mintaszórás (s)
A mintaszórást akkor használjuk, ha egy nagyobb populáció részhalmazával dolgozunk. Ez a valós elemzésekben a gyakoribb eset.
Minták példái:
- 1000 szavazó megkérdezése a választási eredmények előrejelzéséhez
- 50 termék tesztelése egy 10 000 darabos gyártási tételből
- 200 beteg vérnyomásának mérése egy klinikai vizsgálatban
- 5 évnyi részvényadat elemzése a jövőbeli volatilitás előrejelzéséhez
A Bessel-korrekció magyarázata
A Bessel-korrekció az oka annak, hogy a mintaszórás számításakor (n-1)-gyel osztunk n helyett. Friedrich Bessel német matematikusról elnevezve ez a korrekció a populációs variancia torzítatlan becslését adja.
Miért működik az (n-1)?
Matematikai intuíció
A minta adatpontjai jellemzően közelebb csoportosulnak a mintaátlaghoz, mint a valódi populációs átlaghoz. Emiatt a négyzetes eltérések összege szisztematikusan kisebb lesz a kelleténél.
Az (n-1)-gyel való osztás n helyett kissé megnöveli az eredményt, kompenzálva ezt az alábecslést és torzítatlan becslést eredményezve.
Mikor melyiket használd?
| Forgatókönyv | Használd | Osztó |
|---|---|---|
| Az összes létező adatpontod megvan | Populációs szórás (σ) | N |
| Csak a meglévő adataidat írod le | Populációs szórás (σ) | N |
| Nagyobb populációra becsülsz | Mintaszórás (s) | n-1 |
| A szórást következtetéses statisztikához használod | Mintaszórás (s) | n-1 |
Ökölszabály