Σ
SDCalc
KözéphaladóFogalmak·8 min

Minta vs. populáció szórás: Mikor melyiket használd?

Ismerd meg a minta- és a populációs szórás közötti különbséget. Értsd meg a Bessel-korrekciót, az n-1 vs n alkalmazását, világos példákkal.

Áttekintés

A statisztikában az egyik leggyakoribb kérdés: “N-nel vagy n-1-gyel osszak?” A válasz attól függ, hogy teljes populációval vagy csak egy mintával dolgozol.

Populáció (N)

Használd, ha a vizsgált csoport minden tagjáról van adatod. σ = √[Σ(x-μ)² / N]

Minta (n-1)

Használd, ha a nagyobb populáció egy részhalmazáról van adatod. s = √[Σ(x-x̄)² / (n-1)]

Populációs szórás (σ)

A populációs szórást akkor használjuk, ha az elemzett csoport minden egyes tagjáról rendelkezünk méréssel. Ez a gyakorlatban viszonylag ritka.

Valódi populációk példái:

  • Egy kisebb, 50 fős vállalat összes alkalmazottja
  • Egy 30 fős osztály minden tanulója
  • Egy lezárt pénzügyi év összes tranzakciója
  • Egy ország teljes népszámlálási adatai

Mintaszórás (s)

A mintaszórást akkor használjuk, ha egy nagyobb populáció részhalmazával dolgozunk. Ez a valós elemzésekben a gyakoribb eset.

Minták példái:

  • 1000 szavazó megkérdezése a választási eredmények előrejelzéséhez
  • 50 termék tesztelése egy 10 000 darabos gyártási tételből
  • 200 beteg vérnyomásának mérése egy klinikai vizsgálatban
  • 5 évnyi részvényadat elemzése a jövőbeli volatilitás előrejelzéséhez

A Bessel-korrekció magyarázata

A Bessel-korrekció az oka annak, hogy a mintaszórás számításakor (n-1)-gyel osztunk n helyett. Friedrich Bessel német matematikusról elnevezve ez a korrekció a populációs variancia torzítatlan becslését adja.

Miért működik az (n-1)?

Amikor mintaátlagot számítasz, egy szabadságfokot “felhasználsz”. A mintaátlag megköti az adatokat — ha ismered n-1 értéket és az átlagot, az utolsó érték meghatározott. Az (n-1)-gyel való osztás kompenzálja ezt a szabadságfok-veszteséget.

Matematikai intuíció

A minta adatpontjai jellemzően közelebb csoportosulnak a mintaátlaghoz, mint a valódi populációs átlaghoz. Emiatt a négyzetes eltérések összege szisztematikusan kisebb lesz a kelleténél.

Az (n-1)-gyel való osztás n helyett kissé megnöveli az eredményt, kompenzálva ezt az alábecslést és torzítatlan becslést eredményezve.

Mikor melyiket használd?

ForgatókönyvHasználdOsztó
Az összes létező adatpontod megvanPopulációs szórás (σ)N
Csak a meglévő adataidat írod lePopulációs szórás (σ)N
Nagyobb populációra becsülszMintaszórás (s)n-1
A szórást következtetéses statisztikához használodMintaszórás (s)n-1

Ökölszabály

Ha kétséges, használd a mintaszórást (n-1). Ez biztonságosabb, mert: - A valós adatok többsége mintából származik, nem teljes populációból - Az n-1 használata valódi populációnál kissé túlbecsül (biztonságosabb, mint az alábecslés) - Nagy n esetén a különbség elhanyagolható

Gyakorlati példák

Példa: Minőségellenőrzés

Egy gyár naponta 10 000 alkatrészt gyárt. A minőségellenőrzés 100 alkatrészt tesztel, és azok tömegének átlagát 50 g-nak méri. Válasz: Használd a mintaszórást (n-1), mert a 100 alkatrész a gyártott 10 000 darab mintája. Ezt a mintát használod az összes alkatrész változékonyságának becslésére.

Példa: Osztályzatok

Egy tanár 25 fős osztályának dolgozateredményeinek változékonyságát akarja leírni. Nem próbál más osztályokra általánosítani. Válasz: Használd a populációs szórást (N), mert a teljes osztály (az érdeklődési populáció) eredményeivel rendelkezik, és nem von le következtetéseket más csoportokra.