Přehled
Jednou z nejčastějších otázek ve statistice je: “Mám dělit n nebo n-1?” Odpověď závisí na tom, zda pracujete s celou populací nebo pouze s výběrem.
Populace (N)
Výběr (n-1)
Populační směrodatná odchylka (σ)
Populační směrodatná odchylka se používá, když máte měření od každého jednotlivého člena skupiny, kterou analyzujete. V praxi je to relativně vzácné.
Příklady skutečných populací:
- Všech 50 zaměstnanců v malé firmě
- Každý student v konkrétní třídě o 30 žácích
- Všechny transakce v uzavřeném fiskálním roce
- Kompletní data ze sčítání lidu
Výběrová směrodatná odchylka (s)
Výběrová směrodatná odchylka se používá, když pracujete s podmnožinou větší populace. Toto je v reálných analýzách častější scénář.
Příklady výběrů:
- Průzkum 1 000 voličů k předpovědi výsledků voleb
- Testování 50 výrobků z výrobní šarže 10 000
- Měření krevního tlaku 200 pacientů v klinické studii
- Analýza 5 let dat o akciích k předpovědi budoucí volatility
Besselova korekce vysvětlena
Besselova korekce je důvodem, proč používáme (n-1) místo n při výpočtu výběrové směrodatné odchylky. Pojmenována po německém matematikovi Friedrichu Besselovi, tato úprava poskytuje nestranný odhad populačního rozptylu.
Proč (n-1) funguje
Matematická intuice
Datové body výběru mají tendenci se shlukovat blíže k výběrovému průměru než ke skutečnému populačnímu průměru. To způsobuje, že součet čtverců odchylek je systematicky menší, než by měl být.
Dělení (n-1) místo n výsledek mírně zvyšuje, čímž kompenzuje toto podhodnocení a poskytuje nestranný odhad.
Kdy použít kterou
| Scénář | Použijte | Dělte |
|---|---|---|
| Máte všechny existující datové body | Populační SO (σ) | N |
| Popisujete pouze data, která máte | Populační SO (σ) | N |
| Odhadujete pro větší populaci | Výběrovou SO (s) | n-1 |
| SO použijete pro inferenční statistiku | Výběrovou SO (s) | n-1 |
Orientační pravidlo