Przegląd
Jedno z najczęstszych pytań w statystyce brzmi: “Czy powinienem dzielić przez n czy przez n-1?” Odpowiedź zależy od tego, czy pracujesz z całą populacją, czy jedynie z próbką.
Populacja (N)
Próbka (n-1)
Odchylenie standardowe populacji (σ)
Odchylenie standardowe populacji stosuje się, gdy posiadamy pomiary każdego pojedynczego członka analizowanej grupy. W praktyce zdarza się to stosunkowo rzadko.
Przykłady prawdziwych populacji:
- Wszyscy 50 pracowników małej firmy
- Każdy uczeń w konkretnej klasie liczącej 30 osób
- Wszystkie transakcje w zamkniętym roku obrachunkowym
- Pełne dane ze spisu powszechnego danego kraju
Odchylenie standardowe próbki (s)
Odchylenie standardowe próbki stosuje się, gdy pracujemy z podzbiorem większej populacji. Jest to częstszy scenariusz w analizach prowadzonych w świecie rzeczywistym.
Przykłady próbek:
- Ankietowanie 1 000 wyborców w celu przewidzenia wyników wyborów
- Testowanie 50 produktów z partii produkcyjnej liczącej 10 000 sztuk
- Pomiar ciśnienia krwi u 200 pacjentów w badaniu klinicznym
- Analiza 5 lat danych giełdowych w celu prognozowania przyszłej zmienności
Poprawka Bessela — wyjaśnienie
Poprawka Bessela to powód, dla którego w obliczaniu odchylenia standardowego próbki dzielimy przez (n-1) zamiast przez n. Nazwana od niemieckiego matematyka Friedricha Bessela, ta korekta zapewnia nieobciążony estymator wariancji populacji.
Dlaczego (n-1) działa
Intuicja matematyczna
Punkty danych w próbce mają tendencję do skupiania się bliżej średniej próbki niż rzeczywistej średniej populacji. Powoduje to, że suma kwadratów odchyleń jest systematycznie mniejsza niż powinna być.
Dzielenie przez (n-1) zamiast przez n nieznacznie zwiększa wynik, kompensując to niedoszacowanie i dając nieobciążony estymator.
Kiedy stosować każde z nich
| Scenariusz | Stosuj | Dziel przez |
|---|---|---|
| Posiadasz wszystkie istniejące punkty danych | Odchylenie populacji (σ) | N |
| Opisujesz tylko posiadane dane | Odchylenie populacji (σ) | N |
| Szacujesz parametry większej populacji | Odchylenie próbki (s) | n-1 |
| Użyjesz odchylenia w statystyce indukcyjnej | Odchylenie próbki (s) | n-1 |
Praktyczna zasada