Σ
SDCalc
ŚredniozaawansowanyPojęcia·8 min

Odchylenie standardowe próbki a populacji: kiedy stosować każde z nich

Poznaj różnicę między odchyleniem standardowym próbki a populacji. Zrozum poprawkę Bessela, kiedy dzielić przez n-1 a kiedy przez n, z przejrzystymi przykładami.

Przegląd

Jedno z najczęstszych pytań w statystyce brzmi: “Czy powinienem dzielić przez n czy przez n-1?” Odpowiedź zależy od tego, czy pracujesz z całą populacją, czy jedynie z próbką.

Populacja (N)

Stosuj, gdy dysponujesz danymi każdego członka badanej grupy. σ = √[Σ(x-μ)² / N]

Próbka (n-1)

Stosuj, gdy dysponujesz danymi z podzbioru większej populacji. s = √[Σ(x-x̄)² / (n-1)]

Odchylenie standardowe populacji (σ)

Odchylenie standardowe populacji stosuje się, gdy posiadamy pomiary każdego pojedynczego członka analizowanej grupy. W praktyce zdarza się to stosunkowo rzadko.

Przykłady prawdziwych populacji:

  • Wszyscy 50 pracowników małej firmy
  • Każdy uczeń w konkretnej klasie liczącej 30 osób
  • Wszystkie transakcje w zamkniętym roku obrachunkowym
  • Pełne dane ze spisu powszechnego danego kraju

Odchylenie standardowe próbki (s)

Odchylenie standardowe próbki stosuje się, gdy pracujemy z podzbiorem większej populacji. Jest to częstszy scenariusz w analizach prowadzonych w świecie rzeczywistym.

Przykłady próbek:

  • Ankietowanie 1 000 wyborców w celu przewidzenia wyników wyborów
  • Testowanie 50 produktów z partii produkcyjnej liczącej 10 000 sztuk
  • Pomiar ciśnienia krwi u 200 pacjentów w badaniu klinicznym
  • Analiza 5 lat danych giełdowych w celu prognozowania przyszłej zmienności

Poprawka Bessela — wyjaśnienie

Poprawka Bessela to powód, dla którego w obliczaniu odchylenia standardowego próbki dzielimy przez (n-1) zamiast przez n. Nazwana od niemieckiego matematyka Friedricha Bessela, ta korekta zapewnia nieobciążony estymator wariancji populacji.

Dlaczego (n-1) działa

Obliczając średnią z próbki, “zużywasz” jeden stopień swobody. Średnia próbki ogranicza dane — znając n-1 wartości i średnią, ostatnia wartość jest już zdeterminowana. Dzielenie przez (n-1) koryguje tę utratę swobody.

Intuicja matematyczna

Punkty danych w próbce mają tendencję do skupiania się bliżej średniej próbki niż rzeczywistej średniej populacji. Powoduje to, że suma kwadratów odchyleń jest systematycznie mniejsza niż powinna być.

Dzielenie przez (n-1) zamiast przez n nieznacznie zwiększa wynik, kompensując to niedoszacowanie i dając nieobciążony estymator.

Kiedy stosować każde z nich

ScenariuszStosujDziel przez
Posiadasz wszystkie istniejące punkty danychOdchylenie populacji (σ)N
Opisujesz tylko posiadane daneOdchylenie populacji (σ)N
Szacujesz parametry większej populacjiOdchylenie próbki (s)n-1
Użyjesz odchylenia w statystyce indukcyjnejOdchylenie próbki (s)n-1

Praktyczna zasada

W razie wątpliwości używaj odchylenia standardowego próbki (n-1). Jest to bezpieczniejsze, ponieważ: - Większość danych z życia pochodzi z próbek, a nie z pełnych populacji - Użycie n-1 na prawdziwej populacji nieco przeszacowuje wynik (bezpieczniejsze niż niedoszacowanie) - Dla dużych n różnica jest i tak znikoma

Przykłady praktyczne

Przykład: Kontrola jakości

Fabryka produkuje 10 000 widżetów dziennie. Kontrola jakości bada 100 widżetów i stwierdza, że ich średnia masa wynosi 50 g. Odpowiedź: Użyj odchylenia próbki (n-1), ponieważ 100 widżetów to próbka z 10 000 wyprodukowanych. Używasz tej próbki do oszacowania zmienności wszystkich widżetów.

Przykład: Oceny w klasie

Nauczycielka chce opisać zmienność wyników testu w swojej klasie liczącej 25 uczniów. Nie próbuje uogólniać na inne klasy. Odpowiedź: Użyj odchylenia populacji (N), ponieważ posiada wyniki całej klasy (jej populacja zainteresowania) i nie wnioskuje o innych grupach.