Σ
SDCalc
PokročilýKoncepty·8 min

Výběrová vs. populační směrodatná odchylka: Kdy použít kterou

Naučte se rozdíl mezi výběrovou a populační směrodatnou odchylkou. Pochopte Besselovu korekci, kdy použít n-1 vs. n, s jasnými příklady.

Přehled

Jednou z nejčastějších otázek ve statistice je: “Mám dělit n nebo n-1?” Odpověď závisí na tom, zda pracujete s celou populací nebo pouze s výběrem.

Populace (N)

Použijte, když máte data pro každého člena skupiny, kterou studujete. σ = √[Σ(x-μ)² / N]

Výběr (n-1)

Použijte, když máte data z podmnožiny větší populace. s = √[Σ(x-x̄)² / (n-1)]

Populační směrodatná odchylka (σ)

Populační směrodatná odchylka se používá, když máte měření od každého jednotlivého člena skupiny, kterou analyzujete. V praxi je to relativně vzácné.

Příklady skutečných populací:

  • Všech 50 zaměstnanců v malé firmě
  • Každý student v konkrétní třídě o 30 žácích
  • Všechny transakce v uzavřeném fiskálním roce
  • Kompletní data ze sčítání lidu

Výběrová směrodatná odchylka (s)

Výběrová směrodatná odchylka se používá, když pracujete s podmnožinou větší populace. Toto je v reálných analýzách častější scénář.

Příklady výběrů:

  • Průzkum 1 000 voličů k předpovědi výsledků voleb
  • Testování 50 výrobků z výrobní šarže 10 000
  • Měření krevního tlaku 200 pacientů v klinické studii
  • Analýza 5 let dat o akciích k předpovědi budoucí volatility

Besselova korekce vysvětlena

Besselova korekce je důvodem, proč používáme (n-1) místo n při výpočtu výběrové směrodatné odchylky. Pojmenována po německém matematikovi Friedrichu Besselovi, tato úprava poskytuje nestranný odhad populačního rozptylu.

Proč (n-1) funguje

Když vypočítáte výběrový průměr, “spotřebujete” jeden stupeň volnosti. Výběrový průměr omezuje data – jakmile znáte n-1 hodnot a průměr, poslední hodnota je určena. Dělení (n-1) koriguje tuto ztrátu volnosti.

Matematická intuice

Datové body výběru mají tendenci se shlukovat blíže k výběrovému průměru než ke skutečnému populačnímu průměru. To způsobuje, že součet čtverců odchylek je systematicky menší, než by měl být.

Dělení (n-1) místo n výsledek mírně zvyšuje, čímž kompenzuje toto podhodnocení a poskytuje nestranný odhad.

Kdy použít kterou

ScénářPoužijteDělte
Máte všechny existující datové bodyPopulační SO (σ)N
Popisujete pouze data, která mátePopulační SO (σ)N
Odhadujete pro větší populaciVýběrovou SO (s)n-1
SO použijete pro inferenční statistikuVýběrovou SO (s)n-1

Orientační pravidlo

V případě pochybností použijte výběrovou směrodatnou odchylku (n-1). Je to bezpečnější, protože: - Většina reálných dat pochází z výběrů, nikoli z úplných populací - Použití n-1 na skutečnou populaci mírně nadhodnocuje (bezpečnější než podhodnocení) - Pro velké n je rozdíl stejně zanedbatelný

Praktické příklady

Příklad: Kontrola kvality

Továrna vyrábí 10 000 součástek denně. Kontrola kvality testuje 100 součástek a zjistí, že jejich hmotnost má průměr 50 g. Odpověď: Použijte výběrovou SO (n-1), protože 100 součástek je výběr z 10 000 vyrobených. Tento výběr používáte k odhadu variability všech součástek.

Příklad: Známky ve třídě

Učitelka chce popsat variabilitu výsledků testů ve své třídě 25 studentů. Nesnaží se zobecňovat na jiné třídy. Odpověď: Použijte populační SO (N), protože má výsledky za celou třídu (její populace zájmu) a nedělá závěry o jiných skupinách.