Σ
SDCalc
ZačátečníkFundamentals·9 min

Co je směrodatná odchylka? Definice, vzorec a příklady

Naučte se, co je směrodatná odchylka, jak ji vypočítat pro výběry a základní soubory a proč je klíčová pro analýzu dat. Zvládněte vzorce ještě dnes.

By Standard Deviation Calculator Team · Data Science Team·Published

Co je směrodatná odchylka?

Směrodatná odchylka je statistická míra, která kvantifikuje míru variability neboli rozptýlení v souboru datových hodnot. Nízká směrodatná odchylka znamená, že datové body se obvykle nacházejí blízko průměru (střední hodnoty) souboru, zatímco vysoká směrodatná odchylka ukazuje, že datové body jsou rozptýleny v širším rozsahu hodnot. Označuje se řeckým písmenem σ (sigma) pro základní soubor a písmenem s pro výběr, a patří k nejzákladnějším konceptům popisné statistiky.

Základní definice

Směrodatná odchylka měří typickou vzdálenost každého datového bodu od průměru. Říká vám, jak moc se vaše data v průměru odchylují od středu.

Směrodatná odchylka základního souboru vs. výběru

Před výpočtem směrodatné odchylky musíte určit, zda vaše data představují celý základní soubor, nebo výběr ze základního souboru. Základní soubor zahrnuje všechny členy určené skupiny, zatímco výběr je reprezentativní podmnožina této skupiny. Výpočet směrodatné odchylky pro výběr vyžaduje matematickou úpravu – použití n - 1 (stupně volnosti, nebo df) místo N – aby byla zajištěna nestrannost odhadu rozptylu základního souboru.

Směrodatná odchylka základního souboru

Používá se, když máte data za celou skupinu. Označuje se σ. Jmenovatel ve vzorci pro rozptyl je N (velikost celého základního souboru).

Směrodatná odchylka výběru

Používá se, když máte k dispozici pouze podmnožinu skupiny. Označuje se s. Jmenovatel ve vzorci pro rozptyl je n - 1 (velikost výběru minus jedna) pro korekci zkreslení.

Vysvětlení vzorce pro směrodatnou odchylku

Vzorce pro směrodatnou odchylku vycházejí z výpočtu rozptylu, ze kterého se následně extrahuje odmocnina. Tento krok s odmocninou je klíčový, protože vrací míru rozptýlení zpět do původních jednotek dat. Klíčovými složkami jsou xᵢ (jednotlivé hodnoty), μ nebo (průměr základního souboru nebo výběru) a N nebo n (celkový počet hodnot).

SD základního souboru

σ = √[ Σ(xᵢ - μ)² / N ]

SD výběru

s = √[ Σ(xᵢ - x̄)² / (n - 1) ]

Příklad výpočtu krok za krokem

Vypočítejme směrodatnou odchylku výběru pro malou datovou sadu výsledků testů: [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]. Postupný výpočet podle vzorce ukazuje, jak se rozptyl hromadí, než vezmeme konečnou odmocninu.

1

Vypočítejte průměr (x̄)

Sečtěte všechny hodnoty a vydělte jejich počtem: (4+8+6+5+3+2+8+9+2+5) / 10 = 52 / 10 = 5.2
2

Odečtěte průměr a výsledek umocněte na druhou

Pro každou hodnotu najděte druhou mocninu rozdílu: (4-5.2)² = 1.44, (8-5.2)² = 7.84, (6-5.2)² = 0.64 atd.
3

Sečtěte druhé mocniny rozdílů

Sečtěte všechny umocněné výsledky: 1.44 + 7.84 + 0.64 + 0.04 + 4.84 + 10.24 + 7.84 + 14.44 + 10.24 + 0.04 = 57.6
4

Vydělte hodnotou n - 1 (stupně volnosti)

Vydělte součet velikostí výběru minus jedna: 57.6 / (10 - 1) = 57.6 / 9 = 6.4. Toto je výběrový rozptyl (σ²).
5

Extrahujte odmocninu

Zjistěte druhou odmocninu z rozptylu: √6.4 ≈ 2.53. Směrodatná odchylka výběru je 2.53.

Výpočet směrodatné odchylky v Pythonu

Ruční výpočet směrodatné odchylky je náchylný k chybám, zejména u velkých datových sad. V praxi statistici a datoví analytici používají programovací jazyky jako Python, kde ji okamžitě vypočítají pomocí vestavěných knihoven.

python
import statistics

data = [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]

# Výpočet směrodatné odchylky výběru (výchozí)
sample_sd = statistics.stdev(data)
print(f"Sample SD: {sample_sd:.2f}")

# Výpočet směrodatné odchylky základního souboru
pop_sd = statistics.pstdev(data)
print(f"Population SD: {pop_sd:.2f}")

Empirické pravidlo a směrodatná odchylka

Pokud data následují normální rozdělení (Gaussovu křivku), stává se směrodatná odchylka neuvěřitelně prediktivní. Empirické pravidlo, také známé jako pravidlo 68-95-99.7, uvádí, že téměř všechna data spadají do tří směrodatných odchylek od průměru. To analytikům umožňuje rychle identifikovat odlehlé hodnoty a porozumět pravděpodobnosti výskytu konkrétního pozorování.

Interval od průměruPodíl datAplikace
±1σ68.27%Identifikace typických, běžných hodnot
±2σ95.45%Nastavení intervalů spolehlivosti
±3σ99.73%Detekce extrémních odlehlých hodnot

Směrodatná odchylka vs. rozptyl

Rozptyl a směrodatná odchylka jsou úzce související míry rozptýlení. Rozptyl (σ² nebo s²) je průměr druhých mocnin rozdílů od průměru, zatímco směrodatná odchylka je druhá odmocnina z rozptylu. Protože se rozptyl vyjadřuje ve čtverečných jednotkách (např. koruny na druhou, centimetry na druhou), může být obtížné jej interpretovat v kontextu původních dat. Směrodatná odchylka tento problém řeší převedením míry zpět do původních jednotek.

Prezentace vašich dat

Při popisu dat vždy uvádějte směrodatnou odchylku spolu s průměrem. Protože SD je ve stejných jednotkách jako průměr (např. koruny, centimetry, kilogramy), poskytuje intuitivní míru rozptýlení, kterou vaše publikum okamžitě pochopí.

Častá úskalí, kterým je třeba se vyhnout

Ačkoli je směrodatná odchylka mocný nástroj, často se zneužívá. Nesprávné použití vzorců nebo nepochopení toho, co hodnota představuje, může vést k chybné analýze dat a nesprávným závěrům.

  • Použití vzorce pro základní soubor u výběru: Zapomenutí použití n - 1 u výběrů uměle snižuje vypočítané rozptýlení a podhodnocuje skutečný rozptyl základního souboru.
  • Aplikace SD na nenormální rozdělení: Empirické pravidlo platí pouze pro normální rozdělení. U silně zešikmených dat SD nemusí přesně odrážet rozptýlení.
  • Záměna SD se standardní chybou: Standardní chyba měří přesnost odhadu výběrového průměru, zatímco směrodatná odchylka měří rozptýlení samotných podkladových dat.

Pozor na odlehlé hodnoty

Směrodatná odchylka je vysoce citlivá na extrémní odlehlé hodnoty. Protože vzorec umocňuje na druhou rozdíly od průměru, jediná masivní odchylka může nepřiměřeně zvětšit směrodatnou odchylku a způsobit, že se data jeví jako variabilnější, než ve skutečnosti jsou.

Further Reading

Sources

References and further authoritative reading used in preparing this article.

  1. Wikipedie: Směrodatná odchylka
  2. NIST/SEMATECH e-Příručka statistických metod
  3. Khan Academy: Statistika a pravděpodobnost