Co je rozptyl?
Rozptyl měří, jak daleko jsou čísla rozptýlena od své průměrné hodnoty. Je to průměr umocněných rozdílů od průměru – a je základem, na kterém je směrodatná odchylka postavena.
Každý sloupec ukazuje umocněnou odchylku od průměru. Rozptyl = průměr těchto sloupců.
Vzorec rozptylu
Populační rozptyl
σ² = Σ(xᵢ - μ)² / N
Výběrový rozptyl
s² = Σ(xᵢ - x̄)² / (n-1)
1
Vypočítejte průměr
Sečtěte všechny hodnoty a vydělte jejich počtem.
2
Najděte každou odchylku
Odečtěte průměr od každého datového bodu.
3
Umocněte každou odchylku
Tím odstraníte záporné hodnoty a zvýrazníte velké odchylky.
4
Zprůměrujte umocněné odchylky
Vydělte N (populace) nebo n-1 (výběr).
Proč umocňujeme odchylky?
Tři klíčové důvody
1. Eliminace záporných hodnot: Bez umocnění by se kladné a záporné odchylky vzájemně vyrušily a součet by byl nula.
2. Penalizace odlehlých hodnot: Umocnění dává větší váhu hodnotám vzdáleným od průměru.
3. Matematické vlastnosti: Rozptyl má užitečné algebraické vlastnosti pro statistickou inferenci.
Příklad: Proč nepoužít absolutní hodnoty?
Datový soubor: 2, 4, 4, 4, 5, 5, 7, 9 (Průměr = 5)
Průměrná absolutní odchylka:
|2-5| + |4-5| + ... = 14
MAD = 14/8 = 1,75
Rozptyl (umocněný):
(2-5)² + (4-5)² + ... = 32
Var = 32/8 = 4
Rozptyl vs. směrodatná odchylka
Vzájemný vztah
Standard Deviation = √Variance → σ = √σ²
Rozptyl (σ²)
- Jednotky jsou umocněné (např. cm², Kč²)
- Obtížnější přímá interpretace
- Užitečný pro matematické operace
- Aditivní pro nezávislé proměnné
Směrodatná odchylka (σ)
- Stejné jednotky jako původní data
- Snáze interpretovatelná
- Lepší pro komunikaci
- Používaná v z-skóre a intervalech spolehlivosti
Aplikace rozptylu
Zatímco směrodatná odchylka se uvádí častěji, rozptyl má specifické využití:
- ANOVA:Analýza rozptylu porovnává průměry mezi skupinami
- Teorie portfolia:Rozptyly výnosů se používají při optimalizaci
- Regrese:R² je vysvětlený rozptyl dělený celkovým rozptylem
- PCA:Analýza hlavních komponent maximalizuje vysvětlený rozptyl