Mi a variancia?
A variancia azt méri, mennyire szóródnak szét a számok az átlagértéküktől. Az átlagtól való négyzetes eltérések átlaga – és ez az az alap, amelyre a szórás épül.
Minden oszlop az átlagtól való négyzetes eltérést mutatja. A variancia ezeknek az oszlopoknak az átlaga.
A variancia képlete
Populációs variancia
σ² = Σ(xᵢ - μ)² / N
Mintavariancia
s² = Σ(xᵢ - x̄)² / (n-1)
1
Számítsd ki az átlagot
Add össze az értékeket és oszd el a darabszámmal.
2
Határozd meg az eltéréseket
Vond ki az átlagot minden adatpontból.
3
Emeld négyzetre az eltéréseket
Ezzel megszünteted a negatív értékeket és kiemeled a nagy eltéréseket.
4
Átlagold a négyzetes eltéréseket
Oszd el N-nel (populáció) vagy n-1-gyel (minta).
Miért emeljük négyzetre az eltéréseket?
Három fő ok
1. Negatívok kiküszöbölése: Négyzetre emelés nélkül a pozitív és negatív eltérések kioltanák egymást, és az összeg nulla lenne.
2. Kiugró értékek büntetése: A négyzetre emelés nagyobb súlyt ad az átlagtól távol eső értékeknek.
3. Matematikai tulajdonságok: A varianciának hasznos algebrai tulajdonságai vannak a statisztikai következtetéshez.
Példa: Miért nem használunk egyszerűen abszolút értékeket?
Adatsor: 2, 4, 4, 4, 5, 5, 7, 9 (átlag = 5)
Átlagos abszolút eltérés:
|2-5| + |4-5| + ... = 14
MAD = 14/8 = 1,75
Variancia (négyzetes):
(2-5)² + (4-5)² + ... = 32
Var = 32/8 = 4
Variancia vs. szórás
Az összefüggés
Standard Deviation = √Variance → σ = √σ²
Variancia (σ²)
- A mértékegységek négyzetesek (pl. cm², Ft²)
- Nehezebben értelmezhető közvetlenül
- Hasznos matematikai műveleteknél
- Független változók esetén összeadható
Szórás (σ)
- Az eredeti adatokkal azonos mértékegységben
- Könnyebben értelmezhető
- Jobb a kommunikációhoz
- Z-értékekhez és konfidenciaintervallumokhoz használatos
A variancia alkalmazásai
Bár a szórást gyakrabban közlik, a varianciának sajátos felhasználási területei vannak:
- ANOVA:A varianciaanalízis csoportok átlagait hasonlítja össze
- Portfólióelmélet:A hozamok varianciáit használják az optimalizálásban
- Regresszió:Az R² a magyarázott variancia és a teljes variancia hányadosa
- PCA:A főkomponens-analízis a magyarázott varianciát maximalizálja