Ce este varianța?
Varianța măsoară cât de răspândit este un set de numere față de valoarea lor medie. Este media diferențelor pătratice față de medie — și este fundamentul pe care se construiește deviația standard.
Fiecare bară arată abaterea pătratică de la medie. Varianța = media acestor bare.
Formula varianței
Varianța populației
σ² = Σ(xᵢ - μ)² / N
Varianța eșantionului
s² = Σ(xᵢ - x̄)² / (n-1)
1
Calculează media
Adună toate valorile și împarte la numărul lor.
2
Găsește fiecare abatere
Scade media din fiecare punct de date.
3
Ridică la pătrat fiecare abatere
Aceasta elimină valorile negative și pune accent pe abaterile mari.
4
Calculează media abaterilor pătratice
Împarte la N (populație) sau n-1 (eșantion).
De ce ridicăm la pătrat abaterile?
Trei motive cheie
1. Eliminarea valorilor negative: Fără ridicare la pătrat, abaterile pozitive și negative s-ar anula, făcând suma zero.
2. Penalizarea valorilor aberante: Ridicarea la pătrat acordă mai multă greutate valorilor îndepărtate de medie.
3. Proprietăți matematice: Varianța are proprietăți algebrice utile pentru inferența statistică.
Exemplu: De ce nu folosim doar valori absolute?
Set de date: 2, 4, 4, 4, 5, 5, 7, 9 (Media = 5)
Deviația medie absolută:
|2-5| + |4-5| + ... = 14
MAD = 14/8 = 1,75
Varianța (pătratică):
(2-5)² + (4-5)² + ... = 32
Var = 32/8 = 4
Varianța vs. deviația standard
Relația
Standard Deviation = √Variance → σ = √σ²
Varianța (σ²)
- Unitățile sunt la pătrat (ex. cm², $²)
- Mai greu de interpretat direct
- Utilă pentru operații matematice
- Aditivă pentru variabile independente
Deviația standard (σ)
- Aceleași unități ca datele originale
- Mai ușor de interpretat
- Mai bună pentru comunicare
- Folosită în scoruri z și intervale de încredere
Aplicațiile varianței
Deși deviația standard este raportată mai frecvent, varianța are utilizări specifice:
- ANOVA:Analiza varianței compară mediile între grupuri
- Teoria portofoliului:Varianțele randamentelor sunt folosite în optimizare
- Regresie:R² este varianța explicată împărțită la varianța totală
- PCA:Analiza componentelor principale maximizează varianța explicată