Che cos’è la varianza?
La varianza misura quanto un insieme di numeri è disperso rispetto al valore medio. È la media degli scarti al quadrato dalla media ed è il fondamento su cui si costruisce la deviazione standard.
Ogni barra mostra lo scarto al quadrato dalla media. La varianza è la media di queste barre.
Formula della varianza
Varianza della popolazione
σ² = Σ(xᵢ - μ)² / N
Varianza campionaria
s² = Σ(xᵢ - x̄)² / (n-1)
1
Calcolare la media
Sommare tutti i valori e dividere per il loro numero.
2
Trovare ogni scarto
Sottrarre la media da ciascun dato.
3
Elevare al quadrato ogni scarto
Ciò elimina i valori negativi e amplifica le deviazioni più grandi.
4
Calcolare la media degli scarti al quadrato
Dividere per N (popolazione) o per n-1 (campione).
Perché si eleva al quadrato?
Tre ragioni fondamentali
1. Eliminare i negativi: Senza elevare al quadrato, gli scarti positivi e negativi si annullerebbero, rendendo la somma pari a zero.
2. Penalizzare i valori anomali: L’elevamento al quadrato dà più peso ai valori lontani dalla media.
3. Proprietà matematiche: La varianza possiede utili proprietà algebriche per l’inferenza statistica.
Esempio: perché non usare i valori assoluti?
Dataset: 2, 4, 4, 4, 5, 5, 7, 9 (Media = 5)
Deviazione media assoluta:
|2-5| + |4-5| + ... = 14
DMA = 14/8 = 1,75
Varianza (al quadrato):
(2-5)² + (4-5)² + ... = 32
Var = 32/8 = 4
Varianza vs deviazione standard
La relazione
Deviazione standard = √Varianza → σ = √σ²
Varianza (σ²)
- Le unità sono al quadrato (es. cm², €²)
- Più difficile da interpretare direttamente
- Utile per le operazioni matematiche
- Additiva per variabili indipendenti
Deviazione standard (σ)
- Stesse unità dei dati originali
- Più facile da interpretare
- Migliore per la comunicazione
- Usata nei punteggi Z e negli intervalli di confidenza
Applicazioni della varianza
Sebbene la deviazione standard sia riportata più frequentemente, la varianza ha usi specifici:
- ANOVA:L’analisi della varianza confronta le medie tra diversi gruppi
- Teoria del portafoglio:Le varianze dei rendimenti sono utilizzate nell’ottimizzazione
- Regressione:R² è la varianza spiegata divisa per la varianza totale
- PCA:L’analisi delle componenti principali massimizza la varianza spiegata