Oltre media e deviazione standard
Mentre media e deviazione standard descrivono il centro e la dispersione, l’asimmetria e la curtosi descrivono la forma delle distribuzioni: l’asimmetria e la pesantezza delle code.
In statistica, le distribuzioni si descrivono usando i “momenti”, sintesi matematiche che catturano diversi aspetti della forma:
- 1° momento:Media (tendenza centrale)
- 2° momento:Varianza/Deviazione standard (dispersione)
- 3° momento:Asimmetria (mancanza di simmetria)
- 4° momento:Curtosi (pesantezza delle code)
Due distribuzioni possono avere medie e deviazioni standard identiche eppure apparire completamente diverse. L’asimmetria e la curtosi catturano queste differenze, fornendo un quadro più completo della distribuzione dei dati.
Asimmetria: misurare la mancanza di simmetria
L’asimmetria misura quanto una distribuzione è non simmetrica. Un’asimmetria positiva indica una coda destra più lunga (es. distribuzioni del reddito), mentre un’asimmetria negativa indica una coda sinistra più lunga.
Asimmetria campionaria
- Asimmetria = 0:Distribuzione simmetrica (normale, uniforme)
- Asimmetria > 0:Asimmetria positiva — la media supera la mediana (reddito, prezzi immobiliari)
- Asimmetria < 0:Asimmetria negativa — la mediana supera la media (età al pensionamento, voti di esami con limite massimo)
Dati comunemente asimmetrici a destra
Linee guida per l’interpretazione:
- |Asimmetria| < 0,5: Approssimativamente simmetrica
- 0,5 ≤ |Asimmetria| < 1: Moderatamente asimmetrica
- |Asimmetria| ≥ 1: Fortemente asimmetrica
Curtosi: pesantezza delle code
La curtosi misura quanto le code sono pesanti o leggere rispetto a una distribuzione normale. Una curtosi elevata significa più valori estremi (code pesanti), una curtosi bassa significa meno valori estremi.
Un equivoco comune è che la curtosi misuri l’“acutezza del picco”. Sebbene correlate, la curtosi riguarda fondamentalmente le code. Una distribuzione con curtosi elevata ha più massa di probabilità nelle code e al picco, ma meno nelle “spalle”.
Curtosi in eccesso
- Mesocurtica (k ≈ 0):Code simili alla normale (riferimento per il confronto)
- Leptocurtica (k > 0):Code pesanti, più valori estremi della normale (rendimenti azionari, terremoti)
- Platicurtica (k < 0):Code leggere, meno valori estremi della normale (distribuzione uniforme, dati delimitati)
Code pesanti in finanza
Applicazioni pratiche
Gestione del rischio: Una curtosi elevata significa risultati estremi più frequenti. Il VaR e altre misure di rischio che assumono la normalità possono sottostimare drasticamente il rischio reale quando la curtosi è elevata.
Controllo qualità: Dati di produzione con curtosi elevata suggeriscono deviazioni estreme occasionali dall’obiettivo, anche se le prestazioni medie sono accettabili. Questo schema può indicare instabilità del processo che richiede indagine.
Trasformazione dei dati: Dati fortemente asimmetrici possono beneficiare di trasformazioni (logaritmo, radice quadrata) prima dell’analisi. L’obiettivo è spesso raggiungere una normalità approssimativa per i test statistici che la presuppongono.
Test statistici: Molti test assumono la normalità. Un’asimmetria o una curtosi significative possono indicare che questa assunzione è violata, suggerendo l’uso di alternative non parametriche o metodi robusti.
Linee guida per l’interpretazione
Test di normalità: Il test di Jarque-Bera combina asimmetria e curtosi per verificare la normalità. Rifiuta la normalità quando una delle due metriche devia significativamente da zero.
Considerazioni sulla dimensione del campione: Campioni piccoli producono stime inaffidabili di asimmetria e curtosi. Con n < 50, queste statistiche hanno un’elevata variabilità campionaria. Con n < 20, sono essenzialmente prive di significato.
Robustezza: Sia l’asimmetria che la curtosi sono sensibili ai valori anomali. Un singolo valore estremo può influenzare drasticamente queste statistiche, pertanto è sempre consigliabile visualizzare i dati insieme ai riepiloghi numerici.