Dincolo de medie și deviație standard
În timp ce media și deviația standard descriu centrul și dispersia, asimetria și curtosisul descriu forma distribuțiilor — lipsa de simetrie și greutatea cozilor.
În statistică, descriem distribuțiile folosind “momente” — rezumate matematice care surprind diferite aspecte ale formei:
- Momentul 1:Media (tendința centrală)
- Momentul 2:Varianța/Deviația standard (dispersia)
- Momentul 3:Asimetria (lipsa de simetrie)
- Momentul 4:Curtosisul (greutatea cozilor)
Două distribuții pot avea medii și deviații standard identice și totuși să arate complet diferit. Asimetria și curtosisul surprind aceste diferențe, oferind o imagine mai completă a distribuției datelor tale.
Asimetria: măsurarea lipsei de simetrie
Asimetria măsoară cât de asimetrică este o distribuție. Asimetria pozitivă înseamnă o coadă mai lungă la dreapta (de ex., distribuțiile veniturilor), în timp ce asimetria negativă înseamnă o coadă mai lungă la stânga.
Sample Skewness
- Asimetrie = 0:Distribuție simetrică (normală, uniformă)
- Asimetrie > 0:Asimetrică la dreapta — media depășește mediana (venituri, prețuri imobiliare)
- Asimetrie < 0:Asimetrică la stânga — mediana depășește media (vârsta la pensionare, note la examene cu plafon)
Date frecvent asimetrice la dreapta
Ghid de interpretare:
- |Asimetrie| < 0,5: Aproximativ simetrică
- 0,5 ≤ |Asimetrie| < 1: Moderat asimetrică
- |Asimetrie| ≥ 1: Puternic asimetrică
Curtosis: greutatea cozilor
Curtosisul măsoară cât de grele sau ușoare sunt cozile comparativ cu o distribuție normală. Un curtosis ridicat înseamnă mai multe valori extreme (cozi groase), un curtosis scăzut înseamnă mai puține.
O concepție greșită frecventă este că curtosisul măsoară “ascuțimea vârfului”. Deși sunt legate, curtosisul se referă fundamental la cozi. O distribuție cu curtosis ridicat are mai multă masă de probabilitate în cozi și la vârf, dar mai puțin în “umerii” distribuției.
Excess Kurtosis
- Mezocurtic (k ≈ 0):Cozi similare cu cele normale (linia de bază pentru comparație)
- Leptocurtic (k > 0):Cozi groase, mai multe valori extreme decât normalul (randamente bursiere, cutremure)
- Platicurtic (k < 0):Cozi subțiri, mai puține extreme decât normalul (distribuție uniformă, date limitate)
Cozi groase în finanțe
Aplicații practice
Managementul riscului: Un curtosis ridicat înseamnă rezultate extreme mai frecvente. VaR și alte măsuri de risc care presupun normalitate pot subestima drastic riscul real când curtosisul este ridicat.
Controlul calității: Datele de producție cu curtosis ridicat sugerează abateri extreme ocazionale de la țintă, chiar dacă performanța medie este acceptabilă. Acest tipar poate indica instabilitate a procesului care necesită investigare.
Transformarea datelor: Datele puternic asimetrice pot beneficia de transformare (logaritmică, radical) înainte de analiză. Scopul este adesea obținerea unei normalități aproximative pentru testele statistice care o presupun.
Testare statistică: Multe teste presupun normalitate. O asimetrie sau un curtosis semnificativ poate indica încălcarea acestei ipoteze, sugerând utilizarea alternativelor neparametrice sau a metodelor robuste.
Ghid de interpretare
Testarea normalității: Testul Jarque-Bera combină asimetria și curtosisul pentru a testa normalitatea. Respinge normalitatea când oricare dintre cele două metrici deviază semnificativ de la zero.
Considerații privind dimensiunea eșantionului: Eșantioanele mici produc estimări nesigure ale asimetriei și curtosisului. Cu n < 50, aceste statistici au variabilitate mare de eșantionare. Cu n < 20, sunt practic lipsite de sens.
Robustețe: Atât asimetria, cât și curtosisul sunt sensibile la valori aberante. O singură valoare extremă poate afecta dramatic aceste statistici, așa că vizualizează întotdeauna datele alături de rezumatele numerice.