Az átlagon és szóráson túl
Míg az átlag és a szórás a központi helyzetet és a szóródást írják le, a ferdeség és a csúcsosság az eloszlások alakját jellemzik – az aszimmetriát és a szélek vastagságát.
A statisztikában az eloszlásokat „momentumok” segítségével írjuk le – matematikai összefoglalók, amelyek az alak különböző aspektusait ragadják meg:
- 1. momentum:Átlag (központi tendencia)
- 2. momentum:Variancia/szórás (szóródás)
- 3. momentum:Ferdeség (aszimmetria)
- 4. momentum:Csúcsosság (szélek vastagsága)
Két eloszlásnak lehet azonos átlaga és szórása, mégis teljesen különböznek. A ferdeség és a csúcsosság megragadja ezeket a különbségeket, teljesebb képet adva az adatok eloszlásáról.
Ferdeség: az aszimmetria mérése
A ferdeség azt méri, mennyire aszimmetrikus egy eloszlás. A pozitív ferdeség hosszabb jobb oldali farkot jelent (pl. jövedelemeloszlások), míg a negatív ferdeség hosszabb bal oldali farkot.
Sample Skewness
- Ferdeség = 0:Szimmetrikus eloszlás (normális, egyenletes)
- Ferdeség > 0:Jobbra ferde – az átlag meghaladja a mediánt (jövedelem, lakásárak)
- Ferdeség < 0:Balra ferde – a medián meghaladja az átlagot (nyugdíjba vonulási kor, maximált vizsgaeredmények)
Gyakori jobbra ferde adatok
Értelmezési irányelvek:
- |Ferdeség| < 0,5: Közelítőleg szimmetrikus
- 0,5 ≤ |Ferdeség| < 1: Mérsékelten ferde
- |Ferdeség| ≥ 1: Erősen ferde
Csúcsosság: a szélek vastagsága
A csúcsosság azt méri, mennyire vastagok vagy vékonyak a szélek a normális eloszláshoz képest. Magas csúcsosság több szélsőséges értéket jelent (vastag szélek), alacsony csúcsosság kevesebbet.
Gyakori tévhit, hogy a csúcsosság a „csúcsosságot” méri. Bár összefügg vele, a csúcsosság alapvetően a szélekről szól. A magas csúcsosságú eloszlás a szélekben és a csúcsnál hordoz több valószínűségi tömeget, de a „vállakban” kevesebbet.
Excess Kurtosis
- Mezokurtikus (k ≈ 0):Normálishoz hasonló szélek (összehasonlítási alap)
- Leptokurtikus (k > 0):Vastag szélek, több szélsőséges érték, mint normálisnál (részvényhozamok, földrengések)
- Platikurtikus (k < 0):Vékony szélek, kevesebb szélsőérték, mint normálisnál (egyenletes eloszlás, korlátozott adatok)
Vastag szélek a pénzügyekben
Gyakorlati alkalmazások
Kockázatkezelés: A magas csúcsosság gyakoribb szélsőséges kimeneteleket jelent. A normalitást feltételező VaR és más kockázati mutatók drasztikusan alulbecsülhetik a valódi kockázatot, ha a csúcsosság magas.
Minőségellenőrzés: A magas csúcsosságú gyártási adatok alkalmanként szélsőséges eltéréseket jeleznek a célértéktől, még akkor is, ha az átlagos teljesítmény elfogadható. Ez a mintázat folyamat-instabilitásra utalhat, amely vizsgálatot igényel.
Adattranszformáció: Az erősen ferde adatok transzformálásból profitálhatnak (logaritmikus, négyzetgyök) az elemzés előtt. A cél gyakran a közelítő normalitás elérése azon statisztikai próbák számára, amelyek ezt feltételezik.
Statisztikai vizsgálatok: Számos próba normalitást feltételez. A jelentős ferdeség vagy csúcsosság jelezheti, hogy ez a feltételezés sérül, nemparametrikus alternatívák vagy robusztus módszerek alkalmazását javasolva.
Értelmezési irányelvek
Normalitásvizsgálat: A Jarque-Bera teszt kombinálja a ferdeséget és a csúcsosságot a normalitás vizsgálatához. Akkor utasítja el a normalitást, ha bármelyik mutató szignifikánsan eltér a nullától.
Mintaméret szempontjai: Kis minták megbízhatatlan ferdeség- és csúcsossági becsléseket produkálnak. n < 50 esetén ezek a statisztikák nagy mintavételi változékonysággal bírnak. n < 20 alatt lényegében értelmetlenek.
Robusztusság: Mind a ferdeség, mind a csúcsosság érzékeny a kiugró értékekre. Egyetlen szélsőséges érték drámaian befolyásolhatja ezeket a statisztikákat, ezért mindig vizualizáld az adataidat a számszerű összefoglalók mellett.