A statisztikai szignifikancián túl: a hatásméret megértése
A hatásméret a különbség vagy kapcsolat nagyságrendjét méri, függetlenül a mintamérettől. Míg a p-értékek megmondják, hogy egy hatás statisztikailag szignifikáns-e, a hatásméret megmutatja, mennyire gyakorlatilag jelentős az adott hatás. Ez a megkülönböztetés kulcsfontosságú a bizonyítékokon alapuló döntéshozatalban a kutatásban, orvostudományban, oktatásban és üzleti életben.
Gondolj egy gyógyszeripari vizsgálatra, ahol egy új gyógyszer statisztikailag szignifikáns javulást mutat (p < 0,001) a placebóhoz képest. Hatásméret nélkül nem tudod, hogy a javulás 0,1% vagy 50%. A hatásméret biztosítja ezt a döntő fontosságú kontextust, segítve az érintetteket annak meghatározásában, hogy a hatás megéri-e a költségeket, mellékhatásokat vagy a bevezetési erőfeszítést.
A két csoport összehasonlításának leggyakoribb hatásméret-mutatója a Cohen-féle d, amely az átlagok közötti különbséget szórásegységekben fejezi ki. Ez a standardizálás lehetővé teszi az összehasonlítást különböző vizsgálatok és mérési skálák között.
Miért fontos a hatásméret?
A statisztikai szignifikanciát nagymértékben befolyásolja a mintaméret. Elegendően nagy mintánál még a jelentéktelen különbségek is „szignifikánssá” válnak. Fordítva, fontos hatások kis mintáknál nem feltétlenül érik el a szignifikanciaszintet. A hatásméret megoldja ezt a problémát azáltal, hogy mintamérettől független mérőszámot biztosít.
A szignifikancia csapdája
A hatásméret használatának fő okai:
- Metaanalízis: A hatásméretek vizsgálatok között kombinálhatók az összesített hatás becsléséhez
- Statisztikai erő elemzése: Szükséges a jövőbeli vizsgálatokhoz szükséges mintaméret kiszámításához
- Gyakorlati döntések: Segít meghatározni, hogy érdemes-e beavatkozásokat bevezetni
- Replikáció: Célértéket biztosít, amelyet a megismétlő vizsgálatoknak el kell érniük
Cohen-féle d: a standard hatásméret-mutató
A Cohen-féle d a két csoportátlag közötti különbséget az összesített szórás egységeiben fejezi ki:
Cohen's d
Ahol M₁ és M₂ a csoportátlagok, sp pedig az összesített szórás, amelyet a következőképpen számítunk ki:
Pooled Standard Deviation
A d előjele az irányt jelzi: pozitív, ha M₁ > M₂, negatív, ha M₁ < M₂. Gyakran az abszolút értéket |d| közlik, ha az irány nyilvánvaló a kontextusból.
Miért összesítjük a szórást?
Alternatív hatásméret-mutatók
Bár a Cohen-féle d a legelterjedtebb, léteznek alternatívák meghatározott helyzetekre:
Hedges-féle g: torzítás-korrigált hatásméret
A Cohen-féle d kis mintáknál enyhén felülbecsüli a populációs hatásméretet. A Hedges-féle g korrekciós tényezőt alkalmaz:
Hedges' g Correction
20 fős csoportméret felett a különbség elhanyagolható. Kis minták (n < 20) esetén a Hedges-féle g előnyben részesítendő.
Glass-féle Δ: ha a varianciák eltérnek
Ha az egyik csoport egy ismert változékonyságú kontrollcsoport, csak a kontrollcsoport szórását használjuk nevezőként:
Glass's Delta
Akkor hasznos, ha a kezelés befolyásolhatja a varianciát (pl. olyan beavatkozás, amely jobban segít a gyengébben teljesítőknek, mint a jól teljesítőknek).
Hatásméretek értelmezése: Cohen irányelvei
Jacob Cohen a következő konvenciókat javasolta a d értékek értelmezéséhez:
| Hatásméret (d) | Értelmezés | Átfedés |
|---|---|---|
| 0,2 | Kis | 85% átfedés a csoportok között |
| 0,5 | Közepes | 67% átfedés a csoportok között |
| 0,8 | Nagy | 53% átfedés a csoportok között |
| 1,2 | Nagyon nagy | 40% átfedés a csoportok között |
| 2,0 | Hatalmas | 19% átfedés a csoportok között |
A kontextus számít
Kidolgozott példa: oktatási beavatkozás
Egy iskola új olvasási programot tesztel. Kontrollcsoport (n=25): átlag=72, SD=12. Kezelési csoport (n=30): átlag=79, SD=14. Számítsuk ki a Cohen-féle d-t:
Összesített variancia kiszámítása
Összesített szórás kiszámítása
Cohen-féle d kiszámítása
Értelmezés
Ez azt jelenti, hogy ha véletlenszerűen kiválasztanánk egy tanulót a kezelési és egy tanulót a kontrollcsoportból, a kezelési csoportbeli tanuló az esetek mintegy 64%-ában jobban teljesítene (az átfedésből számítva).
Python implementáció
Hatásméretek programozott kiszámítása konfidenciaintervallumokkal:
import numpy as np
from scipy import stats
def cohens_d(group1, group2):
"""Calculate Cohen's d for two independent groups."""
n1, n2 = len(group1), len(group2)
var1, var2 = np.var(group1, ddof=1), np.var(group2, ddof=1)
# Pooled standard deviation
pooled_std = np.sqrt(((n1-1)*var1 + (n2-1)*var2) / (n1+n2-2))
# Cohen's d
d = (np.mean(group1) - np.mean(group2)) / pooled_std
return d
def hedges_g(group1, group2):
"""Calculate Hedges' g (bias-corrected effect size)."""
n1, n2 = len(group1), len(group2)
d = cohens_d(group1, group2)
# Correction factor for small sample bias
correction = 1 - 3 / (4*(n1+n2) - 9)
return d * correction
# Example usage
control = [68, 72, 75, 70, 69, 74, 71, 73, 76, 72]
treatment = [75, 79, 82, 78, 80, 77, 81, 76, 83, 79]
d = cohens_d(treatment, control)
g = hedges_g(treatment, control)
print(f"Cohen's d: {d:.3f}")
print(f"Hedges' g: {g:.3f}")