Σ
SDCalc
PokročilýAplikace·12 min

Cohenovo d a výpočty velikosti účinku

Zvládněte výpočty velikosti účinku včetně Cohenova d, Hedgesova g a Glassova delta. Naučte se měřit praktickou významnost nad rámec p-hodnot pomocí směrodatné odchylky.

Za hranice statistické významnosti: Pochopení velikosti účinku

Velikost účinku měří rozsah rozdílu nebo vztahu nezávisle na velikosti výběru. Zatímco p-hodnoty říkají, zda je účinek statisticky významný, velikost účinku říká, jak je tento účinek prakticky smysluplný. Toto rozlišení je klíčové pro rozhodování založené na důkazech ve výzkumu, medicíně, vzdělávání i podnikání.

Uvažte farmaceutickou studii, kde nový lék vykazuje statisticky významné zlepšení (p < 0,001) oproti placebu. Bez velikosti účinku nevíte, zda je zlepšení 0,1 % nebo 50 %. Velikost účinku poskytuje tento zásadní kontext a pomáhá zainteresovaným stranám rozhodnout, zda účinek stojí za náklady, vedlejší účinky nebo implementační úsilí.

Nejběžnější mírou velikosti účinku pro porovnání dvou skupin je Cohenovo d, které vyjadřuje rozdíl mezi průměry v jednotkách směrodatné odchylky. Tato standardizace umožňuje srovnání napříč různými studiemi a měřicími škálami.

Proč je velikost účinku důležitá

Statistická významnost je silně ovlivněna velikostí výběru. Při dostatečně velkém výběru se i triviální rozdíly stanou „významnými“. Naopak důležité účinky nemusí dosáhnout významnosti u malých výběrů. Velikost účinku tento problém řeší tím, že poskytuje míru nezávislou na velikosti výběru.

Past statistické významnosti

Studie s n=10 000 může ukázat p < 0,001 pro rozdíl 0,5 bodu na 100bodové škále. To je statisticky významné, ale prakticky bezvýznamné (d ≈ 0,05). Vždy uvádějte velikost účinku společně s p-hodnotami.

Hlavní důvody pro používání velikosti účinku:

  • Metaanalýza: Velikosti účinku lze kombinovat napříč studiemi pro odhad celkového efektu
  • Výkonová analýza: Nezbytná pro výpočet potřebné velikosti výběru v budoucích studiích
  • Praktická rozhodnutí: Pomáhá určit, zda stojí za to intervence implementovat
  • Replikace: Poskytuje cílovou hodnotu, kterou by měly replikační studie potvrdit

Cohenovo d: Standardní míra velikosti účinku

Cohenovo d vyjadřuje rozdíl mezi průměry dvou skupin v jednotkách sloučené směrodatné odchylky:

Cohen's d

d = (M₁ - M₂) / sp

Kde M₁ a M₂ jsou skupinové průměry a sp je sloučená směrodatná odchylka vypočtená jako:

Pooled Standard Deviation

sp = √[((n₁-1)s₁² + (n₂-1)s₂²) / (n₁+n₂-2)]

Znaménko d udává směr: kladné, když M₁ > M₂, záporné, když M₁ < M₂. Často se uvádí absolutní hodnota |d|, když je směr zřejmý z kontextu.

Proč slučovat směrodatnou odchylku?

Slučování předpokládá, že obě skupiny mají stejný populační rozptyl. Výsledný odhad je stabilnější než použití SO pouze jedné skupiny a odpovídá předpokladům dvouvýběrového t-testu.

Alternativní míry velikosti účinku

I když je Cohenovo d nejběžnější, existují alternativy pro specifické situace:

Hedgesovo g: Velikost účinku s korekcí vychýlení

Cohenovo d mírně nadhodnocuje populační velikost účinku u malých výběrů. Hedgesovo g aplikuje korekční faktor:

Hedges' g Correction

g = d × (1 - 3/(4(n₁+n₂) - 9))

U výběrů nad 20 na skupinu je rozdíl zanedbatelný. Pro malé výběry (n < 20) je upřednostněno Hedgesovo g.

Glassovo Δ: Při nestejných rozptylech

Pokud je jedna skupina kontrolní se známou variabilitou, použijte jako jmenovatel pouze směrodatnou odchylku kontrolní skupiny:

Glass's Delta

Δ = (M₁ - M₂) / s_control

To je užitečné, když intervence může ovlivnit rozptyl (např. intervence, která pomáhá slabším studentům více než těm nejlepším).

Interpretace velikosti účinku: Cohenovy pokyny

Jacob Cohen navrhl tyto konvence pro interpretaci hodnot d:

Velikost účinku (d)InterpretacePřekryv
0,2Malý85% překryv mezi skupinami
0,5Střední67% překryv mezi skupinami
0,8Velký53% překryv mezi skupinami
1,2Velmi velký40% překryv mezi skupinami
2,0Obrovský19% překryv mezi skupinami

Záleží na kontextu

Jedná se o přibližná vodítka, nikoli absolutní pravidla. V některých oborech může být d = 0,2 vysoce významné (např. snížení rizika infarktu), zatímco v jiných může být d = 0,8 očekávané (např. doučování vs. žádná výuka).

Řešený příklad: Vzdělávací intervence

Škola testuje nový čtenářský program. Kontrolní skupina (n=25): průměr=72, SO=12. Experimentální skupina (n=30): průměr=79, SO=14. Vypočítejte Cohenovo d:

1

Výpočet sloučeného rozptylu

sp² = [(25-1)(12)² + (30-1)(14)²] / (25+30-2) = [24×144 + 29×196] / 53 = [3456 + 5684] / 53 = 172,45
2

Výpočet sloučené SO

sp = √172,45 = 13,13
3

Výpočet Cohenova d

d = (79 - 72) / 13,13 = 7 / 13,13 = 0,53
4

Interpretace

Střední velikost účinku (d = 0,53). Experimentální skupina dosahuje přibližně o polovinu směrodatné odchylky vyšších výsledků než kontrolní.

To znamená, že pokud byste náhodně vybrali jednoho studenta z experimentální skupiny a jednoho z kontrolní skupiny, student z experimentální skupiny by dosáhl vyššího skóre přibližně v 64 % případů (vypočteno z překryvu).

Implementace v Pythonu

Výpočet velikosti účinku programově s intervaly spolehlivosti:

python
import numpy as np
from scipy import stats

def cohens_d(group1, group2):
    """Calculate Cohen's d for two independent groups."""
    n1, n2 = len(group1), len(group2)
    var1, var2 = np.var(group1, ddof=1), np.var(group2, ddof=1)

    # Pooled standard deviation
    pooled_std = np.sqrt(((n1-1)*var1 + (n2-1)*var2) / (n1+n2-2))

    # Cohen's d
    d = (np.mean(group1) - np.mean(group2)) / pooled_std
    return d

def hedges_g(group1, group2):
    """Calculate Hedges' g (bias-corrected effect size)."""
    n1, n2 = len(group1), len(group2)
    d = cohens_d(group1, group2)

    # Correction factor for small sample bias
    correction = 1 - 3 / (4*(n1+n2) - 9)
    return d * correction

# Example usage
control = [68, 72, 75, 70, 69, 74, 71, 73, 76, 72]
treatment = [75, 79, 82, 78, 80, 77, 81, 76, 83, 79]

d = cohens_d(treatment, control)
g = hedges_g(treatment, control)
print(f"Cohen's d: {d:.3f}")
print(f"Hedges' g: {g:.3f}")