Σ
SDCalc
IntermedioApplicazioni·12 min

d di Cohen e calcolo della dimensione dell’effetto

Padroneggia i calcoli della dimensione dell’effetto con d di Cohen, g di Hedges e delta di Glass. Impara a misurare la significatività pratica oltre i valori p usando la deviazione standard.

Oltre la significatività statistica: comprendere la dimensione dell’effetto

La dimensione dell’effetto misura l’entità di una differenza o relazione, indipendentemente dalla dimensione del campione. Mentre i valori p indicano se un effetto è statisticamente significativo, la dimensione dell’effetto indica quanto quell’effetto sia concretamente significativo. Questa distinzione è cruciale per il processo decisionale basato sulle evidenze nella ricerca, in medicina, nell’istruzione e nel business.

Consideriamo una sperimentazione farmaceutica in cui un nuovo farmaco mostra un miglioramento statisticamente significativo (p < 0,001) rispetto al placebo. Senza la dimensione dell’effetto, non si sa se il miglioramento è dello 0,1% o del 50%. La dimensione dell’effetto fornisce questo contesto cruciale, aiutando le parti interessate a determinare se l’effetto giustifica i costi, gli effetti collaterali o lo sforzo di implementazione.

La misura più comune della dimensione dell’effetto per confrontare due gruppi è la d di Cohen, che esprime la differenza tra le medie in unità di deviazione standard. Questa standardizzazione consente il confronto tra studi e scale di misura diverse.

Perché la dimensione dell’effetto conta

La significatività statistica è fortemente influenzata dalla dimensione del campione. Con un campione sufficientemente grande, anche differenze banali diventano “significative”. Al contrario, effetti importanti potrebbero non raggiungere la significatività in campioni piccoli. La dimensione dell’effetto risolve questo problema fornendo una misura indipendente dalla dimensione del campione.

La trappola della significatività

Uno studio con n=10.000 potrebbe mostrare p < 0,001 per una differenza di 0,5 punti su una scala di 100. Questo è statisticamente significativo ma praticamente privo di significato (d ≈ 0,05). Riporta sempre le dimensioni dell’effetto insieme ai valori p.

Ragioni chiave per usare la dimensione dell’effetto:

  • Meta-analisi: Le dimensioni dell’effetto possono essere combinate tra studi per stimare gli effetti complessivi
  • Analisi di potenza: Necessaria per calcolare le dimensioni campionarie richieste per studi futuri
  • Decisioni pratiche: Aiuta a determinare se vale la pena implementare gli interventi
  • Replicazione: Fornisce un obiettivo da raggiungere negli studi di replicazione

d di Cohen: la misura standard della dimensione dell’effetto

La d di Cohen esprime la differenza tra le medie di due gruppi in unità di deviazione standard combinata:

d di Cohen

d = (M₁ - M₂) / sp

Dove M₁ e M₂ sono le medie dei gruppi e sp è la deviazione standard combinata calcolata come:

Deviazione standard combinata

sp = √[((n₁-1)s₁² + (n₂-1)s₂²) / (n₁+n₂-2)]

Il segno di d indica la direzione: positivo quando M₁ > M₂, negativo quando M₁ < M₂. Spesso si riporta il valore assoluto |d| quando la direzione è ovvia dal contesto.

Perché combinare la deviazione standard?

La combinazione assume che entrambi i gruppi abbiano varianze della popolazione uguali. Ciò fornisce una stima più stabile rispetto all’uso della DS di un solo gruppo e corrisponde alle assunzioni del test t per campioni indipendenti.

Misure alternative della dimensione dell’effetto

Sebbene la d di Cohen sia la più comune, esistono alternative per situazioni specifiche:

g di Hedges: dimensione dell’effetto corretta per la distorsione

La d di Cohen sovrastima leggermente la dimensione dell’effetto nella popolazione con campioni piccoli. La g di Hedges applica un fattore di correzione:

Correzione di Hedges’ g

g = d × (1 - 3/(4(n₁+n₂) - 9))

Per campioni superiori a 20 per gruppo, la differenza è trascurabile. Per campioni piccoli (n < 20), la g di Hedges è preferibile.

Delta di Glass: quando le varianze differiscono

Quando un gruppo è un controllo con variabilità nota, si usa solo la deviazione standard del gruppo di controllo come denominatore:

Delta di Glass

Δ = (M₁ - M₂) / s_controllo

È utile quando il trattamento potrebbe influenzare la varianza (es. un intervento che aiuta i soggetti con prestazioni basse più di quelli con prestazioni alte).

Interpretare le dimensioni dell’effetto: le linee guida di Cohen

Jacob Cohen ha proposto queste convenzioni per interpretare i valori di d:

Dimensione effetto (d)InterpretazioneSovrapposizione
0,2Piccola85% di sovrapposizione tra i gruppi
0,5Media67% di sovrapposizione tra i gruppi
0,8Grande53% di sovrapposizione tra i gruppi
1,2Molto grande40% di sovrapposizione tra i gruppi
2,0Enorme19% di sovrapposizione tra i gruppi

Il contesto conta

Queste sono linee guida approssimative, non regole assolute. In alcuni ambiti, d = 0,2 potrebbe essere molto significativo (es. ridurre il rischio di infarto), mentre in altri d = 0,8 potrebbe essere atteso (es. tutoraggio vs. nessuna istruzione).

Esempio svolto: intervento educativo

Una scuola testa un nuovo programma di lettura. Gruppo di controllo (n=25): media=72, DS=12. Gruppo sperimentale (n=30): media=79, DS=14. Calcoliamo la d di Cohen:

1

Calcolare la varianza combinata

sp² = [(25-1)(12)² + (30-1)(14)²] / (25+30-2) = [24×144 + 29×196] / 53 = [3456 + 5684] / 53 = 172,45
2

Calcolare la DS combinata

sp = √172,45 = 13,13
3

Calcolare la d di Cohen

d = (79 - 72) / 13,13 = 7 / 13,13 = 0,53
4

Interpretare

Dimensione dell’effetto media (d = 0,53). Il gruppo sperimentale ottiene punteggi superiori di circa mezza deviazione standard rispetto al controllo.

Ciò significa che prendendo casualmente uno studente dal gruppo sperimentale e uno dal gruppo di controllo, lo studente del gruppo sperimentale avrebbe un punteggio superiore circa il 64% delle volte (calcolato dalla sovrapposizione).

Implementazione in Python

Calcolare le dimensioni dell’effetto in modo programmatico con intervalli di confidenza:

python
import numpy as np
from scipy import stats

def cohens_d(group1, group2):
    """Calculate Cohen's d for two independent groups."""
    n1, n2 = len(group1), len(group2)
    var1, var2 = np.var(group1, ddof=1), np.var(group2, ddof=1)

    # Pooled standard deviation
    pooled_std = np.sqrt(((n1-1)*var1 + (n2-1)*var2) / (n1+n2-2))

    # Cohen's d
    d = (np.mean(group1) - np.mean(group2)) / pooled_std
    return d

def hedges_g(group1, group2):
    """Calculate Hedges' g (bias-corrected effect size)."""
    n1, n2 = len(group1), len(group2)
    d = cohens_d(group1, group2)

    # Correction factor for small sample bias
    correction = 1 - 3 / (4*(n1+n2) - 9)
    return d * correction

# Example usage
control = [68, 72, 75, 70, 69, 74, 71, 73, 76, 72]
treatment = [75, 79, 82, 78, 80, 77, 81, 76, 83, 79]

d = cohens_d(treatment, control)
g = hedges_g(treatment, control)
print(f"Cohen's d: {d:.3f}")
print(f"Hedges' g: {g:.3f}")