Para Além da Significância Estatística: Compreender a Dimensão do Efeito
A dimensão do efeito mede a magnitude de uma diferença ou relação, independentemente da dimensão da amostra. Enquanto os valores-p indicam se um efeito é estatisticamente significativo, as dimensões do efeito indicam quão praticamente significativo esse efeito é. Esta distinção é crucial para a tomada de decisões baseada em evidências na investigação, medicina, educação e negócios.
Considera um ensaio farmacêutico onde um novo medicamento apresenta uma melhoria estatisticamente significativa (p < 0,001) em relação a um placebo. Sem a dimensão do efeito, não sabes se a melhoria é de 0,1% ou 50%. A dimensão do efeito fornece este contexto crucial, ajudando os interessados a determinar se o efeito justifica o custo, os efeitos secundários ou o esforço de implementação.
A medida de dimensão do efeito mais comum para comparar dois grupos é o d de Cohen, que expressa a diferença entre médias em unidades de desvio-padrão. Esta padronização permite a comparação entre diferentes estudos e escalas de medição.
Porquê a Dimensão do Efeito É Importante
A significância estatística é fortemente influenciada pela dimensão da amostra. Com uma amostra suficientemente grande, até diferenças triviais se tornam “significativas”. Inversamente, efeitos importantes podem não atingir significância em amostras pequenas. A dimensão do efeito resolve este problema ao fornecer uma medida independente da dimensão da amostra.
A Armadilha da Significância
Razões fundamentais para utilizar a dimensão do efeito:
- Meta-análise: As dimensões do efeito podem ser combinadas entre estudos para estimar efeitos globais
- Análise de potência: Necessária para calcular dimensões de amostra requeridas para estudos futuros
- Decisões práticas: Ajuda a determinar se as intervenções valem a pena implementar
- Replicação: Fornece um objetivo para estudos de replicação igualarem
d de Cohen: A Medida Padrão da Dimensão do Efeito
O d de Cohen expressa a diferença entre as médias de dois grupos em unidades de desvio-padrão combinado:
d de Cohen
Onde M₁ e M₂ são as médias dos grupos, e sp é o desvio-padrão combinado calculado como:
Desvio-Padrão Combinado
O sinal de d indica a direção: positivo quando M₁ > M₂, negativo quando M₁ < M₂. Frequentemente reporta-se o valor absoluto |d| quando a direção é óbvia pelo contexto.
Porquê Combinar o Desvio-Padrão?
Medidas Alternativas da Dimensão do Efeito
Embora o d de Cohen seja o mais comum, existem alternativas para situações específicas:
g de Hedges: Dimensão do Efeito Corrigida
O d de Cohen sobrestima ligeiramente a dimensão do efeito populacional em amostras pequenas. O g de Hedges aplica um fator de correção:
Correção do g de Hedges
Para amostras acima de 20 por grupo, a diferença é negligenciável. Para amostras pequenas (n < 20), o g de Hedges é preferível.
Δ de Glass: Quando as Variâncias Diferem
Quando um grupo é um controlo com variabilidade conhecida, utiliza apenas o desvio-padrão do grupo de controlo como denominador:
Delta de Glass
Isto é útil quando o tratamento pode afetar a variância (e.g., uma intervenção que ajuda mais os alunos com pior desempenho do que os com melhor).
Interpretar Dimensões do Efeito: Orientações de Cohen
Jacob Cohen propôs estas convenções para interpretar valores de d:
| Dimensão do Efeito (d) | Interpretação | Sobreposição |
|---|---|---|
| 0,2 | Pequeno | 85% de sobreposição entre grupos |
| 0,5 | Médio | 67% de sobreposição entre grupos |
| 0,8 | Grande | 53% de sobreposição entre grupos |
| 1,2 | Muito Grande | 40% de sobreposição entre grupos |
| 2,0 | Enorme | 19% de sobreposição entre grupos |
O Contexto É Importante
Exemplo Resolvido: Intervenção Educativa
Uma escola testa um novo programa de leitura. Grupo de controlo (n=25): média=72, DP=12. Grupo de tratamento (n=30): média=79, DP=14. Calcular o d de Cohen:
Calcular a Variância Combinada
Calcular o DP Combinado
Calcular o d de Cohen
Interpretar
Isto significa que, se escolhesses aleatoriamente um aluno do grupo de tratamento e outro do grupo de controlo, o aluno do tratamento pontuaria mais alto cerca de 64% das vezes (calculado a partir da sobreposição).
Implementação em Python
Calcula dimensões do efeito programaticamente com intervalos de confiança:
import numpy as np
from scipy import stats
def cohens_d(group1, group2):
"""Calculate Cohen's d for two independent groups."""
n1, n2 = len(group1), len(group2)
var1, var2 = np.var(group1, ddof=1), np.var(group2, ddof=1)
# Pooled standard deviation
pooled_std = np.sqrt(((n1-1)*var1 + (n2-1)*var2) / (n1+n2-2))
# Cohen's d
d = (np.mean(group1) - np.mean(group2)) / pooled_std
return d
def hedges_g(group1, group2):
"""Calculate Hedges' g (bias-corrected effect size)."""
n1, n2 = len(group1), len(group2)
d = cohens_d(group1, group2)
# Correction factor for small sample bias
correction = 1 - 3 / (4*(n1+n2) - 9)
return d * correction
# Example usage
control = [68, 72, 75, 70, 69, 74, 71, 73, 76, 72]
treatment = [75, 79, 82, 78, 80, 77, 81, 76, 83, 79]
d = cohens_d(treatment, control)
g = hedges_g(treatment, control)
print(f"Cohen's d: {d:.3f}")
print(f"Hedges' g: {g:.3f}")