Além da Significância Estatística: Entendendo o Tamanho do Efeito
O tamanho do efeito mede a magnitude de uma diferença ou relação, independentemente do tamanho da amostra. Enquanto valores-p indicam se um efeito é estatisticamente significativo, os tamanhos de efeito dizem o quão praticamente relevante esse efeito é. Essa distinção é fundamental para tomada de decisão baseada em evidências em pesquisa, medicina, educação e negócios.
Considere um ensaio farmacêutico em que um novo medicamento mostra uma melhoria estatisticamente significativa (p < 0,001) sobre o placebo. Sem o tamanho do efeito, você não sabe se a melhoria é de 0,1% ou 50%. O tamanho do efeito fornece esse contexto crucial, ajudando as partes interessadas a determinar se o efeito vale o custo, os efeitos colaterais ou o esforço de implementação.
A medida de tamanho do efeito mais comum para comparar dois grupos é o d de Cohen, que expressa a diferença entre médias em unidades de desvio padrão. Essa padronização permite comparação entre diferentes estudos e escalas de medição.
Por que o Tamanho do Efeito Importa
A significância estatística é fortemente influenciada pelo tamanho da amostra. Com uma amostra grande o suficiente, até diferenças triviais se tornam “significativas”. Por outro lado, efeitos importantes podem não alcançar significância em amostras pequenas. O tamanho do efeito resolve esse problema fornecendo uma medida independente do tamanho da amostra.
A Armadilha da Significância
Razões fundamentais para usar o tamanho do efeito:
- Meta-análise: Tamanhos de efeito podem ser combinados entre estudos para estimar efeitos globais
- Análise de poder: Necessário para calcular tamanhos de amostra para estudos futuros
- Decisões práticas: Ajuda a determinar se intervenções valem a pena ser implementadas
- Replicação: Fornece um alvo para estudos de replicação
d de Cohen: A Medida Padrão de Tamanho do Efeito
O d de Cohen expressa a diferença entre duas médias de grupo em unidades de desvio padrão combinado:
d de Cohen
Onde M₁ e M₂ são as médias dos grupos, e sp é o desvio padrão combinado calculado como:
Desvio Padrão Combinado
O sinal de d indica a direção: positivo quando M₁ > M₂, negativo quando M₁ < M₂. Frequentemente o valor absoluto |d| é reportado quando a direção é óbvia pelo contexto.
Por que Combinar o Desvio Padrão?
Medidas Alternativas de Tamanho do Efeito
Embora o d de Cohen seja o mais comum, existem alternativas para situações específicas:
g de Hedges: Tamanho do Efeito Corrigido para Viés
O d de Cohen superestima ligeiramente o tamanho do efeito populacional em amostras pequenas. O g de Hedges aplica um fator de correção:
Correção do g de Hedges
Para amostras acima de 20 por grupo, a diferença é desprezível. Para amostras pequenas (n < 20), o g de Hedges é preferível.
Δ de Glass: Quando as Variâncias Diferem
Quando um grupo é controle com variabilidade conhecida, use apenas o desvio padrão do grupo controle como denominador:
Delta de Glass
Isso é útil quando o tratamento pode afetar a variância (ex.: uma intervenção que ajuda mais os alunos com baixo desempenho do que os com alto desempenho).
Interpretando Tamanhos de Efeito: Diretrizes de Cohen
Jacob Cohen propôs estas convenções para interpretar valores de d:
| Tamanho do Efeito (d) | Interpretação | Sobreposição |
|---|---|---|
| 0,2 | Pequeno | 85% de sobreposição entre grupos |
| 0,5 | Médio | 67% de sobreposição entre grupos |
| 0,8 | Grande | 53% de sobreposição entre grupos |
| 1,2 | Muito Grande | 40% de sobreposição entre grupos |
| 2,0 | Enorme | 19% de sobreposição entre grupos |
O Contexto Importa
Exemplo Resolvido: Intervenção Educacional
Uma escola testa um novo programa de leitura. Grupo controle (n=25): média=72, DP=12. Grupo tratamento (n=30): média=79, DP=14. Calcule o d de Cohen:
Calcular a Variância Combinada
Calcular o DP Combinado
Calcular o d de Cohen
Interpretar
Isso significa que, se você pegasse um aluno aleatório do grupo de tratamento e um do grupo controle, o aluno do tratamento pontuaria mais alto em cerca de 64% das vezes (calculado a partir da sobreposição).
Implementação em Python
Calcule tamanhos de efeito programaticamente com intervalos de confiança:
import numpy as np
from scipy import stats
def cohens_d(group1, group2):
"""Calculate Cohen's d for two independent groups."""
n1, n2 = len(group1), len(group2)
var1, var2 = np.var(group1, ddof=1), np.var(group2, ddof=1)
# Pooled standard deviation
pooled_std = np.sqrt(((n1-1)*var1 + (n2-1)*var2) / (n1+n2-2))
# Cohen's d
d = (np.mean(group1) - np.mean(group2)) / pooled_std
return d
def hedges_g(group1, group2):
"""Calculate Hedges' g (bias-corrected effect size)."""
n1, n2 = len(group1), len(group2)
d = cohens_d(group1, group2)
# Correction factor for small sample bias
correction = 1 - 3 / (4*(n1+n2) - 9)
return d * correction
# Example usage
control = [68, 72, 75, 70, 69, 74, 71, 73, 76, 72]
treatment = [75, 79, 82, 78, 80, 77, 81, 76, 83, 79]
d = cohens_d(treatment, control)
g = hedges_g(treatment, control)
print(f"Cohen's d: {d:.3f}")
print(f"Hedges' g: {g:.3f}")