O que é o Desvio-Padrão Combinado?
O desvio-padrão combinado (pooled standard deviation) combina estimativas de variância de dois ou mais grupos para obter uma estimativa única e ponderada. É essencial para testes t de amostras independentes quando se assume variâncias iguais.
O conceito é direto: se acreditamos que dois grupos provêm de populações com a mesma variabilidade subjacente, podemos combinar os seus dados para obter uma melhor estimativa dessa variabilidade partilhada. Mais dados significam uma estimativa mais precisa.
Pensa da seguinte forma: se tens 20 observações do Grupo A e 30 do Grupo B, e ambos os grupos têm a mesma verdadeira variância, agora tens 50 observações para estimar essa variância em vez de a estimar separadamente a partir de amostras mais pequenas.
Quando Combinar
A Fórmula do DP Combinado
Para dois grupos, o desvio-padrão combinado é:
DP Combinado para Dois Grupos
Onde n₁ e n₂ são as dimensões das amostras, e s₁ e s₂ são os desvios-padrão amostrais.
Para k grupos (como na ANOVA), a fórmula generaliza-se:
DP Combinado para Múltiplos Grupos
Repara que a fórmula utiliza termos (n-1) tanto no numerador como no denominador. Esta ponderação garante que amostras maiores contribuem mais para a estimativa combinada, o que é apropriado porque amostras maiores fornecem estimativas de variância mais fiáveis.
Pressupostos Subjacentes
O desvio-padrão combinado assume homogeneidade de variâncias — que todos os grupos partilham a mesma variância populacional. Este pressuposto é mais importante quando:
- As dimensões das amostras são desiguais (especialmente problemático se o grupo maior tem menor variância)
- A razão entre a maior e a menor variância excede 2-3
- As dimensões das amostras são pequenas (amostras grandes são mais robustas a violações)
Quando as Variâncias Diferem
Exemplo Resolvido
Cenário: Comparar notas de exame entre duas turmas:
- Turma A: n₁ = 25, média = 78, s₁ = 12
- Turma B: n₂ = 30, média = 82, s₂ = 14
Cálculo do DP combinado:
sp = √[((25-1)(12)² + (30-1)(14)²) / (25+30-2)] sp = √[(24×144 + 29×196) / 53] sp = √[(3456 + 5684) / 53] sp = √[9140 / 53] = √172,45 = 13,13
O DP combinado de 13,13 situa-se entre os DPs individuais (12 e 14), ponderado para a amostra maior. Este valor combinado seria depois utilizado na fórmula do teste t ou no cálculo do d de Cohen.
Aplicações Estatísticas
- Teste t de amostras independentes: O DP combinado é utilizado para calcular o erro-padrão da diferença entre médias.
- d de Cohen para dimensão do efeito: As dimensões de efeito são padronizadas utilizando o DP combinado: d = (M₁ - M₂) / sp
- ANOVA: O Quadrado Médio do Erro (QME) na ANOVA é essencialmente uma estimativa de variância combinada de todos os grupos.
- Meta-análise: Ao combinar estudos, as estimativas combinadas ajudam a padronizar efeitos em diferentes contextos.