O que é Desvio Padrão Combinado?
O desvio padrão combinado (pooled) combina estimativas de variância de dois ou mais grupos para obter uma única estimativa ponderada. É essencial para testes t de duas amostras quando se assume igualdade de variâncias.
O conceito é direto: se acreditamos que dois grupos vêm de populações com a mesma variabilidade subjacente, podemos combinar seus dados para obter uma estimativa melhor dessa variabilidade compartilhada. Mais dados significam uma estimativa mais precisa.
Pense da seguinte forma: se você tem 20 observações do Grupo A e 30 do Grupo B, e ambos os grupos têm a mesma variância verdadeira, agora você tem 50 observações para estimar essa variância em vez de estimá-la separadamente de amostras menores.
Quando Combinar
A Fórmula do DP Combinado
Para dois grupos, o desvio padrão combinado é:
DP Combinado para Dois Grupos
Onde n₁ e n₂ são os tamanhos das amostras, e s₁ e s₂ são os desvios padrões amostrais.
Para k grupos (como na ANOVA), a fórmula se generaliza:
DP Combinado para Múltiplos Grupos
Note que a fórmula usa termos (n-1) tanto no numerador quanto no denominador. Essa ponderação garante que amostras maiores contribuam mais para a estimativa combinada, o que é apropriado porque amostras maiores fornecem estimativas de variância mais confiáveis.
Pressupostos Subjacentes
O desvio padrão combinado pressupõe homogeneidade de variâncias — que todos os grupos compartilham a mesma variância populacional. Esse pressuposto é mais relevante quando:
- Os tamanhos das amostras são desiguais (especialmente problemático se o grupo maior tem menor variância)
- A razão entre a maior e a menor variância excede 2-3
- Os tamanhos das amostras são pequenos (amostras grandes são mais robustas a violações)
Quando as Variâncias Diferem
Exemplo Resolvido
Cenário: Comparando notas de prova entre duas turmas:
- Turma A: n₁ = 25, média = 78, s₁ = 12
- Turma B: n₂ = 30, média = 82, s₂ = 14
Cálculo do DP combinado:
sp = √[((25-1)(12)² + (30-1)(14)²) / (25+30-2)] sp = √[(24×144 + 29×196) / 53] sp = √[(3456 + 5684) / 53] sp = √[9140 / 53] = √172,45 = 13,13
O DP combinado de 13,13 fica entre os DPs individuais (12 e 14), ponderado em direção à amostra maior. Esse valor combinado seria então usado na fórmula do teste t ou no cálculo do d de Cohen.
Aplicações Estatísticas
- Teste t para amostras independentes: O DP combinado é usado para calcular o erro padrão da diferença entre médias.
- d de Cohen para tamanho do efeito: Os tamanhos de efeito são padronizados usando o DP combinado: d = (M₁ - M₂) / sp
- ANOVA: O Quadrado Médio do Erro (QME) na ANOVA é essencialmente uma estimativa de variância combinada entre todos os grupos.
- Meta-análise: Ao combinar estudos, estimativas combinadas ajudam a padronizar efeitos em diferentes contextos.