Σ
SDCalc
AvançadoAvançado·14 min

Desvio Padrão Combinado para Múltiplos Grupos

Aprenda a calcular o desvio padrão combinado (pooled) para combinar dados de múltiplos grupos em testes t e ANOVA.

O que é Desvio Padrão Combinado?

O desvio padrão combinado (pooled) combina estimativas de variância de dois ou mais grupos para obter uma única estimativa ponderada. É essencial para testes t de duas amostras quando se assume igualdade de variâncias.

O conceito é direto: se acreditamos que dois grupos vêm de populações com a mesma variabilidade subjacente, podemos combinar seus dados para obter uma estimativa melhor dessa variabilidade compartilhada. Mais dados significam uma estimativa mais precisa.

Pense da seguinte forma: se você tem 20 observações do Grupo A e 30 do Grupo B, e ambos os grupos têm a mesma variância verdadeira, agora você tem 50 observações para estimar essa variância em vez de estimá-la separadamente de amostras menores.

Quando Combinar

Combine desvios padrões apenas quando houver razão para acreditar que as variâncias populacionais subjacentes são iguais. Use o teste de Levene ou o teste F para verificar esse pressuposto antes de combinar.

A Fórmula do DP Combinado

Para dois grupos, o desvio padrão combinado é:

DP Combinado para Dois Grupos

sp = √[((n₁-1)s₁² + (n₂-1)s₂²) / (n₁+n₂-2)]

Onde n₁ e n₂ são os tamanhos das amostras, e s₁ e s₂ são os desvios padrões amostrais.

Para k grupos (como na ANOVA), a fórmula se generaliza:

DP Combinado para Múltiplos Grupos

sp = √[Σ(nᵢ-1)sᵢ² / Σ(nᵢ-1)]

Note que a fórmula usa termos (n-1) tanto no numerador quanto no denominador. Essa ponderação garante que amostras maiores contribuam mais para a estimativa combinada, o que é apropriado porque amostras maiores fornecem estimativas de variância mais confiáveis.

Pressupostos Subjacentes

O desvio padrão combinado pressupõe homogeneidade de variâncias — que todos os grupos compartilham a mesma variância populacional. Esse pressuposto é mais relevante quando:

  • Os tamanhos das amostras são desiguais (especialmente problemático se o grupo maior tem menor variância)
  • A razão entre a maior e a menor variância excede 2-3
  • Os tamanhos das amostras são pequenos (amostras grandes são mais robustas a violações)

Quando as Variâncias Diferem

Se as variâncias são desiguais, use o teste t de Welch em vez do teste t combinado, ou use estimativas de variância separadas. O teste de Welch não assume variâncias iguais e é frequentemente recomendado como abordagem padrão.

Exemplo Resolvido

Cenário: Comparando notas de prova entre duas turmas:

  • Turma A: n₁ = 25, média = 78, s₁ = 12
  • Turma B: n₂ = 30, média = 82, s₂ = 14

Cálculo do DP combinado:

sp = √[((25-1)(12)² + (30-1)(14)²) / (25+30-2)] sp = √[(24×144 + 29×196) / 53] sp = √[(3456 + 5684) / 53] sp = √[9140 / 53] = √172,45 = 13,13

O DP combinado de 13,13 fica entre os DPs individuais (12 e 14), ponderado em direção à amostra maior. Esse valor combinado seria então usado na fórmula do teste t ou no cálculo do d de Cohen.

Aplicações Estatísticas

  • Teste t para amostras independentes: O DP combinado é usado para calcular o erro padrão da diferença entre médias.
  • d de Cohen para tamanho do efeito: Os tamanhos de efeito são padronizados usando o DP combinado: d = (M₁ - M₂) / sp
  • ANOVA: O Quadrado Médio do Erro (QME) na ANOVA é essencialmente uma estimativa de variância combinada entre todos os grupos.
  • Meta-análise: Ao combinar estudos, estimativas combinadas ajudam a padronizar efeitos em diferentes contextos.