Σ
SDCalc
AvançadoAvançado·14 min

Desvio-Padrão Combinado para Múltiplos Grupos

Aprende a calcular o desvio-padrão combinado para juntar dados de múltiplos grupos em testes t e ANOVA.

O que é o Desvio-Padrão Combinado?

O desvio-padrão combinado (pooled standard deviation) combina estimativas de variância de dois ou mais grupos para obter uma estimativa única e ponderada. É essencial para testes t de amostras independentes quando se assume variâncias iguais.

O conceito é direto: se acreditamos que dois grupos provêm de populações com a mesma variabilidade subjacente, podemos combinar os seus dados para obter uma melhor estimativa dessa variabilidade partilhada. Mais dados significam uma estimativa mais precisa.

Pensa da seguinte forma: se tens 20 observações do Grupo A e 30 do Grupo B, e ambos os grupos têm a mesma verdadeira variância, agora tens 50 observações para estimar essa variância em vez de a estimar separadamente a partir de amostras mais pequenas.

Quando Combinar

Combina desvios-padrão apenas quando tens razões para acreditar que as variâncias populacionais subjacentes são iguais. Utiliza o teste de Levene ou o teste F para verificar este pressuposto antes de combinar.

A Fórmula do DP Combinado

Para dois grupos, o desvio-padrão combinado é:

DP Combinado para Dois Grupos

sp = √[((n₁-1)s₁² + (n₂-1)s₂²) / (n₁+n₂-2)]

Onde n₁ e n₂ são as dimensões das amostras, e s₁ e s₂ são os desvios-padrão amostrais.

Para k grupos (como na ANOVA), a fórmula generaliza-se:

DP Combinado para Múltiplos Grupos

sp = √[Σ(nᵢ-1)sᵢ² / Σ(nᵢ-1)]

Repara que a fórmula utiliza termos (n-1) tanto no numerador como no denominador. Esta ponderação garante que amostras maiores contribuem mais para a estimativa combinada, o que é apropriado porque amostras maiores fornecem estimativas de variância mais fiáveis.

Pressupostos Subjacentes

O desvio-padrão combinado assume homogeneidade de variâncias — que todos os grupos partilham a mesma variância populacional. Este pressuposto é mais importante quando:

  • As dimensões das amostras são desiguais (especialmente problemático se o grupo maior tem menor variância)
  • A razão entre a maior e a menor variância excede 2-3
  • As dimensões das amostras são pequenas (amostras grandes são mais robustas a violações)

Quando as Variâncias Diferem

Se as variâncias são desiguais, utiliza o teste t de Welch em vez do teste t combinado, ou utiliza estimativas de variância separadas. O teste de Welch não assume variâncias iguais e é frequentemente recomendado como abordagem predefinida.

Exemplo Resolvido

Cenário: Comparar notas de exame entre duas turmas:

  • Turma A: n₁ = 25, média = 78, s₁ = 12
  • Turma B: n₂ = 30, média = 82, s₂ = 14

Cálculo do DP combinado:

sp = √[((25-1)(12)² + (30-1)(14)²) / (25+30-2)] sp = √[(24×144 + 29×196) / 53] sp = √[(3456 + 5684) / 53] sp = √[9140 / 53] = √172,45 = 13,13

O DP combinado de 13,13 situa-se entre os DPs individuais (12 e 14), ponderado para a amostra maior. Este valor combinado seria depois utilizado na fórmula do teste t ou no cálculo do d de Cohen.

Aplicações Estatísticas

  • Teste t de amostras independentes: O DP combinado é utilizado para calcular o erro-padrão da diferença entre médias.
  • d de Cohen para dimensão do efeito: As dimensões de efeito são padronizadas utilizando o DP combinado: d = (M₁ - M₂) / sp
  • ANOVA: O Quadrado Médio do Erro (QME) na ANOVA é essencialmente uma estimativa de variância combinada de todos os grupos.
  • Meta-análise: Ao combinar estudos, as estimativas combinadas ajudam a padronizar efeitos em diferentes contextos.