How should I interpret a high standard deviation?

A high standard deviation means the observations are spread farther from the mean on average. Whether that spread is acceptable depends on the context: wide dispersion might signal risk in finance, instability in manufacturing, or genuine natural variation in scientific data.

Why do some articles mention n while others mention n-1?

The denominator reflects the difference between population and sample formulas. Population variance and population standard deviation use N because the full dataset is known. Sample variance and sample standard deviation often use n-1 because Bessel’s correction reduces bias when estimating population spread from a sample.

What is a statistical interpretation guide?

A statistical interpretation guide is a page that moves beyond arithmetic and explains meaning. It tells you what a metric is, when the formula applies, and how to describe the result in plain English without overstating certainty.

Can I cite this article in a report?

You should cite the underlying authoritative reference for formal work whenever possible. This page is best used as an explanatory bridge that helps you understand the concept before quoting the original standard or handbook.

Why include direct citations on every article page?

Direct citations give readers a route to verify the definition, notation, and assumptions. That improves trust and reduces the chance that a simplified explanation is mistaken for the entire technical standard.

d de Cohen e Cálculos de Tamanho do Efeito | Standard Deviation Calculator

Além da Significância Estatística: Entendendo o Tamanho do Efeito

O tamanho do efeito mede a magnitude de uma diferença ou relação, independentemente do tamanho da amostra. Enquanto valores-p indicam se um efeito é estatisticamente significativo, os tamanhos de efeito dizem o quão praticamente relevante esse efeito é. Essa distinção é fundamental para tomada de decisão baseada em evidências em pesquisa, medicina, educação e negócios.

Considere um ensaio farmacêutico em que um novo medicamento mostra uma melhoria estatisticamente significativa (p < 0,001) sobre o placebo. Sem o tamanho do efeito, você não sabe se a melhoria é de 0,1% ou 50%. O tamanho do efeito fornece esse contexto crucial, ajudando as partes interessadas a determinar se o efeito vale o custo, os efeitos colaterais ou o esforço de implementação.

A medida de tamanho do efeito mais comum para comparar dois grupos é o d de Cohen, que expressa a diferença entre médias em unidades de desvio padrão. Essa padronização permite comparação entre diferentes estudos e escalas de medição.

Por que o Tamanho do Efeito Importa

A significância estatística é fortemente influenciada pelo tamanho da amostra. Com uma amostra grande o suficiente, até diferenças triviais se tornam “significativas”. Por outro lado, efeitos importantes podem não alcançar significância em amostras pequenas. O tamanho do efeito resolve esse problema fornecendo uma medida independente do tamanho da amostra.

A Armadilha da Significância

Um estudo com n=10.000 pode mostrar p < 0,001 para uma diferença de 0,5 pontos em uma escala de 100. Isso é estatisticamente significativo, mas praticamente irrelevante (d ≈ 0,05). Sempre reporte tamanhos de efeito junto com valores-p.

Razões fundamentais para usar o tamanho do efeito:

Meta-análise: Tamanhos de efeito podem ser combinados entre estudos para estimar efeitos globais
Análise de poder: Necessário para calcular tamanhos de amostra para estudos futuros
Decisões práticas: Ajuda a determinar se intervenções valem a pena ser implementadas
Replicação: Fornece um alvo para estudos de replicação

d de Cohen: A Medida Padrão de Tamanho do Efeito

O d de Cohen expressa a diferença entre duas médias de grupo em unidades de desvio padrão combinado:

d de Cohen

d = (M₁ - M₂) / sp

Onde M₁ e M₂ são as médias dos grupos, e sp é o desvio padrão combinado calculado como:

Desvio Padrão Combinado

sp = √[((n₁-1)s₁² + (n₂-1)s₂²) / (n₁+n₂-2)]

O sinal de d indica a direção: positivo quando M₁ > M₂, negativo quando M₁ < M₂. Frequentemente o valor absoluto |d| é reportado quando a direção é óbvia pelo contexto.

Por que Combinar o Desvio Padrão?

A combinação assume que ambos os grupos têm variâncias populacionais iguais. Isso fornece uma estimativa mais estável do que usar o DP de qualquer grupo isoladamente e corresponde aos pressupostos do teste t para amostras independentes.

Medidas Alternativas de Tamanho do Efeito

Embora o d de Cohen seja o mais comum, existem alternativas para situações específicas:

g de Hedges: Tamanho do Efeito Corrigido para Viés

O d de Cohen superestima ligeiramente o tamanho do efeito populacional em amostras pequenas. O g de Hedges aplica um fator de correção:

Correção do g de Hedges

g = d × (1 - 3/(4(n₁+n₂) - 9))

Para amostras acima de 20 por grupo, a diferença é desprezível. Para amostras pequenas (n < 20), o g de Hedges é preferível.

Δ de Glass: Quando as Variâncias Diferem

Quando um grupo é controle com variabilidade conhecida, use apenas o desvio padrão do grupo controle como denominador:

Delta de Glass

Δ = (M₁ - M₂) / s_control

Isso é útil quando o tratamento pode afetar a variância (ex.: uma intervenção que ajuda mais os alunos com baixo desempenho do que os com alto desempenho).

Interpretando Tamanhos de Efeito: Diretrizes de Cohen

Jacob Cohen propôs estas convenções para interpretar valores de d:

Tamanho do Efeito (d)	Interpretação	Sobreposição
0,2	Pequeno	85% de sobreposição entre grupos
0,5	Médio	67% de sobreposição entre grupos
0,8	Grande	53% de sobreposição entre grupos
1,2	Muito Grande	40% de sobreposição entre grupos
2,0	Enorme	19% de sobreposição entre grupos

O Contexto Importa

Essas são diretrizes gerais, não regras absolutas. Em alguns campos, d = 0,2 pode ser altamente significativo (ex.: redução do risco de infarto), enquanto em outros d = 0,8 pode ser esperado (ex.: tutoria vs. nenhuma instrução).

Exemplo Resolvido: Intervenção Educacional

Uma escola testa um novo programa de leitura. Grupo controle (n=25): média=72, DP=12. Grupo tratamento (n=30): média=79, DP=14. Calcule o d de Cohen:

Calcular a Variância Combinada

sp² = [(25-1)(12)² + (30-1)(14)²] / (25+30-2) = [24×144 + 29×196] / 53 = [3456 + 5684] / 53 = 172,45

Calcular o DP Combinado

sp = √172,45 = 13,13

Calcular o d de Cohen

d = (79 - 72) / 13,13 = 7 / 13,13 = 0,53

Interpretar

Um tamanho de efeito médio (d = 0,53). O grupo de tratamento pontua cerca de meio desvio padrão acima do controle.

Isso significa que, se você pegasse um aluno aleatório do grupo de tratamento e um do grupo controle, o aluno do tratamento pontuaria mais alto em cerca de 64% das vezes (calculado a partir da sobreposição).

Implementação em Python

Calcule tamanhos de efeito programaticamente com intervalos de confiança:

python

import numpy as np
from scipy import stats

def cohens_d(group1, group2):
    """Calculate Cohen's d for two independent groups."""
    n1, n2 = len(group1), len(group2)
    var1, var2 = np.var(group1, ddof=1), np.var(group2, ddof=1)

    # Pooled standard deviation
    pooled_std = np.sqrt(((n1-1)*var1 + (n2-1)*var2) / (n1+n2-2))

    # Cohen's d
    d = (np.mean(group1) - np.mean(group2)) / pooled_std
    return d

def hedges_g(group1, group2):
    """Calculate Hedges' g (bias-corrected effect size)."""
    n1, n2 = len(group1), len(group2)
    d = cohens_d(group1, group2)

    # Correction factor for small sample bias
    correction = 1 - 3 / (4*(n1+n2) - 9)
    return d * correction

# Example usage
control = [68, 72, 75, 70, 69, 74, 71, 73, 76, 72]
treatment = [75, 79, 82, 78, 80, 77, 81, 76, 83, 79]

d = cohens_d(treatment, control)
g = hedges_g(treatment, control)
print(f"Cohen's d: {d:.3f}")
print(f"Hedges' g: {g:.3f}")

Reading goal	What to focus on	Common mistake
Definition	What the metric is and what quantity it summarizes	Treating the formula as self-explanatory
Formula choice	Sample versus population assumptions and notation	Using n when n-1 is required or vice versa
Interpretation	Whether the result indicates concentration, spread, or risk	Calling a large value good or bad without context

d de Cohen e Cálculos de Tamanho do Efeito