Σ
SDCalc
InicianteFundamentals·9 min

O que é Desvio Padrão? Definição, Fórmula e Exemplos

Entenda o que é desvio padrão, como calculá-lo para amostras e populações e por que ele é crucial na análise de dados. Domine as fórmulas hoje.

By Standard Deviation Calculator Team · Data Science Team·Published

O que é Desvio Padrão?

O desvio padrão é uma medida estatística que quantifica a quantidade de variação ou dispersão em um conjunto de valores de dados. Um desvio padrão baixo indica que os pontos de dados tendem a estar próximos da média (valor esperado) do conjunto, enquanto um desvio padrão alto indica que os pontos de dados estão espalhados por uma faixa mais ampla de valores. Representado pela letra grega σ (sigma) para populações e s para amostras, é um dos conceitos mais fundamentais na estatística descritiva.

Definição Central

O desvio padrão mede a distância típica de cada ponto de dados em relação à média. Ele indica, em média, o quanto seus dados variam em relação ao centro.

Desvio Padrão Populacional vs. Amostral

Antes de calcular o desvio padrão, você deve determinar se seus dados representam toda a população ou uma amostra de uma população. Uma população inclui todos os membros de um grupo especificado, enquanto uma amostra é um subconjunto representativo desse grupo. Calcular o desvio padrão para uma amostra requer um ajuste matemático — usando n - 1 (graus de liberdade, ou df) em vez de N — para garantir que o resultado seja um estimador não tendencioso da variância populacional.

Desvio Padrão Populacional

Usado quando você tem dados de todo o grupo. Denotado por σ. O denominador na fórmula da variância é N (o tamanho total da população).

Desvio Padrão Amostral

Usado quando você tem um subconjunto do grupo. Denotado por s. O denominador na fórmula da variância é n - 1 (tamanho da amostra menos um) para corrigir o viés.

A Fórmula do Desvio Padrão Explicada

As fórmulas para o desvio padrão exigem o cálculo da variância primeiro e, em seguida, a extração da raiz quadrada. Essa etapa da raiz quadrada é crucial porque traz a medida de dispersão de volta para as unidades originais dos dados. Os componentes principais são xᵢ (cada valor individual), μ ou (a média populacional ou amostral) e N ou n (o número total de valores).

DP Populacional

σ = √[ Σ(xᵢ - μ)² / N ]

DP Amostral

s = √[ Σ(xᵢ - x̄)² / (n - 1) ]

Exemplo de Cálculo Passo a Passo

Vamos calcular o desvio padrão amostral para um pequeno conjunto de dados de notas de provas: [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]. Seguir a fórmula passo a passo revela como a variância se acumula antes de tirarmos a raiz quadrada final.

1

Calcular a Média (x̄)

Some todos os valores e divida pela quantidade: (4+8+6+5+3+2+8+9+2+5) / 10 = 52 / 10 = 5,2
2

Subtrair a Média e Elevar ao Quadrado

Para cada valor, encontre a diferença ao quadrado: (4-5,2)² = 1,44, (8-5,2)² = 7,84, (6-5,2)² = 0,64, etc.
3

Somar as Diferenças ao Quadrado

Some todos os resultados ao quadrado: 1,44 + 7,84 + 0,64 + 0,04 + 4,84 + 10,24 + 7,84 + 14,44 + 10,24 + 0,04 = 57,6
4

Dividir por n - 1 (Graus de Liberdade)

Divida a soma pelo tamanho da amostra menos um: 57,6 / (10 - 1) = 57,6 / 9 = 6,4. Esta é a variância amostral (s²).
5

Tirar a Raiz Quadrada

Encontre a raiz quadrada da variância: √6,4 ≈ 2,53. O desvio padrão da amostra é 2,53.

Calculando o Desvio Padrão em Python

Calcular o desvio padrão manualmente é propenso a erros, especialmente com grandes conjuntos de dados. Na prática, estatísticos e cientistas de dados usam linguagens de programação como o Python para calculá-lo instantaneamente usando bibliotecas integradas.

python
import statistics

data = [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]

# Calcular o desvio padrão amostral (padrão)
sample_sd = statistics.stdev(data)
print(f"Sample SD: {sample_sd:.2f}")

# Calcular o desvio padrão populacional
pop_sd = statistics.pstdev(data)
print(f"Population SD: {pop_sd:.2f}")

A Regra Empírica e o Desvio Padrão

Quando os dados seguem uma distribuição normal (curva em forma de sino), o desvio padrão se torna incrivelmente preditivo. A Regra Empírica, também conhecida como regra 68-95-99,7, afirma que quase todos os dados cairão dentro de três desvios padrão da média. Isso permite que analistas identifiquem rapidamente valores atípicos (outliers) e compreendam a probabilidade de ocorrência de uma observação específica.

Intervalo a partir da MédiaPorcentagem dos DadosAplicação
±1σ68,27%Identificar valores típicos do dia a dia
±2σ95,45%Definir intervalos de confiança
±3σ99,73%Detectar valores atípicos extremos

Desvio Padrão vs. Variância

A variância e o desvio padrão são medidas de dispersão intimamente relacionadas. A variância (σ² ou s²) é a média das diferenças quadráticas em relação à média, enquanto o desvio padrão é a raiz quadrada da variância. Como a variância é expressa em unidades ao quadrado (por exemplo, reais ao quadrado, centímetros ao quadrado), pode ser difícil interpretá-la no contexto dos dados originais. O desvio padrão resolve isso convertendo a medida de volta para as unidades originais.

Relatando Seus Dados

Sempre relate o desvio padrão junto com a média ao descrever seus dados. Como o DP está nas mesmas unidades da média (por exemplo, reais, centímetros, quilos), ele fornece uma medida intuitiva de dispersão que seu público pode entender imediatamente.

Armadilhas Comuns a Evitar

Embora o desvio padrão seja uma ferramenta poderosa, ele é frequentemente mal utilizado. Aplicar as fórmulas de forma incorreta ou interpretar erroneamente o que o valor representa pode levar a análises de dados falhas e conclusões incorretas.

  • Usar a fórmula populacional para uma amostra: Esquecer de usar n - 1 para amostras reduz artificialmente a dispersão calculada, subestimando a verdadeira variância populacional.
  • Aplicar o DP a distribuições não normais: A Regra Empírica aplica-se apenas a distribuições normais. Para dados altamente assimétricos, o DP pode não refletir com precisão a dispersão.
  • Confundir DP com Erro Padrão: O erro padrão mede a precisão da estimativa da média amostral, enquanto o desvio padrão mede a dispersão dos dados subjacentes em si.

Cuidado com os Outliers

O desvio padrão é altamente sensível a valores atípicos extremos. Como a fórmula eleva ao quadrado as diferenças em relação à média, um único outlier massivo pode inflar o desvio padrão desproporcionalmente, fazendo com que os dados pareçam mais variáveis do que realmente são.

Further Reading

Sources

References and further authoritative reading used in preparing this article.

  1. Wikipédia: Desvio Padrão
  2. Manual de Métodos Estatísticos NIST/SEMATECH
  3. Khan Academy: Estatística e Probabilidade