O que é a Variância?
A variância mede quão disperso está um conjunto de números em relação ao seu valor médio. É a média dos quadrados das diferenças em relação à média — e é a base sobre a qual o desvio-padrão é construído.
Cada barra mostra o desvio ao quadrado em relação à média. Variância = média destas barras.
Fórmula da Variância
Variância Populacional
σ² = Σ(xᵢ - μ)² / N
Variância Amostral
s² = Σ(xᵢ - x̄)² / (n-1)
1
Calcular a média
Somar todos os valores e dividir pela contagem.
2
Encontrar cada desvio
Subtrair a média de cada ponto de dados.
3
Elevar cada desvio ao quadrado
Isto elimina valores negativos e enfatiza desvios grandes.
4
Calcular a média dos desvios ao quadrado
Dividir por N (população) ou n-1 (amostra).
Porquê Elevar os Desvios ao Quadrado?
Três Razões Fundamentais
1. Eliminar negativos: Sem elevar ao quadrado, os desvios positivos e negativos anular-se-iam, tornando a soma igual a zero.
2. Penalizar outliers: Elevar ao quadrado atribui mais peso a valores distantes da média.
3. Propriedades matemáticas: A variância possui propriedades algébricas úteis para a inferência estatística.
Exemplo: Porquê Não Usar Apenas Valores Absolutos?
Conjunto de dados: 2, 4, 4, 4, 5, 5, 7, 9 (Média = 5)
Desvio Absoluto Médio:
|2-5| + |4-5| + ... = 14
DAM = 14/8 = 1,75
Variância (ao quadrado):
(2-5)² + (4-5)² + ... = 32
Var = 32/8 = 4
Variância vs. Desvio-Padrão
A Relação
Standard Deviation = √Variance → σ = √σ²
Variância (σ²)
- As unidades são ao quadrado (e.g., cm², €²)
- Mais difícil de interpretar diretamente
- Útil para operações matemáticas
- Aditiva para variáveis independentes
Desvio-Padrão (σ)
- Mesmas unidades dos dados originais
- Mais fácil de interpretar
- Melhor para comunicação
- Utilizado em z-scores e intervalos de confiança
Aplicações da Variância
Embora o desvio-padrão seja mais frequentemente reportado, a variância tem utilizações específicas:
- ANOVA:A Análise de Variância compara médias entre grupos
- Teoria de Carteiras:As variâncias dos retornos são utilizadas na otimização
- Regressão:R² é a variância explicada dividida pela variância total
- ACP:A Análise de Componentes Principais maximiza a variância explicada