Quando Usar o Desvio Padrão Geométrico
O desvio padrão geométrico (DPG) é a medida de dispersão apropriada para dados que são multiplicativos em vez de aditivos — como taxas de crescimento, razões, concentrações ou qualquer medição com distribuição log-normal.
Considere retornos de ações: um ganho de 10% seguido de uma perda de 10% não retorna ao ponto de equilíbrio (você teria 99% do original). Essas relações multiplicativas exigem estatísticas geométricas em vez de aritméticas.
Insight Fundamental
Entendendo Dados Log-Normais
Os dados têm distribuição log-normal quando seu logaritmo natural segue uma distribuição normal. Exemplos comuns incluem:
- Preços de ações e retornos de investimentos ao longo do tempo
- Distribuições de renda e riqueza
- Tamanhos de partículas em aerossóis e produtos farmacêuticos
- Contagens de colônias bacterianas e cargas virais
- Concentrações de poluentes ambientais
- Títulos de anticorpos e concentrações de medicamentos
A característica principal: processos que envolvem multiplicação repetida geram distribuições log-normais, assim como a adição repetida gera distribuições normais.
Fórmula e Cálculo
Desvio Padrão Geométrico
Ou de forma mais simples: calcule o logaritmo natural de todos os valores, calcule o desvio padrão regular e depois aplique a exponencial.
Transformar os Dados
Calcular a Média
Calcular o DP
Reverter a Transformação
import numpy as np
from scipy import stats
def geometric_sd(data):
"""Calculate geometric standard deviation"""
log_data = np.log(data)
sd_log = np.std(log_data, ddof=1)
return np.exp(sd_log)
def geometric_mean(data):
"""Calculate geometric mean"""
return stats.gmean(data)
# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")Interpretando Valores de DPG
Diferente do DP aritmético que está nas mesmas unidades dos seus dados, o DPG é um fator multiplicativo — uma razão. Um DPG de 2,0 significa que os dados tipicamente variam por um fator de 2.
- DPG = 1,0:Nenhuma variação (impossível na prática)
- DPG ≈ 1,2:Baixa variabilidade (±20% típicos)
- DPG ≈ 2,0:Variabilidade moderada (dados dobram/reduzem pela metade)
- DPG ≈ 3,0:Alta variabilidade (abrange uma ordem de grandeza)
Intervalos de Confiança
Aplicações no Mundo Real
Ciências Farmacêuticas
Finanças e Economia
DPG vs DP Regular
Usar DP aritmético em dados log-normais produz resultados enganosos:
Exemplo: Dados de Carga Viral
Sempre Verifique a Distribuição