Quando Utilizar o Desvio-Padrão Geométrico
O desvio-padrão geométrico (DPG) é a medida de dispersão apropriada para dados que são multiplicativos e não aditivos — como taxas de crescimento, rácios, concentrações ou quaisquer medições com distribuição log-normal.
Considera os retornos de ações: um ganho de 10% seguido de uma perda de 10% não te devolve ao ponto de partida (ficarias com 99% do original). Estas relações multiplicativas requerem estatísticas geométricas em vez de aritméticas.
Ideia Fundamental
Compreender Dados Log-Normais
Os dados têm distribuição log-normal quando o seu logaritmo natural segue uma distribuição normal. Exemplos comuns incluem:
- Preços de ações e retornos de investimento ao longo do tempo
- Distribuições de rendimento e riqueza
- Dimensões de partículas em aerossóis e produtos farmacêuticos
- Contagens de colónias bacterianas e cargas virais
- Concentrações de poluentes ambientais
- Títulos de anticorpos e concentrações de fármacos
A característica principal: processos que envolvem multiplicação repetida geram distribuições log-normais, tal como a adição repetida gera distribuições normais.
Fórmula e Cálculo
Desvio-Padrão Geométrico
Ou mais simplesmente: calcula o logaritmo natural de todos os valores, calcula o desvio-padrão regular e depois aplica a exponencial.
Transformar os Dados
Calcular a Média
Calcular o DP
Transformar de Volta
import numpy as np
from scipy import stats
def geometric_sd(data):
"""Calculate geometric standard deviation"""
log_data = np.log(data)
sd_log = np.std(log_data, ddof=1)
return np.exp(sd_log)
def geometric_mean(data):
"""Calculate geometric mean"""
return stats.gmean(data)
# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")Interpretar Valores de DPG
Ao contrário do DP aritmético que está nas mesmas unidades dos dados, o DPG é um fator multiplicativo — um rácio. Um DPG de 2,0 significa que os dados variam tipicamente por um fator de 2.
- DPG = 1,0:Sem variação (impossível na prática)
- DPG ≈ 1,2:Baixa variabilidade (±20% típico)
- DPG ≈ 2,0:Variabilidade moderada (os dados duplicam/reduzem para metade)
- DPG ≈ 3,0:Alta variabilidade (abrange uma ordem de grandeza)
Intervalos de Confiança
Aplicações no Mundo Real
Ciências Farmacêuticas
Finanças e Economia
DPG vs. DP Regular
Utilizar o DP aritmético em dados log-normais produz resultados enganadores:
Exemplo: Dados de Carga Viral
Verifica Sempre a Distribuição