Σ
SDCalc
AvançadoAvançado·12 min

Desvio Padrão Geométrico: Guia Completo

Guia completo sobre desvio padrão geométrico para análise de razões, taxas de crescimento e dados com distribuição log-normal. Inclui fórmulas, passos de cálculo, código em Python e aplicações em finanças e ciências.

Quando Usar o Desvio Padrão Geométrico

O desvio padrão geométrico (DPG) é a medida de dispersão apropriada para dados que são multiplicativos em vez de aditivos — como taxas de crescimento, razões, concentrações ou qualquer medição com distribuição log-normal.

Considere retornos de ações: um ganho de 10% seguido de uma perda de 10% não retorna ao ponto de equilíbrio (você teria 99% do original). Essas relações multiplicativas exigem estatísticas geométricas em vez de aritméticas.

Insight Fundamental

Se seus dados abrangem várias ordens de grandeza, são sempre positivos e parecem assimétricos à direita quando plotados normalmente, mas simétricos em escala logarítmica — você está lidando com dados log-normais que precisam de estatísticas geométricas.

Entendendo Dados Log-Normais

Os dados têm distribuição log-normal quando seu logaritmo natural segue uma distribuição normal. Exemplos comuns incluem:

  • Preços de ações e retornos de investimentos ao longo do tempo
  • Distribuições de renda e riqueza
  • Tamanhos de partículas em aerossóis e produtos farmacêuticos
  • Contagens de colônias bacterianas e cargas virais
  • Concentrações de poluentes ambientais
  • Títulos de anticorpos e concentrações de medicamentos

A característica principal: processos que envolvem multiplicação repetida geram distribuições log-normais, assim como a adição repetida gera distribuições normais.

Fórmula e Cálculo

Desvio Padrão Geométrico

GSD = exp(√[Σ(ln xᵢ - ln x̄ₘ)² / (n-1)])

Ou de forma mais simples: calcule o logaritmo natural de todos os valores, calcule o desvio padrão regular e depois aplique a exponencial.

1

Transformar os Dados

Calcule o logaritmo natural de cada valor: yᵢ = ln(xᵢ)
2

Calcular a Média

Encontre a média aritmética dos valores logarítmicos: ȳ = Σyᵢ/n
3

Calcular o DP

Encontre o desvio padrão dos valores logarítmicos: s = √[Σ(yᵢ-ȳ)²/(n-1)]
4

Reverter a Transformação

Aplique a exponencial para obter o DPG: DPG = eˢ
Python
import numpy as np
from scipy import stats

def geometric_sd(data):
    """Calculate geometric standard deviation"""
    log_data = np.log(data)
    sd_log = np.std(log_data, ddof=1)
    return np.exp(sd_log)

def geometric_mean(data):
    """Calculate geometric mean"""
    return stats.gmean(data)

# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")

Interpretando Valores de DPG

Diferente do DP aritmético que está nas mesmas unidades dos seus dados, o DPG é um fator multiplicativo — uma razão. Um DPG de 2,0 significa que os dados tipicamente variam por um fator de 2.

  • DPG = 1,0:Nenhuma variação (impossível na prática)
  • DPG ≈ 1,2:Baixa variabilidade (±20% típicos)
  • DPG ≈ 2,0:Variabilidade moderada (dados dobram/reduzem pela metade)
  • DPG ≈ 3,0:Alta variabilidade (abrange uma ordem de grandeza)

Intervalos de Confiança

Para dados log-normais, o intervalo de 95% é aproximadamente: Média Geométrica ÷ DPG² até Média Geométrica × DPG². Para MG=100 e DPG=2, o intervalo é de 25 a 400.

Aplicações no Mundo Real

Ciências Farmacêuticas

Distribuição de tamanho de partículas (D50, DPG) · Variabilidade de concentração de fármacos · Estudos de biodisponibilidade · Caracterização de aerossóis

Finanças e Economia

Volatilidade de retornos de investimentos · Análise de taxas de crescimento · Estudos de distribuição de renda · Modelagem de preços de ativos

DPG vs DP Regular

Usar DP aritmético em dados log-normais produz resultados enganosos:

Exemplo: Dados de Carga Viral

Valores: 1.000; 5.000; 10.000; 50.000; 100.000 cópias/mL Média Aritmética ± DP: 33.200 ± 41.424 Média Geométrica × DPG: 10.000 × 4,5 → Intervalo: 2.222 a 45.000 O DP aritmético sugeriria que valores negativos são possíveis — impossível para cargas virais!

Sempre Verifique a Distribuição

Antes de calcular qualquer medida de dispersão, visualize seus dados. Se forem assimétricos à direita com uma cauda longa, tente uma transformação logarítmica. Se isso os tornar simétricos, use estatísticas geométricas.