Σ
SDCalc
AvançadoAvançado·12 min

Desvio-Padrão Geométrico: Guia Completo

Guia completo do desvio-padrão geométrico para analisar rácios, taxas de crescimento e dados com distribuição log-normal. Inclui fórmulas, passos de cálculo, código Python e aplicações em finanças e ciência.

Quando Utilizar o Desvio-Padrão Geométrico

O desvio-padrão geométrico (DPG) é a medida de dispersão apropriada para dados que são multiplicativos e não aditivos — como taxas de crescimento, rácios, concentrações ou quaisquer medições com distribuição log-normal.

Considera os retornos de ações: um ganho de 10% seguido de uma perda de 10% não te devolve ao ponto de partida (ficarias com 99% do original). Estas relações multiplicativas requerem estatísticas geométricas em vez de aritméticas.

Ideia Fundamental

Se os teus dados abrangem várias ordens de grandeza, são sempre positivos e parecem assimétricos à direita quando representados normalmente mas simétricos numa escala logarítmica — estás perante dados log-normais que necessitam de estatísticas geométricas.

Compreender Dados Log-Normais

Os dados têm distribuição log-normal quando o seu logaritmo natural segue uma distribuição normal. Exemplos comuns incluem:

  • Preços de ações e retornos de investimento ao longo do tempo
  • Distribuições de rendimento e riqueza
  • Dimensões de partículas em aerossóis e produtos farmacêuticos
  • Contagens de colónias bacterianas e cargas virais
  • Concentrações de poluentes ambientais
  • Títulos de anticorpos e concentrações de fármacos

A característica principal: processos que envolvem multiplicação repetida geram distribuições log-normais, tal como a adição repetida gera distribuições normais.

Fórmula e Cálculo

Desvio-Padrão Geométrico

GSD = exp(√[Σ(ln xᵢ - ln x̄ₘ)² / (n-1)])

Ou mais simplesmente: calcula o logaritmo natural de todos os valores, calcula o desvio-padrão regular e depois aplica a exponencial.

1

Transformar os Dados

Calcular o logaritmo natural de cada valor: yᵢ = ln(xᵢ)
2

Calcular a Média

Encontrar a média aritmética dos valores logaritmizados: ȳ = Σyᵢ/n
3

Calcular o DP

Encontrar o desvio-padrão dos valores logaritmizados: s = √[Σ(yᵢ-ȳ)²/(n-1)]
4

Transformar de Volta

Aplicar a exponencial para obter o DPG: GSD = eˢ
Python
import numpy as np
from scipy import stats

def geometric_sd(data):
    """Calculate geometric standard deviation"""
    log_data = np.log(data)
    sd_log = np.std(log_data, ddof=1)
    return np.exp(sd_log)

def geometric_mean(data):
    """Calculate geometric mean"""
    return stats.gmean(data)

# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")

Interpretar Valores de DPG

Ao contrário do DP aritmético que está nas mesmas unidades dos dados, o DPG é um fator multiplicativo — um rácio. Um DPG de 2,0 significa que os dados variam tipicamente por um fator de 2.

  • DPG = 1,0:Sem variação (impossível na prática)
  • DPG ≈ 1,2:Baixa variabilidade (±20% típico)
  • DPG ≈ 2,0:Variabilidade moderada (os dados duplicam/reduzem para metade)
  • DPG ≈ 3,0:Alta variabilidade (abrange uma ordem de grandeza)

Intervalos de Confiança

Para dados log-normais, o intervalo de 95% é aproximadamente: Média Geométrica ÷ DPG² a Média Geométrica × DPG². Para MG=100 e DPG=2, o intervalo é 25 a 400.

Aplicações no Mundo Real

Ciências Farmacêuticas

Distribuição do tamanho de partículas (D50, DPG) · Variabilidade da concentração de fármacos · Estudos de biodisponibilidade · Caracterização de aerossóis

Finanças e Economia

Volatilidade dos retornos de investimento · Análise de taxas de crescimento · Estudos de distribuição de rendimento · Modelação de preços de ativos

DPG vs. DP Regular

Utilizar o DP aritmético em dados log-normais produz resultados enganadores:

Exemplo: Dados de Carga Viral

Valores: 1.000; 5.000; 10.000; 50.000; 100.000 cópias/mL Média Aritmética ± DP: 33.200 ± 41.424 Média Geométrica × DPG: 10.000 × 4,5 → Intervalo: 2.222 a 45.000 O DP aritmético sugeriria que valores negativos são possíveis — impossível para cargas virais!

Verifica Sempre a Distribuição

Antes de calcular qualquer medida de dispersão, visualiza os teus dados. Se forem assimétricos à direita com uma cauda longa, experimenta uma transformação logarítmica. Se isso os tornar simétricos, utiliza estatísticas geométricas.