Σ
SDCalc
AvanzatoAvanzato·12 min

Deviazione standard geometrica: guida completa

Guida completa alla deviazione standard geometrica per analizzare rapporti, tassi di crescita e dati log-normali. Include formule, passaggi di calcolo, codice Python e applicazioni in finanza e scienze.

Quando usare la deviazione standard geometrica

La deviazione standard geometrica (DSG) è la misura di dispersione appropriata per dati di natura moltiplicativa anziché additiva, come tassi di crescita, rapporti, concentrazioni o qualsiasi misurazione con distribuzione log-normale.

Consideriamo i rendimenti azionari: un guadagno del 10% seguito da una perdita del 10% non riporta al pareggio (si otterrebbe il 99% del capitale originale). Queste relazioni moltiplicative richiedono statistiche geometriche anziché aritmetiche.

Concetto chiave

Se i dati coprono diversi ordini di grandezza, sono sempre positivi e appaiono asimmetrici a destra nel grafico normale ma simmetrici su scala logaritmica, si tratta di dati log-normali che necessitano di statistiche geometriche.

Comprendere i dati log-normali

I dati hanno una distribuzione log-normale quando il loro logaritmo naturale segue una distribuzione normale. Esempi comuni includono:

  • Prezzi azionari e rendimenti degli investimenti nel tempo
  • Distribuzioni di reddito e patrimonio
  • Dimensioni delle particelle in aerosol e farmaci
  • Conte di colonie batteriche e cariche virali
  • Concentrazioni di inquinanti ambientali
  • Titoli anticorpali e concentrazioni di farmaci

La caratteristica fondamentale: processi che comportano moltiplicazioni ripetute generano distribuzioni log-normali, così come addizioni ripetute generano distribuzioni normali.

Formula e calcolo

Deviazione standard geometrica

GSD = exp(√[Σ(ln xᵢ - ln x̄ₘ)² / (n-1)])

O più semplicemente: calcolare il logaritmo naturale di tutti i valori, calcolare la deviazione standard classica, poi esponenziare.

1

Trasformare i dati

Calcolare il logaritmo naturale di ogni valore: yᵢ = ln(xᵢ)
2

Calcolare la media

Trovare la media aritmetica dei valori logaritmici: ȳ = Σyᵢ/n
3

Calcolare la DS

Trovare la deviazione standard dei valori logaritmici: s = √[Σ(yᵢ-ȳ)²/(n-1)]
4

Ritrasformare

Esponenziare per ottenere la DSG: GSD = eˢ
Python
import numpy as np
from scipy import stats

def geometric_sd(data):
    """Calculate geometric standard deviation"""
    log_data = np.log(data)
    sd_log = np.std(log_data, ddof=1)
    return np.exp(sd_log)

def geometric_mean(data):
    """Calculate geometric mean"""
    return stats.gmean(data)

# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")

Interpretare i valori della DSG

A differenza della DS aritmetica che è nelle stesse unità dei dati, la DSG è un fattore moltiplicativo, un rapporto. Una DSG di 2,0 significa che i dati variano tipicamente di un fattore 2.

  • DSG = 1,0:Nessuna variazione (impossibile in pratica)
  • DSG ≈ 1,2:Bassa variabilità (±20% tipico)
  • DSG ≈ 2,0:Variabilità moderata (i dati raddoppiano/dimezzano)
  • DSG ≈ 3,0:Alta variabilità (copre un ordine di grandezza)

Intervalli di confidenza

Per dati log-normali, l’intervallo al 95% è approssimativamente: Media geometrica ÷ DSG² fino a Media geometrica × DSG². Per MG=100 e DSG=2, l’intervallo è da 25 a 400.

Applicazioni nel mondo reale

Scienze farmaceutiche

Distribuzione granulometrica (D50, DSG) · Variabilità della concentrazione del farmaco · Studi di biodisponibilità · Caratterizzazione degli aerosol

Finanza ed economia

Volatilità dei rendimenti degli investimenti · Analisi dei tassi di crescita · Studi sulla distribuzione del reddito · Modellazione dei prezzi degli attivi

DSG vs DS classica

Usare la DS aritmetica su dati log-normali dà risultati fuorvianti:

Esempio: Dati sulla carica virale

Valori: 1.000; 5.000; 10.000; 50.000; 100.000 copie/mL Media aritmetica ± DS: 33.200 ± 41.424 Media geometrica × DSG: 10.000 × 4,5 → Intervallo: 2.222 – 45.000 La DS aritmetica suggerirebbe che valori negativi sono possibili, il che è impossibile per le cariche virali!

Verifica sempre la distribuzione

Prima di calcolare qualsiasi misura di dispersione, visualizza i tuoi dati. Se sono asimmetrici a destra con una lunga coda, prova una trasformazione logaritmica. Se ciò li rende simmetrici, usa le statistiche geometriche.