Quando usare la deviazione standard geometrica
La deviazione standard geometrica (DSG) è la misura di dispersione appropriata per dati di natura moltiplicativa anziché additiva, come tassi di crescita, rapporti, concentrazioni o qualsiasi misurazione con distribuzione log-normale.
Consideriamo i rendimenti azionari: un guadagno del 10% seguito da una perdita del 10% non riporta al pareggio (si otterrebbe il 99% del capitale originale). Queste relazioni moltiplicative richiedono statistiche geometriche anziché aritmetiche.
Concetto chiave
Comprendere i dati log-normali
I dati hanno una distribuzione log-normale quando il loro logaritmo naturale segue una distribuzione normale. Esempi comuni includono:
- Prezzi azionari e rendimenti degli investimenti nel tempo
- Distribuzioni di reddito e patrimonio
- Dimensioni delle particelle in aerosol e farmaci
- Conte di colonie batteriche e cariche virali
- Concentrazioni di inquinanti ambientali
- Titoli anticorpali e concentrazioni di farmaci
La caratteristica fondamentale: processi che comportano moltiplicazioni ripetute generano distribuzioni log-normali, così come addizioni ripetute generano distribuzioni normali.
Formula e calcolo
Deviazione standard geometrica
O più semplicemente: calcolare il logaritmo naturale di tutti i valori, calcolare la deviazione standard classica, poi esponenziare.
Trasformare i dati
Calcolare la media
Calcolare la DS
Ritrasformare
import numpy as np
from scipy import stats
def geometric_sd(data):
"""Calculate geometric standard deviation"""
log_data = np.log(data)
sd_log = np.std(log_data, ddof=1)
return np.exp(sd_log)
def geometric_mean(data):
"""Calculate geometric mean"""
return stats.gmean(data)
# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")Interpretare i valori della DSG
A differenza della DS aritmetica che è nelle stesse unità dei dati, la DSG è un fattore moltiplicativo, un rapporto. Una DSG di 2,0 significa che i dati variano tipicamente di un fattore 2.
- DSG = 1,0:Nessuna variazione (impossibile in pratica)
- DSG ≈ 1,2:Bassa variabilità (±20% tipico)
- DSG ≈ 2,0:Variabilità moderata (i dati raddoppiano/dimezzano)
- DSG ≈ 3,0:Alta variabilità (copre un ordine di grandezza)
Intervalli di confidenza
Applicazioni nel mondo reale
Scienze farmaceutiche
Finanza ed economia
DSG vs DS classica
Usare la DS aritmetica su dati log-normali dà risultati fuorvianti:
Esempio: Dati sulla carica virale
Verifica sempre la distribuzione