Σ
SDCalc
AvanzatoAvanzato·12 min

Deviazione standard geometrica: guida completa

Guida completa alla deviazione standard geometrica per analizzare rapporti, tassi di crescita e dati log-normali. Include formule, passaggi di calcolo, codice Python e applicazioni in finanza e scienze.

Quando usare la deviazione standard geometrica

La deviazione standard geometrica (DSG) è la misura di dispersione appropriata per dati di natura moltiplicativa anziché additiva, come tassi di crescita, rapporti, concentrazioni o qualsiasi misurazione con distribuzione log-normale.

Consideriamo i rendimenti azionari: un guadagno del 10% seguito da una perdita del 10% non riporta al pareggio (si otterrebbe il 99% del capitale originale). Queste relazioni moltiplicative richiedono statistiche geometriche anziché aritmetiche.

Concetto chiave

Se i dati coprono diversi ordini di grandezza, sono sempre positivi e appaiono asimmetrici a destra nel grafico normale ma simmetrici su scala logaritmica, si tratta di dati log-normali che necessitano di statistiche geometriche.

Comprendere i dati log-normali

I dati hanno una distribuzione log-normale quando il loro logaritmo naturale segue una distribuzione normale. Esempi comuni includono:

  • Prezzi azionari e rendimenti degli investimenti nel tempo
  • Distribuzioni di reddito e patrimonio
  • Dimensioni delle particelle in aerosol e farmaci
  • Conte di colonie batteriche e cariche virali
  • Concentrazioni di inquinanti ambientali
  • Titoli anticorpali e concentrazioni di farmaci

La caratteristica fondamentale: processi che comportano moltiplicazioni ripetute generano distribuzioni log-normali, così come addizioni ripetute generano distribuzioni normali.

Formula e calcolo

Deviazione standard geometrica

GSD = exp(√[Σ(ln xᵢ - ln x̄ₘ)² / (n-1)])

O più semplicemente: calcolare il logaritmo naturale di tutti i valori, calcolare la deviazione standard classica, poi esponenziare.

1

Trasformare i dati

Calcolare il logaritmo naturale di ogni valore: yᵢ = ln(xᵢ)
2

Calcolare la media

Trovare la media aritmetica dei valori logaritmici: ȳ = Σyᵢ/n
3

Calcolare la DS

Trovare la deviazione standard dei valori logaritmici: s = √[Σ(yᵢ-ȳ)²/(n-1)]
4

Ritrasformare

Esponenziare per ottenere la DSG: GSD = eˢ
Python
import numpy as np
from scipy import stats

def geometric_sd(data):
    """Calculate geometric standard deviation"""
    log_data = np.log(data)
    sd_log = np.std(log_data, ddof=1)
    return np.exp(sd_log)

def geometric_mean(data):
    """Calculate geometric mean"""
    return stats.gmean(data)

# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")

Interpretare i valori della DSG

A differenza della DS aritmetica che è nelle stesse unità dei dati, la DSG è un fattore moltiplicativo, un rapporto. Una DSG di 2,0 significa che i dati variano tipicamente di un fattore 2.

  • DSG = 1,0:Nessuna variazione (impossibile in pratica)
  • DSG ≈ 1,2:Bassa variabilità (±20% tipico)
  • DSG ≈ 2,0:Variabilità moderata (i dati raddoppiano/dimezzano)
  • DSG ≈ 3,0:Alta variabilità (copre un ordine di grandezza)

Intervalli di confidenza

Per dati log-normali, l’intervallo al 95% è approssimativamente: Media geometrica ÷ DSG² fino a Media geometrica × DSG². Per MG=100 e DSG=2, l’intervallo è da 25 a 400.

Applicazioni nel mondo reale

Scienze farmaceutiche

Distribuzione granulometrica (D50, DSG) · Variabilità della concentrazione del farmaco · Studi di biodisponibilità · Caratterizzazione degli aerosol

Finanza ed economia

Volatilità dei rendimenti degli investimenti · Analisi dei tassi di crescita · Studi sulla distribuzione del reddito · Modellazione dei prezzi degli attivi

DSG vs DS classica

Usare la DS aritmetica su dati log-normali dà risultati fuorvianti:

Esempio: Dati sulla carica virale

Valori: 1.000; 5.000; 10.000; 50.000; 100.000 copie/mL Media aritmetica ± DS: 33.200 ± 41.424 Media geometrica × DSG: 10.000 × 4,5 → Intervallo: 2.222 – 45.000 La DS aritmetica suggerirebbe che valori negativi sono possibili, il che è impossibile per le cariche virali!

Verifica sempre la distribuzione

Prima di calcolare qualsiasi misura di dispersione, visualizza i tuoi dati. Se sono asimmetrici a destra con una lunga coda, prova una trasformazione logaritmica. Se ciò li rende simmetrici, usa le statistiche geometriche.

Further Reading

How to Read This Article

A statistics tutorial is a practical interpretation guide, not just a formula dump. It refers to the assumptions, notation, and reporting language that analysts need when they explain a result to a teacher, manager, client, or reviewer. The article body covers the specific topic, while the sections below create a common interpretation frame that readers can reuse across related metrics.

Reading goalWhat to focus onCommon mistake
DefinitionWhat the metric is and what quantity it summarizesTreating the formula as self-explanatory
Formula choiceSample versus population assumptions and notationUsing n when n-1 is required or vice versa
InterpretationWhether the result indicates concentration, spread, or riskCalling a large value good or bad without context

Frequently Asked Questions

How should I interpret a high standard deviation?

A high standard deviation means the observations are spread farther from the mean on average. Whether that spread is acceptable depends on the context: wide dispersion might signal risk in finance, instability in manufacturing, or genuine natural variation in scientific data.

Why do some articles mention n while others mention n-1?

The denominator reflects the difference between population and sample formulas. Population variance and population standard deviation use N because the full dataset is known. Sample variance and sample standard deviation often use n-1 because Bessel’s correction reduces bias when estimating population spread from a sample.

What is a statistical interpretation guide?

A statistical interpretation guide is a page that moves beyond arithmetic and explains meaning. It tells you what a metric is, when the formula applies, and how to describe the result in plain English without overstating certainty.

Can I cite this article in a report?

You should cite the underlying authoritative reference for formal work whenever possible. This page is best used as an explanatory bridge that helps you understand the concept before quoting the original standard or handbook.

Why include direct citations on every article page?

Direct citations give readers a route to verify the definition, notation, and assumptions. That improves trust and reduces the chance that a simplified explanation is mistaken for the entire technical standard.

Authoritative References

These sources define the concepts referenced most often across our articles. Bessel's correction is a sample adjustment, variance is a squared measure of spread, and standard deviation is the square root of variance expressed in the same units as the data.