Σ
SDCalc
AvanceretAvanceret·12 min

Geometrisk standardafvigelse: Komplet guide

Komplet guide til geometrisk standardafvigelse til analyse af forhold, vækstrater og log-normalfordelte data. Inkluderer formler, beregningstrin, Python-kode og anvendelser inden for finans og naturvidenskab.

Hvornår skal man bruge geometrisk standardafvigelse

Geometrisk standardafvigelse (GSD) er det rette spredningsmål for data, der er multiplikative snarere end additive – som vækstrater, forhold, koncentrationer eller enhver log-normalfordelt måling.

Tag aktieafkast som eksempel: en gevinst på 10% efterfulgt af et tab på 10% bringer dig ikke tilbage til udgangspunktet (du ville have 99% af det oprindelige beløb). Disse multiplikative sammenhænge kræver geometrisk statistik i stedet for aritmetisk.

Kernepointe

Hvis dine data spænder over flere størrelsesordener, altid er positive og ser højreskæve ud ved normal plotning, men symmetriske ved logaritmisk plotning – så har du med log-normalfordelte data at gøre, der kræver geometrisk statistik.

Forståelse af log-normalfordelte data

Data er log-normalfordelt, når den naturlige logaritme følger en normalfordeling. Almindelige eksempler inkluderer:

  • Aktiekurser og investeringsafkast over tid
  • Indkomst- og formuefordelinger
  • Partikelstørrelser i aerosoler og farmaceutiske produkter
  • Bakteriekolonital og virale belastninger
  • Miljøforurenende koncentrationer
  • Antistoftitrer og lægemiddelkoncentrationer

Det centrale kendetegn: processer, der involverer gentagen multiplikation, genererer log-normalfordelinger, ligesom gentagen addition genererer normalfordelinger.

Formel og beregning

Geometric Standard Deviation

GSD = exp(√[Σ(ln xᵢ - ln x̄ₘ)² / (n-1)])

Eller mere simpelt: tag den naturlige logaritme af alle værdier, beregn den almindelige standardafvigelse og eksponentier derefter.

1

Transformér data

Beregn den naturlige logaritme af hver værdi: yᵢ = ln(xᵢ)
2

Beregn gennemsnit

Find det aritmetiske gennemsnit af log-værdierne: ȳ = Σyᵢ/n
3

Beregn SA

Find standardafvigelsen af log-værdierne: s = √[Σ(yᵢ-ȳ)²/(n-1)]
4

Tilbage-transformér

Eksponentier for at få GSD: GSD = eˢ
Python
import numpy as np
from scipy import stats

def geometric_sd(data):
    """Calculate geometric standard deviation"""
    log_data = np.log(data)
    sd_log = np.std(log_data, ddof=1)
    return np.exp(sd_log)

def geometric_mean(data):
    """Calculate geometric mean"""
    return stats.gmean(data)

# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")

Fortolkning af GSD-værdier

I modsætning til aritmetisk SA, der er i samme enheder som dine data, er GSD en multiplikativ faktor – et forhold. En GSD på 2,0 betyder, at data typisk varierer med en faktor 2.

  • GSD = 1,0:Ingen variation (umuligt i praksis)
  • GSD ≈ 1,2:Lav variabilitet (±20% typisk)
  • GSD ≈ 2,0:Moderat variabilitet (data fordobles/halveres)
  • GSD ≈ 3,0:Høj variabilitet (spænder over en størrelsesorden)

Konfidensintervaller

For log-normalfordelte data er det omtrentlige 95%-interval: Geometrisk gennemsnit ÷ GSD² til Geometrisk gennemsnit × GSD². For GM=100 og GSD=2 er intervallet 25 til 400.

Anvendelser i den virkelige verden

Farmaceutisk videnskab

Partikelstørrelsesfordeling (D50, GSD) · Variabilitet i lægemiddelkoncentration · Biotilgængelighedsstudier · Aerosolkarakterisering

Finans og økonomi

Volatilitet i investeringsafkast · Analyse af vækstrater · Studier af indkomstfordeling · Modellering af aktivpriser

GSD vs. almindelig SA

Brug af aritmetisk SA på log-normalfordelte data giver vildledende resultater:

Eksempel: Virusbelastningsdata

Værdier: 1.000; 5.000; 10.000; 50.000; 100.000 kopier/mL Aritmetisk gennemsnit ± SA: 33.200 ± 41.424 Geometrisk gennemsnit × GSD: 10.000 × 4,5 → Interval: 2.222 til 45.000 Den aritmetiske SA ville antyde, at negative værdier er mulige – umuligt for virusbelastninger!

Kontrollér altid fordelingen

Før du beregner et spredningsmål, skal du visualisere dine data. Hvis de er højreskæve med en lang hale, prøv en log-transformation. Hvis det gør dem symmetriske, brug geometrisk statistik.