Wann die geometrische Standardabweichung verwenden
Die geometrische Standardabweichung (GSD) ist das geeignete Streuungsmaß für Daten, die multiplikativ statt additiv sind — wie Wachstumsraten, Verhältnisse, Konzentrationen oder beliebige log-normalverteilte Messwerte.
Betrachten Sie Aktienrenditen: Ein Gewinn von 10 % gefolgt von einem Verlust von 10 % bringt Sie nicht zum Ausgangspunkt zurück (Sie hätten 99 % des Originals). Diese multiplikativen Zusammenhänge erfordern geometrische statt arithmetischer Statistik.
Kernaussage
Log-normale Daten verstehen
Daten sind log-normalverteilt, wenn ihr natürlicher Logarithmus einer Normalverteilung folgt. Typische Beispiele sind:
- Aktienkurse und Anlagerenditen im Zeitverlauf
- Einkommens- und Vermögensverteilungen
- Partikelgrößen in Aerosolen und Pharmazeutika
- Bakterienkoloniezahlen und Viruslasten
- Schadstoffkonzentrationen in der Umwelt
- Antikörpertiter und Wirkstoffkonzentrationen
Die zentrale Eigenschaft: Prozesse, die wiederholte Multiplikation beinhalten, erzeugen log-normale Verteilungen, genauso wie wiederholte Addition normale Verteilungen erzeugt.
Formel und Berechnung
Geometrische Standardabweichung
Oder einfacher: Berechnen Sie den natürlichen Logarithmus aller Werte, bestimmen Sie die reguläre Standardabweichung und potenzieren Sie dann.
Daten transformieren
Mittelwert berechnen
SD berechnen
Rücktransformieren
import numpy as np
from scipy import stats
def geometric_sd(data):
"""Calculate geometric standard deviation"""
log_data = np.log(data)
sd_log = np.std(log_data, ddof=1)
return np.exp(sd_log)
def geometric_mean(data):
"""Calculate geometric mean"""
return stats.gmean(data)
# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")GSD-Werte interpretieren
Anders als die arithmetische SD, die dieselbe Einheit wie Ihre Daten hat, ist die GSD ein multiplikativer Faktor — ein Verhältnis. Eine GSD von 2,0 bedeutet, dass die Daten typischerweise um den Faktor 2 variieren.
- GSD = 1,0:Keine Variation (in der Praxis unmöglich)
- GSD ≈ 1,2:Geringe Variabilität (±20 % typisch)
- GSD ≈ 2,0:Mäßige Variabilität (Daten verdoppeln/halbieren sich)
- GSD ≈ 3,0:Hohe Variabilität (umfasst eine Größenordnung)
Konfidenzintervalle
Praxisanwendungen
Pharmazeutische Wissenschaften
Finanzen & Wirtschaft
GSD vs. reguläre SD
Die Verwendung der arithmetischen SD bei log-normalen Daten liefert irreführende Ergebnisse:
Beispiel: Viruslast-Daten
Verteilung immer prüfen