När ska geometrisk standardavvikelse användas
Geometrisk standardavvikelse (GSD) är det lämpliga spridningsmåttet för data som är multiplikativ snarare än additiv – som tillväxttakter, kvoter, koncentrationer eller valfria log-normalfördelade mätningar.
Tänk på aktieavkastning: en vinst på 10 % följd av en förlust på 10 % tar dig inte tillbaka till noll (du skulle ha 99 % av ursprungsbeloppet). Dessa multiplikativa samband kräver geometrisk statistik istället för aritmetisk.
Nyckelinsikt
Förstå log-normalfördelade data
Data är log-normalfördelade när dess naturliga logaritm följer en normalfördelning. Vanliga exempel inkluderar:
- Aktiekurser och investeringsavkastning över tid
- Inkomst- och förmögenhetsfördelningar
- Partikelstorleksfördelningar i aerosoler och läkemedel
- Bakteriekolonier och viruslaster
- Miljöföroreningskoncentrationer
- Antikroppstitrar och läkemedelskoncentrationer
Den avgörande egenskapen: processer som involverar upprepad multiplikation genererar log-normalfördelningar, precis som upprepad addition genererar normalfördelningar.
Formel och beräkning
Geometric Standard Deviation
Eller enklare: ta den naturliga logaritmen av alla värden, beräkna den vanliga standardavvikelsen och exponentiera sedan.
Transformera data
Beräkna medelvärdet
Beräkna SA
Återtransformera
import numpy as np
from scipy import stats
def geometric_sd(data):
"""Calculate geometric standard deviation"""
log_data = np.log(data)
sd_log = np.std(log_data, ddof=1)
return np.exp(sd_log)
def geometric_mean(data):
"""Calculate geometric mean"""
return stats.gmean(data)
# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")Tolkning av GSD-värden
Till skillnad från aritmetisk SA som anges i samma enheter som dina data, är GSD en multiplikativ faktor – en kvot. En GSD på 2,0 innebär att data typiskt varierar med en faktor 2.
- GSD = 1,0:Ingen variation (omöjligt i praktiken)
- GSD ≈ 1,2:Låg variabilitet (±20 % typiskt)
- GSD ≈ 2,0:Måttlig variabilitet (data fördubblas/halveras)
- GSD ≈ 3,0:Hög variabilitet (spänner en storleksordning)
Konfidensintervall
Tillämpningar i verkligheten
Farmaceutisk vetenskap
Finans och ekonomi
GSD jämfört med vanlig SA
Att använda aritmetisk SA på log-normalfördelade data ger vilseledande resultat:
Exempel: Viruslastdata
Kontrollera alltid fördelningen