Hvornår skal man bruge geometrisk standardafvigelse
Geometrisk standardafvigelse (GSD) er det rette spredningsmål for data, der er multiplikative snarere end additive – som vækstrater, forhold, koncentrationer eller enhver log-normalfordelt måling.
Tag aktieafkast som eksempel: en gevinst på 10% efterfulgt af et tab på 10% bringer dig ikke tilbage til udgangspunktet (du ville have 99% af det oprindelige beløb). Disse multiplikative sammenhænge kræver geometrisk statistik i stedet for aritmetisk.
Kernepointe
Forståelse af log-normalfordelte data
Data er log-normalfordelt, når den naturlige logaritme følger en normalfordeling. Almindelige eksempler inkluderer:
- Aktiekurser og investeringsafkast over tid
- Indkomst- og formuefordelinger
- Partikelstørrelser i aerosoler og farmaceutiske produkter
- Bakteriekolonital og virale belastninger
- Miljøforurenende koncentrationer
- Antistoftitrer og lægemiddelkoncentrationer
Det centrale kendetegn: processer, der involverer gentagen multiplikation, genererer log-normalfordelinger, ligesom gentagen addition genererer normalfordelinger.
Formel og beregning
Geometric Standard Deviation
Eller mere simpelt: tag den naturlige logaritme af alle værdier, beregn den almindelige standardafvigelse og eksponentier derefter.
Transformér data
Beregn gennemsnit
Beregn SA
Tilbage-transformér
import numpy as np
from scipy import stats
def geometric_sd(data):
"""Calculate geometric standard deviation"""
log_data = np.log(data)
sd_log = np.std(log_data, ddof=1)
return np.exp(sd_log)
def geometric_mean(data):
"""Calculate geometric mean"""
return stats.gmean(data)
# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")Fortolkning af GSD-værdier
I modsætning til aritmetisk SA, der er i samme enheder som dine data, er GSD en multiplikativ faktor – et forhold. En GSD på 2,0 betyder, at data typisk varierer med en faktor 2.
- GSD = 1,0:Ingen variation (umuligt i praksis)
- GSD ≈ 1,2:Lav variabilitet (±20% typisk)
- GSD ≈ 2,0:Moderat variabilitet (data fordobles/halveres)
- GSD ≈ 3,0:Høj variabilitet (spænder over en størrelsesorden)
Konfidensintervaller
Anvendelser i den virkelige verden
Farmaceutisk videnskab
Finans og økonomi
GSD vs. almindelig SA
Brug af aritmetisk SA på log-normalfordelte data giver vildledende resultater:
Eksempel: Virusbelastningsdata
Kontrollér altid fordelingen