Wanneer geometrische standaardafwijking gebruiken
Geometrische standaardafwijking (GSD) is de geschikte spreidingsmaat voor gegevens die multiplicatief zijn in plaats van additief—zoals groeicijfers, ratio's, concentraties of lognormaal verdeelde metingen.
Neem beursrendementen: een winst van 10% gevolgd door een verlies van 10% brengt u niet terug op break-even (u zou 99% van het origineel overhouden). Deze multiplicatieve relaties vereisen geometrische statistieken in plaats van rekenkundige.
Kernidee
Lognormale gegevens begrijpen
Gegevens zijn lognormaal verdeeld wanneer hun natuurlijke logaritme een normale verdeling volgt. Veelvoorkomende voorbeelden zijn:
- Aandelenkoersen en beleggingsrendementen door de tijd
- Inkomens- en vermogensverdelingen
- Deeltjesgroottes in aerosolen en farmaceutica
- Bacteriekolonies en virale ladingen
- Concentraties van milieuverontreinigende stoffen
- Antilichaamtiters en geneesmiddelconcentraties
Het belangrijkste kenmerk: processen met herhaalde vermenigvuldiging genereren lognormale verdelingen, net zoals herhaalde optelling normale verdelingen genereert.
Formule en berekening
Geometrische standaardafwijking
Of eenvoudiger: neem de natuurlijke logaritme van alle waarden, bereken de gewone standaardafwijking en neem vervolgens de exponent.
Gegevens transformeren
Gemiddelde berekenen
SD berekenen
Terugtransformeren
import numpy as np
from scipy import stats
def geometric_sd(data):
"""Calculate geometric standard deviation"""
log_data = np.log(data)
sd_log = np.std(log_data, ddof=1)
return np.exp(sd_log)
def geometric_mean(data):
"""Calculate geometric mean"""
return stats.gmean(data)
# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")GSD-waarden interpreteren
Anders dan rekenkundige SD, die dezelfde eenheden heeft als uw gegevens, is GSD een multiplicatieve factor—een ratio. Een GSD van 2,0 betekent dat de gegevens doorgaans met een factor 2 variëren.
- GSD = 1,0:Geen variatie (in de praktijk onmogelijk)
- GSD ≈ 1,2:Lage variabiliteit (±20% typisch)
- GSD ≈ 2,0:Matige variabiliteit (gegevens verdubbelen/halveren)
- GSD ≈ 3,0:Hoge variabiliteit (bestrijkt een grooteorde)
Betrouwbaarheidsintervallen
Praktische toepassingen
Farmaceutische wetenschappen
Financiën en economie
GSD vs. gewone SD
Het gebruik van rekenkundige SD op lognormale gegevens geeft misleidende resultaten:
Voorbeeld: virale lading
Controleer altijd de verdeling