Σ
SDCalc
GevorderdGeavanceerd·12 min

Geometrische standaardafwijking: volledige gids

Volledige gids over geometrische standaardafwijking voor het analyseren van ratio's, groeicijfers en lognormaal verdeelde gegevens. Inclusief formules, berekeningsstappen, Python-code en toepassingen in financiën en wetenschap.

Wanneer geometrische standaardafwijking gebruiken

Geometrische standaardafwijking (GSD) is de geschikte spreidingsmaat voor gegevens die multiplicatief zijn in plaats van additief—zoals groeicijfers, ratio's, concentraties of lognormaal verdeelde metingen.

Neem beursrendementen: een winst van 10% gevolgd door een verlies van 10% brengt u niet terug op break-even (u zou 99% van het origineel overhouden). Deze multiplicatieve relaties vereisen geometrische statistieken in plaats van rekenkundige.

Kernidee

Als uw gegevens meerdere grootteordes bestrijken, altijd positief zijn en rechtsscheef lijken bij normale weergave maar symmetrisch bij weergave op logaritmische schaal—dan heeft u te maken met lognormale gegevens die geometrische statistieken nodig hebben.

Lognormale gegevens begrijpen

Gegevens zijn lognormaal verdeeld wanneer hun natuurlijke logaritme een normale verdeling volgt. Veelvoorkomende voorbeelden zijn:

  • Aandelenkoersen en beleggingsrendementen door de tijd
  • Inkomens- en vermogensverdelingen
  • Deeltjesgroottes in aerosolen en farmaceutica
  • Bacteriekolonies en virale ladingen
  • Concentraties van milieuverontreinigende stoffen
  • Antilichaamtiters en geneesmiddelconcentraties

Het belangrijkste kenmerk: processen met herhaalde vermenigvuldiging genereren lognormale verdelingen, net zoals herhaalde optelling normale verdelingen genereert.

Formule en berekening

Geometrische standaardafwijking

GSD = exp(√[Σ(ln xᵢ - ln x̄ₘ)² / (n-1)])

Of eenvoudiger: neem de natuurlijke logaritme van alle waarden, bereken de gewone standaardafwijking en neem vervolgens de exponent.

1

Gegevens transformeren

Bereken de natuurlijke logaritme van elke waarde: yᵢ = ln(xᵢ)
2

Gemiddelde berekenen

Bepaal het rekenkundig gemiddelde van de logwaarden: ȳ = Σyᵢ/n
3

SD berekenen

Bepaal de standaardafwijking van de logwaarden: s = √[Σ(yᵢ-ȳ)²/(n-1)]
4

Terugtransformeren

Neem de exponent om GSD te krijgen: GSD = eˢ
Python
import numpy as np
from scipy import stats

def geometric_sd(data):
    """Calculate geometric standard deviation"""
    log_data = np.log(data)
    sd_log = np.std(log_data, ddof=1)
    return np.exp(sd_log)

def geometric_mean(data):
    """Calculate geometric mean"""
    return stats.gmean(data)

# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")

GSD-waarden interpreteren

Anders dan rekenkundige SD, die dezelfde eenheden heeft als uw gegevens, is GSD een multiplicatieve factor—een ratio. Een GSD van 2,0 betekent dat de gegevens doorgaans met een factor 2 variëren.

  • GSD = 1,0:Geen variatie (in de praktijk onmogelijk)
  • GSD ≈ 1,2:Lage variabiliteit (±20% typisch)
  • GSD ≈ 2,0:Matige variabiliteit (gegevens verdubbelen/halveren)
  • GSD ≈ 3,0:Hoge variabiliteit (bestrijkt een grooteorde)

Betrouwbaarheidsintervallen

Voor lognormale gegevens is het 95%-bereik bij benadering: Geometrisch gemiddelde ÷ GSD² tot Geometrisch gemiddelde × GSD². Voor GM=100 en GSD=2 is het bereik 25 tot 400.

Praktische toepassingen

Farmaceutische wetenschappen

Deeltjesgrootteverdeling (D50, GSD) · Variabiliteit in geneesmiddelconcentratie · Biobeschikbaarheidsstudies · Aerosolkarakterisering

Financiën en economie

Volatiliteit van beleggingsrendementen · Groeicijferanalyse · Inkomensverdelingsstudies · Modelvorming van activaprijzen

GSD vs. gewone SD

Het gebruik van rekenkundige SD op lognormale gegevens geeft misleidende resultaten:

Voorbeeld: virale lading

Waarden: 1.000; 5.000; 10.000; 50.000; 100.000 kopieën/mL Rekenkundig gemiddelde ± SD: 33.200 ± 41.424 Geometrisch gemiddelde × GSD: 10.000 × 4,5 → Bereik: 2.222 tot 45.000 De rekenkundige SD zou suggereren dat negatieve waarden mogelijk zijn—onmogelijk voor virale ladingen!

Controleer altijd de verdeling

Voordat u een spreidingsmaat berekent, visualiseer uw gegevens. Als deze rechtsscheef zijn met een lange staart, probeer dan een logtransformatie. Als dat de gegevens symmetrisch maakt, gebruik dan geometrische statistieken.