Σ
SDCalc
GevorderdGeavanceerd·12 min

Geometrische standaardafwijking: volledige gids

Volledige gids over geometrische standaardafwijking voor het analyseren van ratio's, groeicijfers en lognormaal verdeelde gegevens. Inclusief formules, berekeningsstappen, Python-code en toepassingen in financiën en wetenschap.

Wanneer geometrische standaardafwijking gebruiken

Geometrische standaardafwijking (GSD) is de geschikte spreidingsmaat voor gegevens die multiplicatief zijn in plaats van additief—zoals groeicijfers, ratio's, concentraties of lognormaal verdeelde metingen.

Neem beursrendementen: een winst van 10% gevolgd door een verlies van 10% brengt u niet terug op break-even (u zou 99% van het origineel overhouden). Deze multiplicatieve relaties vereisen geometrische statistieken in plaats van rekenkundige.

Kernidee

Als uw gegevens meerdere grootteordes bestrijken, altijd positief zijn en rechtsscheef lijken bij normale weergave maar symmetrisch bij weergave op logaritmische schaal—dan heeft u te maken met lognormale gegevens die geometrische statistieken nodig hebben.

Lognormale gegevens begrijpen

Gegevens zijn lognormaal verdeeld wanneer hun natuurlijke logaritme een normale verdeling volgt. Veelvoorkomende voorbeelden zijn:

  • Aandelenkoersen en beleggingsrendementen door de tijd
  • Inkomens- en vermogensverdelingen
  • Deeltjesgroottes in aerosolen en farmaceutica
  • Bacteriekolonies en virale ladingen
  • Concentraties van milieuverontreinigende stoffen
  • Antilichaamtiters en geneesmiddelconcentraties

Het belangrijkste kenmerk: processen met herhaalde vermenigvuldiging genereren lognormale verdelingen, net zoals herhaalde optelling normale verdelingen genereert.

Formule en berekening

Geometrische standaardafwijking

GSD = exp(√[Σ(ln xᵢ - ln x̄ₘ)² / (n-1)])

Of eenvoudiger: neem de natuurlijke logaritme van alle waarden, bereken de gewone standaardafwijking en neem vervolgens de exponent.

1

Gegevens transformeren

Bereken de natuurlijke logaritme van elke waarde: yᵢ = ln(xᵢ)
2

Gemiddelde berekenen

Bepaal het rekenkundig gemiddelde van de logwaarden: ȳ = Σyᵢ/n
3

SD berekenen

Bepaal de standaardafwijking van de logwaarden: s = √[Σ(yᵢ-ȳ)²/(n-1)]
4

Terugtransformeren

Neem de exponent om GSD te krijgen: GSD = eˢ
Python
import numpy as np
from scipy import stats

def geometric_sd(data):
    """Calculate geometric standard deviation"""
    log_data = np.log(data)
    sd_log = np.std(log_data, ddof=1)
    return np.exp(sd_log)

def geometric_mean(data):
    """Calculate geometric mean"""
    return stats.gmean(data)

# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")

GSD-waarden interpreteren

Anders dan rekenkundige SD, die dezelfde eenheden heeft als uw gegevens, is GSD een multiplicatieve factor—een ratio. Een GSD van 2,0 betekent dat de gegevens doorgaans met een factor 2 variëren.

  • GSD = 1,0:Geen variatie (in de praktijk onmogelijk)
  • GSD ≈ 1,2:Lage variabiliteit (±20% typisch)
  • GSD ≈ 2,0:Matige variabiliteit (gegevens verdubbelen/halveren)
  • GSD ≈ 3,0:Hoge variabiliteit (bestrijkt een grooteorde)

Betrouwbaarheidsintervallen

Voor lognormale gegevens is het 95%-bereik bij benadering: Geometrisch gemiddelde ÷ GSD² tot Geometrisch gemiddelde × GSD². Voor GM=100 en GSD=2 is het bereik 25 tot 400.

Praktische toepassingen

Farmaceutische wetenschappen

Deeltjesgrootteverdeling (D50, GSD) · Variabiliteit in geneesmiddelconcentratie · Biobeschikbaarheidsstudies · Aerosolkarakterisering

Financiën en economie

Volatiliteit van beleggingsrendementen · Groeicijferanalyse · Inkomensverdelingsstudies · Modelvorming van activaprijzen

GSD vs. gewone SD

Het gebruik van rekenkundige SD op lognormale gegevens geeft misleidende resultaten:

Voorbeeld: virale lading

Waarden: 1.000; 5.000; 10.000; 50.000; 100.000 kopieën/mL Rekenkundig gemiddelde ± SD: 33.200 ± 41.424 Geometrisch gemiddelde × GSD: 10.000 × 4,5 → Bereik: 2.222 tot 45.000 De rekenkundige SD zou suggereren dat negatieve waarden mogelijk zijn—onmogelijk voor virale ladingen!

Controleer altijd de verdeling

Voordat u een spreidingsmaat berekent, visualiseer uw gegevens. Als deze rechtsscheef zijn met een lange staart, probeer dan een logtransformatie. Als dat de gegevens symmetrisch maakt, gebruik dan geometrische statistieken.

Further Reading

How to Read This Article

A statistics tutorial is a practical interpretation guide, not just a formula dump. It refers to the assumptions, notation, and reporting language that analysts need when they explain a result to a teacher, manager, client, or reviewer. The article body covers the specific topic, while the sections below create a common interpretation frame that readers can reuse across related metrics.

Reading goalWhat to focus onCommon mistake
DefinitionWhat the metric is and what quantity it summarizesTreating the formula as self-explanatory
Formula choiceSample versus population assumptions and notationUsing n when n-1 is required or vice versa
InterpretationWhether the result indicates concentration, spread, or riskCalling a large value good or bad without context

Frequently Asked Questions

How should I interpret a high standard deviation?

A high standard deviation means the observations are spread farther from the mean on average. Whether that spread is acceptable depends on the context: wide dispersion might signal risk in finance, instability in manufacturing, or genuine natural variation in scientific data.

Why do some articles mention n while others mention n-1?

The denominator reflects the difference between population and sample formulas. Population variance and population standard deviation use N because the full dataset is known. Sample variance and sample standard deviation often use n-1 because Bessel’s correction reduces bias when estimating population spread from a sample.

What is a statistical interpretation guide?

A statistical interpretation guide is a page that moves beyond arithmetic and explains meaning. It tells you what a metric is, when the formula applies, and how to describe the result in plain English without overstating certainty.

Can I cite this article in a report?

You should cite the underlying authoritative reference for formal work whenever possible. This page is best used as an explanatory bridge that helps you understand the concept before quoting the original standard or handbook.

Why include direct citations on every article page?

Direct citations give readers a route to verify the definition, notation, and assumptions. That improves trust and reduces the chance that a simplified explanation is mistaken for the entire technical standard.

Authoritative References

These sources define the concepts referenced most often across our articles. Bessel's correction is a sample adjustment, variance is a squared measure of spread, and standard deviation is the square root of variance expressed in the same units as the data.