Σ
SDCalc
HaladóHaladó·12 min

Geometriai szórás: teljes útmutató

Teljes útmutató a geometriai szóráshoz arányok, növekedési ütemek és lognormális eloszlású adatok elemzéséhez. Képletek, számítási lépések, Python kód, és pénzügyi-tudományos alkalmazások.

Mikor használjuk a geometriai szórást?

A geometriai szórás (GSD) az a megfelelő szóródási mutató, amikor az adatok multiplikatív, nem additív jellegűek – mint a növekedési ütemek, arányok, koncentrációk vagy bármely lognormális eloszlású mérés.

Gondolj a részvényhozamokra: egy 10%-os nyereség, amelyet egy 10%-os veszteség követ, nem hoz vissza a kiindulópontra (az eredeti összeg 99%-ánál tartasz). Ezek a multiplikatív összefüggések geometriai statisztikákat igényelnek az aritmetikai helyett.

Kulcsgondolat

Ha az adataid több nagyságrendet ölelnek fel, mindig pozitívak, és normálisan ábrázolva jobbra ferdék, de logaritmikus skálán szimmetrikusak – lognormális adatokkal van dolgod, amelyekhez geometriai statisztikák szükségesek.

A lognormális adatok megértése

Az adatok lognormális eloszlásúak, ha természetes logaritmusuk normális eloszlást követ. Gyakori példák:

  • Részvényárak és befektetési hozamok időben
  • Jövedelem- és vagyoneloszlások
  • Részecskeméret aeroszolokban és gyógyszerekben
  • Baktériumtelepek száma és vírusteher
  • Környezeti szennyezőanyag-koncentrációk
  • Antitest-titerek és gyógyszerkoncentrációk

A lényeges jellemző: az ismétlődő szorzást magukban foglaló folyamatok lognormális eloszlásokat generálnak, éppúgy, ahogyan az ismétlődő összeadás normális eloszlásokat hoz létre.

Képlet és számítás

Geometric Standard Deviation

GSD = exp(√[Σ(ln xᵢ - ln x̄ₘ)² / (n-1)])

Vagy egyszerűbben: vedd minden érték természetes logaritmusát, számítsd ki a hagyományos szórást, majd exponenciáld.

1

Adatok transzformálása

Számítsd ki minden érték természetes logaritmusát: yᵢ = ln(xᵢ)
2

Átlag kiszámítása

Számítsd ki a logaritmizált értékek számtani átlagát: ȳ = Σyᵢ/n
3

Szórás kiszámítása

Számítsd ki a logaritmizált értékek szórását: s = √[Σ(yᵢ-ȳ)²/(n-1)]
4

Visszatranszformálás

Exponenciáld a GSD megkapásához: GSD = eˢ
Python
import numpy as np
from scipy import stats

def geometric_sd(data):
    """Calculate geometric standard deviation"""
    log_data = np.log(data)
    sd_log = np.std(log_data, ddof=1)
    return np.exp(sd_log)

def geometric_mean(data):
    """Calculate geometric mean"""
    return stats.gmean(data)

# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")

GSD értékek értelmezése

Az aritmetikai szórástól eltérően, amely az adatokkal azonos mértékegységben van, a GSD egy szorzótényező – egy arány. A GSD = 2,0 azt jelenti, hogy az adatok jellemzően 2-szeres tényezővel változnak.

  • GSD = 1,0:Nincs változékonyság (gyakorlatban lehetetlen)
  • GSD ≈ 1,2:Alacsony változékonyság (±20% jellemző)
  • GSD ≈ 2,0:Közepes változékonyság (az adat duplázódik/feleződik)
  • GSD ≈ 3,0:Magas változékonyság (egy nagyságrendet fog át)

Konfidenciaintervallumok

Lognormális adatoknál a 95%-os tartomány közelítőleg: Geometriai átlag ÷ GSD² és Geometriai átlag × GSD² között van. GM=100 és GSD=2 esetén a tartomány 25-től 400-ig terjed.

Valós alkalmazások

Gyógyszertudományok

Részecskeméret-eloszlás (D50, GSD) · Gyógyszerkoncentráció változékonysága · Biohasznosulási vizsgálatok · Aeroszol jellemzés

Pénzügy és közgazdaságtan

Befektetési hozam volatilitása · Növekedési ütem elemzés · Jövedelmi eloszlás vizsgálatok · Eszközár-modellezés

GSD vs. hagyományos szórás

Az aritmetikai szórás alkalmazása lognormális adatokra félrevezető eredményeket ad:

Példa: Vírusteher adatok

Értékek: 1 000; 5 000; 10 000; 50 000; 100 000 kópia/mL Aritmetikai átlag ± szórás: 33 200 ± 41 424 Geometriai átlag × GSD: 10 000 × 4,5 → Tartomány: 2 222-től 45 000-ig Az aritmetikai szórás negatív értékek lehetőségét sugallná – ami vírusak esetén lehetetlen!

Mindig ellenőrizd az eloszlást

Mielőtt bármilyen szóródási mutatót kiszámítanál, vizualizáld az adataidat. Ha jobbra ferdék, hosszú farokkal, próbáld meg a logaritmikus transzformációt. Ha az szimmetrikussá teszi őket, használj geometriai statisztikákat.