Mikor használjuk a geometriai szórást?
A geometriai szórás (GSD) az a megfelelő szóródási mutató, amikor az adatok multiplikatív, nem additív jellegűek – mint a növekedési ütemek, arányok, koncentrációk vagy bármely lognormális eloszlású mérés.
Gondolj a részvényhozamokra: egy 10%-os nyereség, amelyet egy 10%-os veszteség követ, nem hoz vissza a kiindulópontra (az eredeti összeg 99%-ánál tartasz). Ezek a multiplikatív összefüggések geometriai statisztikákat igényelnek az aritmetikai helyett.
Kulcsgondolat
A lognormális adatok megértése
Az adatok lognormális eloszlásúak, ha természetes logaritmusuk normális eloszlást követ. Gyakori példák:
- Részvényárak és befektetési hozamok időben
- Jövedelem- és vagyoneloszlások
- Részecskeméret aeroszolokban és gyógyszerekben
- Baktériumtelepek száma és vírusteher
- Környezeti szennyezőanyag-koncentrációk
- Antitest-titerek és gyógyszerkoncentrációk
A lényeges jellemző: az ismétlődő szorzást magukban foglaló folyamatok lognormális eloszlásokat generálnak, éppúgy, ahogyan az ismétlődő összeadás normális eloszlásokat hoz létre.
Képlet és számítás
Geometric Standard Deviation
Vagy egyszerűbben: vedd minden érték természetes logaritmusát, számítsd ki a hagyományos szórást, majd exponenciáld.
Adatok transzformálása
Átlag kiszámítása
Szórás kiszámítása
Visszatranszformálás
import numpy as np
from scipy import stats
def geometric_sd(data):
"""Calculate geometric standard deviation"""
log_data = np.log(data)
sd_log = np.std(log_data, ddof=1)
return np.exp(sd_log)
def geometric_mean(data):
"""Calculate geometric mean"""
return stats.gmean(data)
# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")GSD értékek értelmezése
Az aritmetikai szórástól eltérően, amely az adatokkal azonos mértékegységben van, a GSD egy szorzótényező – egy arány. A GSD = 2,0 azt jelenti, hogy az adatok jellemzően 2-szeres tényezővel változnak.
- GSD = 1,0:Nincs változékonyság (gyakorlatban lehetetlen)
- GSD ≈ 1,2:Alacsony változékonyság (±20% jellemző)
- GSD ≈ 2,0:Közepes változékonyság (az adat duplázódik/feleződik)
- GSD ≈ 3,0:Magas változékonyság (egy nagyságrendet fog át)
Konfidenciaintervallumok
Valós alkalmazások
Gyógyszertudományok
Pénzügy és közgazdaságtan
GSD vs. hagyományos szórás
Az aritmetikai szórás alkalmazása lognormális adatokra félrevezető eredményeket ad:
Példa: Vírusteher adatok
Mindig ellenőrizd az eloszlást