Kdy použít geometrickou směrodatnou odchylku
Geometrická směrodatná odchylka (GSD) je vhodnou mírou rozptylu pro data, která mají multiplikativní charakter — jako jsou tempa růstu, poměry, koncentrace nebo jakákoli logaritmicky normálně rozdělená měření.
Zvažte výnosy akcií: zisk 10 % následovaný ztrátou 10 % vás nevrátí na výchozí hodnotu (zůstane vám 99 % originálu). Tyto multiplikativní vztahy vyžadují geometrické statistiky namísto aritmetických.
Klíčový poznatek
Pochopení logaritmicky normálních dat
Data mají logaritmicky normální rozdělení, pokud jejich přirozený logaritmus sleduje normální rozdělení. Běžné příklady zahrnují:
- Ceny akcií a investiční výnosy v čase
- Rozdělení příjmů a majetku
- Velikosti částic v aerosolech a léčivech
- Počty bakteriálních kolonií a virová zátěž
- Koncentrace znečišťujících látek v životním prostředí
- Titry protilátek a koncentrace léčiv
Klíčová vlastnost: procesy zahrnující opakované násobení generují logaritmicky normální rozdělení, stejně jako opakované sčítání generuje normální rozdělení.
Vzorec a výpočet
Geometric Standard Deviation
Nebo jednodušeji: vezměte přirozený logaritmus všech hodnot, vypočítejte běžnou směrodatnou odchylku a potom výsledek exponenciujte.
Transformace dat
Výpočet průměru
Výpočet SO
Zpětná transformace
import numpy as np
from scipy import stats
def geometric_sd(data):
"""Calculate geometric standard deviation"""
log_data = np.log(data)
sd_log = np.std(log_data, ddof=1)
return np.exp(sd_log)
def geometric_mean(data):
"""Calculate geometric mean"""
return stats.gmean(data)
# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")Interpretace hodnot GSD
Na rozdíl od aritmetické SO, která je ve stejných jednotkách jako vaše data, je GSD multiplikativní faktor — poměr. GSD = 2,0 znamená, že data se typicky liší faktorem 2.
- GSD = 1,0:Žádná variabilita (v praxi nemožné)
- GSD ≈ 1,2:Nízká variabilita (typicky ±20 %)
- GSD ≈ 2,0:Střední variabilita (data se zdvojnásobují/poloviční)
- GSD ≈ 3,0:Vysoká variabilita (rozsah pokrývá celý řád)
Intervaly spolehlivosti
Aplikace v praxi
Farmaceutické vědy
Finance a ekonomika
GSD vs. běžná SO
Použití aritmetické SO na logaritmicky normální data dává zavádějící výsledky:
Příklad: Data o virové zátěži
Vždy ověřte rozdělení