Σ
SDCalc
ExpertPokročilé·12 min

Geometrická směrodatná odchylka: Kompletní průvodce

Kompletní průvodce geometrickou směrodatnou odchylkou pro analýzu poměrů, temp růstu a logaritmicky normálně rozdělených dat. Vzorce, postup výpočtu, kód v Pythonu a aplikace ve financích a vědě.

Kdy použít geometrickou směrodatnou odchylku

Geometrická směrodatná odchylka (GSD) je vhodnou mírou rozptylu pro data, která mají multiplikativní charakter — jako jsou tempa růstu, poměry, koncentrace nebo jakákoli logaritmicky normálně rozdělená měření.

Zvažte výnosy akcií: zisk 10 % následovaný ztrátou 10 % vás nevrátí na výchozí hodnotu (zůstane vám 99 % originálu). Tyto multiplikativní vztahy vyžadují geometrické statistiky namísto aritmetických.

Klíčový poznatek

Pokud vaše data pokrývají několik řádů, jsou vždy kladná a vypadají pravostranně zešikmeně v běžném grafu, ale symetricky na logaritmické škále — pracujete s logaritmicky normálními daty, která vyžadují geometrické statistiky.

Pochopení logaritmicky normálních dat

Data mají logaritmicky normální rozdělení, pokud jejich přirozený logaritmus sleduje normální rozdělení. Běžné příklady zahrnují:

  • Ceny akcií a investiční výnosy v čase
  • Rozdělení příjmů a majetku
  • Velikosti částic v aerosolech a léčivech
  • Počty bakteriálních kolonií a virová zátěž
  • Koncentrace znečišťujících látek v životním prostředí
  • Titry protilátek a koncentrace léčiv

Klíčová vlastnost: procesy zahrnující opakované násobení generují logaritmicky normální rozdělení, stejně jako opakované sčítání generuje normální rozdělení.

Vzorec a výpočet

Geometric Standard Deviation

GSD = exp(√[Σ(ln xᵢ - ln x̄ₘ)² / (n-1)])

Nebo jednodušeji: vezměte přirozený logaritmus všech hodnot, vypočítejte běžnou směrodatnou odchylku a potom výsledek exponenciujte.

1

Transformace dat

Vypočítejte přirozený logaritmus každé hodnoty: yᵢ = ln(xᵢ)
2

Výpočet průměru

Najděte aritmetický průměr logaritmovaných hodnot: ȳ = Σyᵢ/n
3

Výpočet SO

Najděte směrodatnou odchylku logaritmovaných hodnot: s = √[Σ(yᵢ-ȳ)²/(n-1)]
4

Zpětná transformace

Exponenciujte pro získání GSD: GSD = eˢ
Python
import numpy as np
from scipy import stats

def geometric_sd(data):
    """Calculate geometric standard deviation"""
    log_data = np.log(data)
    sd_log = np.std(log_data, ddof=1)
    return np.exp(sd_log)

def geometric_mean(data):
    """Calculate geometric mean"""
    return stats.gmean(data)

# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")

Interpretace hodnot GSD

Na rozdíl od aritmetické SO, která je ve stejných jednotkách jako vaše data, je GSD multiplikativní faktor — poměr. GSD = 2,0 znamená, že data se typicky liší faktorem 2.

  • GSD = 1,0:Žádná variabilita (v praxi nemožné)
  • GSD ≈ 1,2:Nízká variabilita (typicky ±20 %)
  • GSD ≈ 2,0:Střední variabilita (data se zdvojnásobují/poloviční)
  • GSD ≈ 3,0:Vysoká variabilita (rozsah pokrývá celý řád)

Intervaly spolehlivosti

Pro logaritmicky normální data je přibližný 95% rozsah: Geometrický průměr ÷ GSD² až Geometrický průměr × GSD². Pro GM=100 a GSD=2 je rozsah 25 až 400.

Aplikace v praxi

Farmaceutické vědy

Distribuce velikosti částic (D50, GSD) · Variabilita koncentrace léčiv · Studie biologické dostupnosti · Charakterizace aerosolů

Finance a ekonomika

Volatilita investičních výnosů · Analýza temp růstu · Studie rozdělení příjmů · Modelování cen aktiv

GSD vs. běžná SO

Použití aritmetické SO na logaritmicky normální data dává zavádějící výsledky:

Příklad: Data o virové zátěži

Hodnoty: 1 000; 5 000; 10 000; 50 000; 100 000 kopií/mL Aritmetický průměr ± SO: 33 200 ± 41 424 Geometrický průměr × GSD: 10 000 × 4,5 → Rozsah: 2 222 až 45 000 Aritmetická SO by naznačovala, že jsou možné záporné hodnoty — to je u virové zátěže nemožné!

Vždy ověřte rozdělení

Před výpočtem jakékoli míry rozptylu svá data vizualizujte. Pokud jsou pravostranně zešikmená s dlouhým chvostem, vyzkoušejte logaritmickou transformaci. Pokud se data po transformaci stanou symetrickými, použijte geometrické statistiky.