Kiedy stosować geometryczne odchylenie standardowe
Geometryczne odchylenie standardowe (GSD) jest odpowiednią miarą rozproszenia dla danych o charakterze multiplikatywnym, a nie addytywnym — takich jak stopy wzrostu, wskaźniki, stężenia czy dowolne pomiary o rozkładzie logarytmiczno-normalnym.
Rozważ stopy zwrotu z akcji: zysk 10% po którym następuje strata 10% nie przywraca stanu wyjściowego (zostaje 99% kwoty początkowej). Te multiplikatywne zależności wymagają statystyk geometrycznych zamiast arytmetycznych.
Kluczowy wniosek
Dane logarytmiczno-normalne
Dane mają rozkład logarytmiczno-normalny, gdy ich logarytm naturalny ma rozkład normalny. Typowe przykłady to:
- Ceny akcji i stopy zwrotu z inwestycji w czasie
- Rozkłady dochodów i majątku
- Wielkości cząstek w aerozolach i farmaceutykach
- Liczebność kolonii bakteryjnych i ładunki wirusowe
- Stężenia zanieczyszczeń środowiskowych
- Miana przeciwciał i stężenia leków
Kluczowa cecha: procesy obejmujące wielokrotne mnożenie generują rozkłady logarytmiczno-normalne, podobnie jak wielokrotne dodawanie generuje rozkłady normalne.
Wzór i obliczenia
Geometryczne odchylenie standardowe
Mówiąc prościej: oblicz logarytm naturalny wszystkich wartości, oblicz zwykłe odchylenie standardowe, a następnie zastosuj funkcję wykładniczą.
Transformuj dane
Oblicz średnią
Oblicz odchylenie
Transformuj z powrotem
import numpy as np
from scipy import stats
def geometric_sd(data):
"""Calculate geometric standard deviation"""
log_data = np.log(data)
sd_log = np.std(log_data, ddof=1)
return np.exp(sd_log)
def geometric_mean(data):
"""Calculate geometric mean"""
return stats.gmean(data)
# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")Interpretacja wartości GSD
W przeciwieństwie do arytmetycznego odchylenia wyrażonego w tych samych jednostkach co dane, GSD jest czynnikiem multiplikatywnym — proporcją. GSD równe 2,0 oznacza, że dane typowo zmieniają się dwukrotnie.
- GSD = 1,0:Brak zmienności (w praktyce niemożliwe)
- GSD ≈ 1,2:Niska zmienność (±20% typowe)
- GSD ≈ 2,0:Umiarkowana zmienność (dane podwajają się/zmniejszają o połowę)
- GSD ≈ 3,0:Wysoka zmienność (obejmuje rząd wielkości)
Przedziały ufności
Zastosowania w praktyce
Nauki farmaceutyczne
Finanse i ekonomia
GSD a zwykłe odchylenie standardowe
Użycie arytmetycznego odchylenia dla danych logarytmiczno-normalnych daje mylące wyniki:
Przykład: Dane ładunku wirusowego
Zawsze sprawdzaj rozkład