Σ
SDCalc
ZaawansowanyZaawansowane·12 min

Geometryczne odchylenie standardowe: kompletny przewodnik

Kompletny przewodnik po geometrycznym odchyleniu standardowym do analizy wskaźników, stóp wzrostu i danych o rozkładzie logarytmiczno-normalnym. Wzory, obliczenia, kod Python i zastosowania w finansach i naukach ścisłych.

Kiedy stosować geometryczne odchylenie standardowe

Geometryczne odchylenie standardowe (GSD) jest odpowiednią miarą rozproszenia dla danych o charakterze multiplikatywnym, a nie addytywnym — takich jak stopy wzrostu, wskaźniki, stężenia czy dowolne pomiary o rozkładzie logarytmiczno-normalnym.

Rozważ stopy zwrotu z akcji: zysk 10% po którym następuje strata 10% nie przywraca stanu wyjściowego (zostaje 99% kwoty początkowej). Te multiplikatywne zależności wymagają statystyk geometrycznych zamiast arytmetycznych.

Kluczowy wniosek

Jeśli Twoje dane obejmują kilka rzędów wielkości, są zawsze dodatnie i wyglądają na prawostronnie skośne na zwykłym wykresie, ale symetrycznie na skali logarytmicznej — masz do czynienia z danymi logarytmiczno-normalnymi, które wymagają statystyk geometrycznych.

Dane logarytmiczno-normalne

Dane mają rozkład logarytmiczno-normalny, gdy ich logarytm naturalny ma rozkład normalny. Typowe przykłady to:

  • Ceny akcji i stopy zwrotu z inwestycji w czasie
  • Rozkłady dochodów i majątku
  • Wielkości cząstek w aerozolach i farmaceutykach
  • Liczebność kolonii bakteryjnych i ładunki wirusowe
  • Stężenia zanieczyszczeń środowiskowych
  • Miana przeciwciał i stężenia leków

Kluczowa cecha: procesy obejmujące wielokrotne mnożenie generują rozkłady logarytmiczno-normalne, podobnie jak wielokrotne dodawanie generuje rozkłady normalne.

Wzór i obliczenia

Geometryczne odchylenie standardowe

GSD = exp(√[Σ(ln xᵢ - ln x̄ₘ)² / (n-1)])

Mówiąc prościej: oblicz logarytm naturalny wszystkich wartości, oblicz zwykłe odchylenie standardowe, a następnie zastosuj funkcję wykładniczą.

1

Transformuj dane

Oblicz logarytm naturalny każdej wartości: yᵢ = ln(xᵢ)
2

Oblicz średnią

Znajdź średnią arytmetyczną wartości logarytmicznych: ȳ = Σyᵢ/n
3

Oblicz odchylenie

Znajdź odchylenie standardowe wartości logarytmicznych: s = √[Σ(yᵢ-ȳ)²/(n-1)]
4

Transformuj z powrotem

Zastosuj funkcję wykładniczą: GSD = eˢ
Python
import numpy as np
from scipy import stats

def geometric_sd(data):
    """Calculate geometric standard deviation"""
    log_data = np.log(data)
    sd_log = np.std(log_data, ddof=1)
    return np.exp(sd_log)

def geometric_mean(data):
    """Calculate geometric mean"""
    return stats.gmean(data)

# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")

Interpretacja wartości GSD

W przeciwieństwie do arytmetycznego odchylenia wyrażonego w tych samych jednostkach co dane, GSD jest czynnikiem multiplikatywnym — proporcją. GSD równe 2,0 oznacza, że dane typowo zmieniają się dwukrotnie.

  • GSD = 1,0:Brak zmienności (w praktyce niemożliwe)
  • GSD ≈ 1,2:Niska zmienność (±20% typowe)
  • GSD ≈ 2,0:Umiarkowana zmienność (dane podwajają się/zmniejszają o połowę)
  • GSD ≈ 3,0:Wysoka zmienność (obejmuje rząd wielkości)

Przedziały ufności

Dla danych logarytmiczno-normalnych zakres 95% wynosi w przybliżeniu: średnia geometryczna ÷ GSD² do średnia geometryczna × GSD². Dla GM=100 i GSD=2 zakres wynosi od 25 do 400.

Zastosowania w praktyce

Nauki farmaceutyczne

Rozkład wielkości cząstek (D50, GSD) · Zmienność stężenia leku · Badania biodostępności · Charakterystyka aerozoli

Finanse i ekonomia

Zmienność stóp zwrotu z inwestycji · Analiza stóp wzrostu · Badania rozkładu dochodów · Modelowanie cen aktywów

GSD a zwykłe odchylenie standardowe

Użycie arytmetycznego odchylenia dla danych logarytmiczno-normalnych daje mylące wyniki:

Przykład: Dane ładunku wirusowego

Wartości: 1 000; 5 000; 10 000; 50 000; 100 000 kopii/ml Średnia arytmetyczna ± SD: 33 200 ± 41 424 Średnia geometryczna × GSD: 10 000 × 4,5 → Zakres: 2 222 do 45 000 Arytmetyczne odchylenie sugerowałoby możliwość wartości ujemnych — co jest niemożliwe dla ładunku wirusowego!

Zawsze sprawdzaj rozkład

Przed obliczaniem jakiejkolwiek miary rozproszenia zwizualizuj dane. Jeśli są prawostronnie skośne z długim ogonem, spróbuj transformacji logarytmicznej. Jeśli to sprawi, że staną się symetryczne, używaj statystyk geometrycznych.