Σ
SDCalc
ПросунутийПросунутий·12 min

Геометричне стандартне відхилення: повний посібник

Повний посібник із геометричного стандартного відхилення для аналізу відношень, темпів зростання та логнормально розподілених даних. Формули, кроки обчислення, код на Python та застосування у фінансах і науці.

Коли використовувати геометричне стандартне відхилення

Геометричне стандартне відхилення (GSD) є відповідною мірою розкиду для даних, що мають мультиплікативну, а не адитивну природу — наприклад, темпи зростання, відношення, концентрації або будь-які вимірювання з логнормальним розподілом.

Розглянемо дохідність акцій: приріст у 10% з подальшим падінням на 10% не повертає до початкової точки (у вас залишиться 99% від початкової суми). Такі мультиплікативні співвідношення вимагають геометричної статистики замість арифметичної.

Ключова ознака

Якщо ваші дані охоплюють кілька порядків величини, завжди додатні й виглядають правоасиметричними на звичайному графіку, але симетричними на логарифмічній шкалі — ви маєте справу з логнормальними даними, для яких потрібна геометрична статистика.

Розуміння логнормальних даних

Дані мають логнормальний розподіл, коли їх натуральний логарифм підпорядковується нормальному розподілу. Типові приклади:

  • Ціни акцій та інвестиційна дохідність у часі
  • Розподіли доходів та багатства
  • Розміри частинок в аерозолях та фармпрепаратах
  • Кількість бактеріальних колоній та вірусне навантаження
  • Концентрації забруднювачів навколишнього середовища
  • Титри антитіл та концентрації лікарських засобів

Ключова характеристика: процеси, що включають багаторазове множення, генерують логнормальні розподіли — так само, як багаторазове додавання генерує нормальні розподіли.

Формула та обчислення

Geometric Standard Deviation

GSD = exp(√[Σ(ln xᵢ - ln x̄ₘ)² / (n-1)])

Або простіше: візьміть натуральний логарифм усіх значень, обчисліть звичайне стандартне відхилення, потім піднесіть до степеня.

1

Перетворити дані

Обчисліть натуральний логарифм кожного значення: yᵢ = ln(xᵢ)
2

Обчислити середнє

Знайдіть арифметичне середнє логарифмічних значень: ȳ = Σyᵢ/n
3

Обчислити СВ

Знайдіть стандартне відхилення логарифмічних значень: s = √[Σ(yᵢ-ȳ)²/(n-1)]
4

Зворотне перетворення

Піднесіть до степеня, щоб отримати GSD: GSD = eˢ
Python
import numpy as np
from scipy import stats

def geometric_sd(data):
    """Calculate geometric standard deviation"""
    log_data = np.log(data)
    sd_log = np.std(log_data, ddof=1)
    return np.exp(sd_log)

def geometric_mean(data):
    """Calculate geometric mean"""
    return stats.gmean(data)

# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")

Інтерпретація значень GSD

На відміну від арифметичного СВ, яке вимірюється в тих самих одиницях, що й дані, GSD є мультиплікативним фактором — відношенням. GSD рівне 2,0 означає, що дані зазвичай варіюють у 2 рази.

  • GSD = 1,0:Відсутність варіації (неможливо на практиці)
  • GSD ≈ 1,2:Низька варіабельність (±20% типово)
  • GSD ≈ 2,0:Помірна варіабельність (дані подвоюються/зменшуються вдвічі)
  • GSD ≈ 3,0:Висока варіабельність (охоплює порядок величини)

Довірчі інтервали

Для логнормальних даних 95% діапазон приблизно дорівнює: Геометричне середнє ÷ GSD² до Геометричне середнє × GSD². Для GM=100 та GSD=2 діапазон становить від 25 до 400.

Застосування в реальному світі

Фармацевтичні науки

Розподіл розмірів частинок (D50, GSD) · Варіабельність концентрації ліків · Дослідження біодоступності · Характеристика аерозолів

Фінанси та економіка

Волатильність інвестиційної дохідності · Аналіз темпів зростання · Дослідження розподілу доходів · Моделювання цін активів

GSD проти звичайного СВ

Використання арифметичного СВ для логнормальних даних дає хибні результати:

Приклад: дані вірусного навантаження

Значення: 1 000; 5 000; 10 000; 50 000; 100 000 копій/мл Арифметичне середнє ± СВ: 33 200 ± 41 424 Геометричне середнє × GSD: 10 000 × 4,5 → Діапазон: 2 222 до 45 000 Арифметичне СВ передбачає можливість від’ємних значень — що неможливо для вірусного навантаження!

Завжди перевіряйте розподіл

Перш ніж обчислювати будь-яку міру розкиду, візуалізуйте дані. Якщо вони правоасиметричні з довгим хвостом, спробуйте логарифмічне перетворення. Якщо воно робить дані симетричними, використовуйте геометричну статистику.