Σ
SDCalc
ПродвинутыйПродвинутый уровень·12 min

Геометрическое стандартное отклонение: полное руководство

Полное руководство по геометрическому стандартному отклонению для анализа соотношений, темпов роста и логнормально распределённых данных. Формулы, расчёты, код на Python и применение в финансах и науке.

Когда использовать геометрическое стандартное отклонение

Геометрическое стандартное отклонение (GSD) — это подходящая мера разброса для данных, которые носят мультипликативный, а не аддитивный характер — например, темпы роста, соотношения, концентрации или любые логнормально распределённые измерения.

Рассмотрим доходность акций: рост на 10% с последующим падением на 10% не возвращает к начальному значению (останется 99% от исходного). Такие мультипликативные взаимосвязи требуют геометрической, а не арифметической статистики.

Ключевой признак

Если ваши данные охватывают несколько порядков величины, всегда положительны и выглядят правосторонне-асимметричными на обычном графике, но симметричными на логарифмическом — вы имеете дело с логнормальными данными, для которых нужна геометрическая статистика.

Логнормальные данные

Данные имеют логнормальное распределение, когда их натуральный логарифм следует нормальному распределению. Типичные примеры:

  • Цены акций и инвестиционная доходность
  • Распределение доходов и богатства
  • Размеры частиц в аэрозолях и фармпрепаратах
  • Число бактериальных колоний и вирусная нагрузка
  • Концентрации загрязнителей окружающей среды
  • Титры антител и концентрации лекарственных препаратов

Ключевая характеристика: процессы, включающие многократное умножение, порождают логнормальные распределения, подобно тому как многократное сложение порождает нормальные.

Формула и расчёт

Геометрическое стандартное отклонение

GSD = exp(√[Σ(ln xᵢ - ln x̄ₘ)² / (n-1)])

Проще говоря: возьмите натуральный логарифм всех значений, рассчитайте обычное стандартное отклонение, затем возведите e в эту степень.

1

Преобразуйте данные

Вычислите натуральный логарифм каждого значения: yᵢ = ln(xᵢ)
2

Рассчитайте среднее

Найдите арифметическое среднее логарифмов: ȳ = Σyᵢ/n
3

Рассчитайте СО

Найдите стандартное отклонение логарифмов: s = √[Σ(yᵢ-ȳ)²/(n-1)]
4

Обратное преобразование

Вычислите GSD = eˢ
Python
import numpy as np
from scipy import stats

def geometric_sd(data):
    """Calculate geometric standard deviation"""
    log_data = np.log(data)
    sd_log = np.std(log_data, ddof=1)
    return np.exp(sd_log)

def geometric_mean(data):
    """Calculate geometric mean"""
    return stats.gmean(data)

# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")

Интерпретация значений GSD

В отличие от арифметического СО, которое выражается в тех же единицах, что и данные, GSD является мультипликативным фактором — отношением. GSD = 2,0 означает, что данные обычно варьируются в 2 раза.

  • GSD = 1,0:Нет вариации (на практике невозможно)
  • GSD ≈ 1,2:Низкая вариабельность (±20% типично)
  • GSD ≈ 2,0:Умеренная вариабельность (данные удваиваются/уменьшаются вдвое)
  • GSD ≈ 3,0:Высокая вариабельность (охватывает порядок величины)

Доверительные интервалы

Для логнормальных данных 95% диапазон приблизительно: Геометрическое среднее ÷ GSD² до Геометрическое среднее × GSD². При GM=100 и GSD=2 диапазон составляет от 25 до 400.

Практическое применение

Фармацевтические науки

Распределение размеров частиц (D50, GSD) · Вариабельность концентрации лекарств · Исследования биодоступности · Характеристика аэрозолей

Финансы и экономика

Волатильность инвестиционной доходности · Анализ темпов роста · Исследования распределения доходов · Моделирование цен активов

GSD и обычное СО

Использование арифметического СО для логнормальных данных даёт вводящие в заблуждение результаты:

Пример: Вирусная нагрузка

Значения: 1 000; 5 000; 10 000; 50 000; 100 000 копий/мл Арифметическое среднее ± СО: 33 200 ± 41 424 Геометрическое среднее × GSD: 10 000 × 4,5 → Диапазон: 2 222 – 45 000 Арифметическое СО допускает отрицательные значения — невозможно для вирусной нагрузки!

Всегда проверяйте распределение

Прежде чем рассчитывать любую меру разброса, визуализируйте данные. Если они правосторонне-асимметричны с длинным хвостом, попробуйте логарифмическое преобразование. Если после него распределение станет симметричным, используйте геометрическую статистику.