Когда использовать геометрическое стандартное отклонение
Геометрическое стандартное отклонение (GSD) — это подходящая мера разброса для данных, которые носят мультипликативный, а не аддитивный характер — например, темпы роста, соотношения, концентрации или любые логнормально распределённые измерения.
Рассмотрим доходность акций: рост на 10% с последующим падением на 10% не возвращает к начальному значению (останется 99% от исходного). Такие мультипликативные взаимосвязи требуют геометрической, а не арифметической статистики.
Ключевой признак
Логнормальные данные
Данные имеют логнормальное распределение, когда их натуральный логарифм следует нормальному распределению. Типичные примеры:
- Цены акций и инвестиционная доходность
- Распределение доходов и богатства
- Размеры частиц в аэрозолях и фармпрепаратах
- Число бактериальных колоний и вирусная нагрузка
- Концентрации загрязнителей окружающей среды
- Титры антител и концентрации лекарственных препаратов
Ключевая характеристика: процессы, включающие многократное умножение, порождают логнормальные распределения, подобно тому как многократное сложение порождает нормальные.
Формула и расчёт
Геометрическое стандартное отклонение
Проще говоря: возьмите натуральный логарифм всех значений, рассчитайте обычное стандартное отклонение, затем возведите e в эту степень.
Преобразуйте данные
Рассчитайте среднее
Рассчитайте СО
Обратное преобразование
import numpy as np
from scipy import stats
def geometric_sd(data):
"""Calculate geometric standard deviation"""
log_data = np.log(data)
sd_log = np.std(log_data, ddof=1)
return np.exp(sd_log)
def geometric_mean(data):
"""Calculate geometric mean"""
return stats.gmean(data)
# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")Интерпретация значений GSD
В отличие от арифметического СО, которое выражается в тех же единицах, что и данные, GSD является мультипликативным фактором — отношением. GSD = 2,0 означает, что данные обычно варьируются в 2 раза.
- GSD = 1,0:Нет вариации (на практике невозможно)
- GSD ≈ 1,2:Низкая вариабельность (±20% типично)
- GSD ≈ 2,0:Умеренная вариабельность (данные удваиваются/уменьшаются вдвое)
- GSD ≈ 3,0:Высокая вариабельность (охватывает порядок величины)
Доверительные интервалы
Практическое применение
Фармацевтические науки
Финансы и экономика
GSD и обычное СО
Использование арифметического СО для логнормальных данных даёт вводящие в заблуждение результаты:
Пример: Вирусная нагрузка
Всегда проверяйте распределение