Коли використовувати геометричне стандартне відхилення
Геометричне стандартне відхилення (GSD) є відповідною мірою розкиду для даних, що мають мультиплікативну, а не адитивну природу — наприклад, темпи зростання, відношення, концентрації або будь-які вимірювання з логнормальним розподілом.
Розглянемо дохідність акцій: приріст у 10% з подальшим падінням на 10% не повертає до початкової точки (у вас залишиться 99% від початкової суми). Такі мультиплікативні співвідношення вимагають геометричної статистики замість арифметичної.
Ключова ознака
Розуміння логнормальних даних
Дані мають логнормальний розподіл, коли їх натуральний логарифм підпорядковується нормальному розподілу. Типові приклади:
- Ціни акцій та інвестиційна дохідність у часі
- Розподіли доходів та багатства
- Розміри частинок в аерозолях та фармпрепаратах
- Кількість бактеріальних колоній та вірусне навантаження
- Концентрації забруднювачів навколишнього середовища
- Титри антитіл та концентрації лікарських засобів
Ключова характеристика: процеси, що включають багаторазове множення, генерують логнормальні розподіли — так само, як багаторазове додавання генерує нормальні розподіли.
Формула та обчислення
Geometric Standard Deviation
Або простіше: візьміть натуральний логарифм усіх значень, обчисліть звичайне стандартне відхилення, потім піднесіть до степеня.
Перетворити дані
Обчислити середнє
Обчислити СВ
Зворотне перетворення
import numpy as np
from scipy import stats
def geometric_sd(data):
"""Calculate geometric standard deviation"""
log_data = np.log(data)
sd_log = np.std(log_data, ddof=1)
return np.exp(sd_log)
def geometric_mean(data):
"""Calculate geometric mean"""
return stats.gmean(data)
# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")Інтерпретація значень GSD
На відміну від арифметичного СВ, яке вимірюється в тих самих одиницях, що й дані, GSD є мультиплікативним фактором — відношенням. GSD рівне 2,0 означає, що дані зазвичай варіюють у 2 рази.
- GSD = 1,0:Відсутність варіації (неможливо на практиці)
- GSD ≈ 1,2:Низька варіабельність (±20% типово)
- GSD ≈ 2,0:Помірна варіабельність (дані подвоюються/зменшуються вдвічі)
- GSD ≈ 3,0:Висока варіабельність (охоплює порядок величини)
Довірчі інтервали
Застосування в реальному світі
Фармацевтичні науки
Фінанси та економіка
GSD проти звичайного СВ
Використання арифметичного СВ для логнормальних даних дає хибні результати:
Приклад: дані вірусного навантаження
Завжди перевіряйте розподіл