何時使用幾何標準差
幾何標準差 (GSD) 適用於乘法性質的資料——如成長率、比率、濃度,或任何對數常態分配的測量值。
以股票報酬為例:先漲 10% 再跌 10% 並不會回到原點(你會剩下原來的 99%)。這種乘法性質的關係需要使用幾何統計量,而非算術統計量。
核心洞察
認識對數常態資料
當資料取自然對數後遵循常態分配,就稱為對數常態分配。常見的例子包括:
- 股價和長期投資報酬率
- 收入和財富分配
- 氣溶膠和藥品中的粒徑分佈
- 細菌菌落計數和病毒量
- 環境污染物濃度
- 抗體效價和藥物濃度
關鍵特徵:涉及反覆相乘的過程會產生對數常態分配,就像反覆相加會產生常態分配一樣。
公式與計算
幾何標準差
更簡單的說法:對所有值取自然對數,計算一般的標準差,然後取指數。
資料轉換
計算平均數
計算標準差
反轉換
import numpy as np
from scipy import stats
def geometric_sd(data):
"""Calculate geometric standard deviation"""
log_data = np.log(data)
sd_log = np.std(log_data, ddof=1)
return np.exp(sd_log)
def geometric_mean(data):
"""Calculate geometric mean"""
return stats.gmean(data)
# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")解讀 GSD 數值
與算術標準差以原始資料的單位表示不同,GSD 是一個乘法因子——一個比率。GSD 為 2.0 表示資料通常以 2 倍的因子變動。
- GSD = 1.0:沒有變異(實務上不可能)
- GSD ≈ 1.2:低變異性(典型 ±20%)
- GSD ≈ 2.0:中等變異性(資料加倍/減半)
- GSD ≈ 3.0:高變異性(跨越一個數量級)
信賴區間
實際應用
藥學科學
金融與經濟
GSD vs 一般標準差
對對數常態資料使用算術標準差會產生誤導性的結果:
範例:病毒量資料
務必檢查分配