何时使用几何标准差
几何标准差 (GSD) 是处理乘法性而非加法性数据的适当离散度指标——如增长率、比率、浓度或任何服从对数正态分布的测量值。
以股票收益为例:上涨 10% 之后下跌 10% 并不会回到原点(你只剩下本金的 99%)。这种乘法关系需要使用几何统计量而非算术统计量。
核心要点
理解对数正态数据
当数据的自然对数服从正态分布时,该数据为对数正态分布。常见的例子包括:
- 股票价格和长期投资收益
- 收入和财富分布
- 气溶胶和药物中的颗粒大小
- 细菌菌落数和病毒载量
- 环境污染物浓度
- 抗体滴度和药物浓度
关键特征是:涉及重复乘法的过程会产生对数正态分布,就像重复加法产生正态分布一样。
公式与计算
几何标准差
更简单地说:对所有值取自然对数,计算普通标准差,然后取指数。
数据变换
计算均值
计算标准差
反变换
import numpy as np
from scipy import stats
def geometric_sd(data):
"""Calculate geometric standard deviation"""
log_data = np.log(data)
sd_log = np.std(log_data, ddof=1)
return np.exp(sd_log)
def geometric_mean(data):
"""Calculate geometric mean"""
return stats.gmean(data)
# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")如何解读 GSD 值
与算术标准差使用原始数据单位不同,GSD 是一个乘法因子——一个比率。GSD 为 2.0 意味着数据通常变动一倍。
- GSD = 1.0:无变异(实际中不可能)
- GSD ≈ 1.2:变异性低(典型波动 ±20%)
- GSD ≈ 2.0:中等变异性(数据翻倍或减半)
- GSD ≈ 3.0:变异性高(跨越一个数量级)
置信区间
实际应用
制药科学
金融与经济
几何标准差与普通标准差对比
对对数正态数据使用算术标准差会产生误导性的结果:
示例:病毒载量数据
务必先检查分布