什么是加权标准差?
当数据点具有不同的重要性或代表不同的频率时,我们使用加权标准差。这在投资组合分析、带有抽样权重的调查数据以及 GPA 计算中很常见。
在标准(无权重)计算中,每个数据点对均值和标准差的贡献相同。但现实中往往需要赋予某些观测更大的影响力。100 万元的投资对组合波动性的影响应该大于 1000 元的仓位。来自较大人口群体的调查回答在估计总体参数时应该获得更大的权重。
何时使用加权标准差
加权标准差公式
首先,你需要计算加权均值:
加权均值
然后,计算加权标准差(总体版本):
加权标准差(总体)
其中 wᵢ 为权重,xᵢ 为数据值,x̄w 为加权均值。
对于样本数据,使用偏差校正公式(类似于贝塞尔校正):
加权标准差(样本)
样本校正更为复杂,因为“有效样本量”取决于权重的分布。当所有权重相等时,该公式退化为我们熟悉的 n-1 校正。
逐步计算过程
计算加权均值
计算加权偏差平方
求加权偏差平方和
除以权重总和
开平方根
实际应用
投资组合波动性:在金融领域,计算投资组合标准差必须考虑不同的资产配置比例。一个 50% 股票、50% 债券的组合,其波动性是用加权标准差计算的,权重为配置百分比。
调查分析:调查样本往往会过度或不足代表某些人口群体。加权调整可以确保结果反映真实的总体状况。加权标准差捕捉的是总体的变异性,而非仅仅是样本的变异性。
学业成绩:计算 GPA 时,不同课程有不同的学分。4 学分课程对 GPA 的影响应该大于 1 学分课程。加权计算自然地处理了这个问题。
荟萃分析:合并多个研究的结果时,每个研究按其精度(通常为方差倒数)加权。这使得样本量更大、更精确的研究获得更大的影响力。
计算示例
投资组合示例:考虑一个包含三只股票的组合:
- 股票 A:15% 收益率,50% 配置(权重 = 0.50)
- 股票 B:8% 收益率,30% 配置(权重 = 0.30)
- 股票 C:-2% 收益率,20% 配置(权重 = 0.20)
加权均值 = (0.50×15 + 0.30×8 + 0.20×(-2)) / 1.0 = 9.5%
加权标准差 = √[(0.50×(15-9.5)² + 0.30×(8-9.5)² + 0.20×(-2-9.5)²)] = √[(0.50×30.25 + 0.30×2.25 + 0.20×132.25)] = √[15.125 + 0.675 + 26.45] = √42.25 = 6.5%
注意影响