什么是变异系数?
变异系数 (CV),又称相对标准差 (RSD),是一种标准化的离散度指标。它将标准差表示为均值的百分比,因此非常适合比较单位或量级不同的数据集之间的变异性。
数据集 A:身高
均值:170 cm,标准差:10 cm
CV = 5.9%
数据集 B:体重
均值:70 kg,标准差:10 kg
CV = 14.3%
标准差相同(都是 10),但 CV 揭示出体重的相对变异性更大
变异系数公式
变异系数
CV = (σ / μ) × 100%
其中 σ 是标准差,μ 是均值。对于样本数据,分别使用 s 和 x̄。
计算示例
数据集:12, 15, 14, 18, 11
- 均值 (x̄) = 14
- 标准差 (s) = 2.74
- CV = (2.74 / 14) × 100% = 19.6%
何时使用变异系数
使用 CV 的场景:
- 比较单位不同的数据集
- 比较均值差异很大的数据集
- 数据为比率尺度(有真正的零点)
- 评估实验室测量的一致性
- 金融分析(比较波动性)
使用标准差的场景:
- 数据集单位相同且均值接近
- 数据为等距尺度(如温度)
- 均值为零或接近零
- 需要绝对离散度信息
实际案例
实验室质量控制
在分析化学中,CV 低于 10% 通常被认为在精密度方面是可接受的。高精密度方法可以达到 CV < 5%。
| 股票 | 收益率 | 标准差 | CV |
|---|---|---|---|
| 股票 A | 8% | 4% | 50% |
| 股票 B | 12% | 9% | 75% |
股票 A 的 CV 更低 = 每单位风险获得的收益更高
变异系数的局限性
重要局限
- 均值为零时无定义:除以零使 CV 毫无意义
- 负值时有问题:可能产生误导性结果
- 不适用于等距尺度:摄氏/华氏温度的零点是任意的