引言
标准误差 (SE) 和标准差 (SD) 都是衡量离散程度的指标,但它们回答的是本质上不同的问题。混淆这两个概念是统计学中最常见的错误之一。
常见混淆
许多人在应该使用标准误差时使用了标准差,尤其是在报告样本均值的精度时。这可能导致关于统计显著性的错误结论。
核心区别
标准差
衡量单个数据点围绕均值的离散程度。
“各个数值的变异有多大?”
标准误差
衡量样本均值作为总体均值估计的精确程度。
“我们的样本均值有多准确?”
标准误差公式
均值的标准误差
SE = s / √n
其中 s 是样本标准差,n 是样本量。
计算示例
25 名学生的样本中,平均考试成绩 = 75,标准差 = 10
- 标准差 (s) = 10 分
- 样本量 (n) = 25
- 标准误差 = 10 / √25 = 10 / 5 = 2 分
解读:样本均值 75 的不确定性约为 ±2 分。
何时使用哪一个
- 使用标准差的场景:描述个体观测值的变异性、描述总体或样本的特征、设定正常范围(如临床参考范围)、质量控制(制造中的可接受变异)
- 使用标准误差的场景:报告样本统计量的精度、构建置信区间、比较各组之间的均值、假设检验
样本量的影响
一个关键区别:随着样本量的增加,标准差基本保持不变,但标准误差会减小。
| 样本量 (n) | 标准差 | 标准误差 = SD/√n |
|---|---|---|
| 25 | 10 | 2.00 |
| 100 | 10 | 1.00 |
| 400 | 10 | 0.50 |
| 10,000 | 10 | 0.10 |
核心要点
要将标准误差减半,需要将样本量扩大四倍。这就是为什么非常精确的估计需要大样本。