什么是合并标准差?
合并标准差将两个或多个组的方差估计合并为一个加权估计。它在假设方差齐性的双样本 t 检验中不可或缺。
其原理很直观:如果我们相信两组来自具有相同底层变异性的总体,就可以合并它们的数据以获得更好的变异性估计。更多的数据意味着更精确的估计。
可以这样理解:如果组 A 有 20 个观测值,组 B 有 30 个,而两组的真实方差相同,那么你现在有 50 个观测值来估计该方差,而不是分别用较小的样本单独估计。
何时合并
只有在有理由相信底层总体方差相等时才应合并标准差。在合并之前,可以使用 Levene 检验或 F 检验来验证这一假设。
合并标准差公式
对于两组数据,合并标准差为:
两组合并标准差
sp = √[((n₁-1)s₁² + (n₂-1)s₂²) / (n₁+n₂-2)]
其中 n₁ 和 n₂ 为样本量,s₁ 和 s₂ 为样本标准差。
对于 k 组数据(如在方差分析中),公式推广为:
多组合并标准差
sp = √[Σ(nᵢ-1)sᵢ² / Σ(nᵢ-1)]
注意公式在分子和分母中都使用了 (n-1) 项。这种加权确保较大的样本对合并估计贡献更多,这是合理的,因为较大样本提供的方差估计更可靠。
前提假设
合并标准差假设方差齐性——即所有组共享相同的总体方差。当以下情况出现时,这一假设尤为重要:
- 样本量不等(若较大组方差较小,问题尤其突出)
- 最大方差与最小方差之比超过 2-3 倍
- 样本量较小(大样本对方差不等更具稳健性)
方差不等时怎么办
如果方差不等,请使用韦尔奇 t 检验而非合并 t 检验,或使用各组各自的方差估计。韦尔奇 t 检验不假设方差相等,通常被推荐作为默认方法。
计算示例
场景:比较两个班级的考试成绩:
- 班级 A:n₁ = 25,均值 = 78,s₁ = 12
- 班级 B:n₂ = 30,均值 = 82,s₂ = 14
合并标准差计算过程:
sp = √[((25-1)(12)² + (30-1)(14)²) / (25+30-2)] sp = √[(24×144 + 29×196) / 53] sp = √[(3456 + 5684) / 53] sp = √[9140 / 53] = √172.45 = 13.13
合并标准差 13.13 介于两个单独标准差(12 和 14)之间,偏向样本量更大的一方。这个合并值将用于 t 检验公式或 Cohen's d 的计算。
统计学中的应用
- 独立样本 t 检验:合并标准差用于计算两组均值差的标准误差。
- Cohen's d 效应量:效应量使用合并标准差进行标准化:d = (M₁ - M₂) / sp
- 方差分析 (ANOVA):ANOVA 中的均方误差 (MSE) 本质上就是所有组的合并方差估计。
- 荟萃分析:合并多个研究时,合并估计有助于在不同背景下标准化效应。