什麼是合併標準差?
合併標準差將兩組或多組資料的變異數估計結合起來,得到一個單一的加權估計值。它在假設變異數相等的雙樣本 t 檢定中不可或缺。
概念很直觀:如果我們相信兩組資料來自具有相同內在變異性的母體,我們就可以合併它們的資料來獲得該共同變異性的更好估計。更多的資料意味著更精確的估計。
可以這樣想:如果你有 A 組 20 個觀測值和 B 組 30 個觀測值,且兩組有相同的真實變異數,你現在有 50 個觀測值來估計那個變異數,而不是從較小的樣本中分別估計。
何時合併
只有當你有理由相信各母體的變異數相等時,才應該合併標準差。合併之前,請先使用 Levene 檢定或 F 檢定來檢驗這個假設。
合併標準差公式
兩組資料的合併標準差為:
雙組合併標準差
sp = √[((n₁-1)s₁² + (n₂-1)s₂²) / (n₁+n₂-2)]
其中 n₁ 和 n₂ 是樣本數,s₁ 和 s₂ 是樣本標準差。
對於 k 組資料(如 ANOVA),公式推廣為:
多組合併標準差
sp = √[Σ(nᵢ-1)sᵢ² / Σ(nᵢ-1)]
注意公式中分子和分母都使用了 (n-1) 項。這種加權確保較大的樣本對合併估計值貢獻更多,因為較大的樣本提供更可靠的變異數估計。
基本假設
合併標準差假設變異數同質性——即所有組別共享相同的母體變異數。這個假設在以下情況最為重要:
- 樣本數不等(特別是當較大組別的變異數較小時問題更大)
- 最大與最小變異數的比值超過 2-3 倍
- 樣本數較小(大樣本對違反假設的情況更穩健)
當變異數不等時
如果變異數不等,請使用 Welch t 檢定而非合併 t 檢定,或使用各組自己的變異數估計。Welch 檢定不假設變異數相等,通常被建議作為預設方法。
計算範例
情境: 比較兩個班級的考試成績:
- A 班:n₁ = 25,平均數 = 78,s₁ = 12
- B 班:n₂ = 30,平均數 = 82,s₂ = 14
合併標準差計算:
sp = √[((25-1)(12)² + (30-1)(14)²) / (25+30-2)] sp = √[(24×144 + 29×196) / 53] sp = √[(3456 + 5684) / 53] sp = √[9140 / 53] = √172.45 = 13.13
合併標準差 13.13 落在兩組個別標準差(12 和 14)之間,且偏向樣本數較大的一方。這個合併值接下來會用於 t 檢定公式或 Cohen's d 的計算。
統計應用
- 獨立樣本 t 檢定: 合併標準差用於計算兩組平均數差異的標準誤差。
- Cohen's d 效果量: 效果量用合併標準差來標準化:d = (M₁ - M₂) / sp
- 變異數分析 (ANOVA): ANOVA 中的均方誤差 (MSE) 本質上就是所有組別的合併變異數估計。
- 統合分析: 合併多項研究的結果時,合併估計有助於在不同情境中標準化效果量。