概述
統計學中最常見的問題之一是:“到底該除以 n 還是 n-1?”答案取決於你手上的資料是整個母體,還是只是一個樣本。
母體 (N)
樣本 (n-1)
母體標準差 (σ)
母體標準差用於你擁有分析對象中每一個個體的測量值時。在實務上,這種情況相對少見。
真正的母體範例:
- 一家小公司全部 50 名員工
- 某個特定班級全部 30 名學生
- 某個已結算會計年度的所有交易紀錄
- 一個國家的完整人口普查資料
樣本標準差 (s)
樣本標準差用於你只有較大母體的一個子集資料時。這在實際分析中是更常見的情境。
樣本範例:
- 調查 1,000 位選民來預測選舉結果
- 從 10,000 件生產批次中抽測 50 件產品
- 在臨床研究中測量 200 位病患的血壓
- 分析 5 年的股價資料來預測未來波動性
貝塞爾校正詳解
貝塞爾校正是我們在計算樣本標準差時,用 (n-1) 而非 n 作為除數的原因。這個方法以德國數學家弗里德里希·貝塞爾命名,它能產生母體變異數的不偏估計值。
為什麼 (n-1) 有效
數學上的直觀理解
樣本資料點傾向於比母體平均數更靠近樣本平均數。這使得偏差平方和系統性地偏小。
除以 (n-1) 而非 n 會稍微放大結果,補償這種低估,從而產生不偏估計值。
何時使用哪一種
| 情境 | 使用 | 除以 |
|---|---|---|
| 你擁有所有存在的資料點 | 母體標準差 (σ) | N |
| 你只是要描述手上的資料 | 母體標準差 (σ) | N |
| 你要為更大的母體做估計 | 樣本標準差 (s) | n-1 |
| 你會用標準差來做推論統計 | 樣本標準差 (s) | n-1 |
經驗法則