什麼是標準差?
標準差是一種統計量,用來衡量資料集中數值的離散程度。簡單來說,它告訴你資料中的數字與平均值(平均數)之間的差距有多大。
舉個例子:假設你有一組學生的考試成績,標準差能告訴你大多數學生的分數是否接近(低標準差),還是分數差異很大(高標準差)。
Visual Comparison
Low SD (σ = 0.5)
Data clustered tightly around the mean
High SD (σ = 2)
Data spread widely from the mean
標準差為什麼重要?
標準差是最常用的統計量之一,它在幾乎所有領域的決策中都提供了關鍵的參考依據:
- 金融:衡量投資風險與投資組合波動性
- 製造業:品質管控與六標準差流程改善
- 科學研究:報告測量不確定性與實驗精密度
- 教育:分析考試成績分佈與成績曲線
- 醫療:臨床試驗與了解病患資料的變異性
標準差公式
標準差有兩種計算公式,取決於你處理的是樣本還是整個母體:
母體標準差
σ = √[Σ(xᵢ - μ)² / N]
樣本標準差
s = √[Σ(xᵢ - x̄)² / (n-1)]
符號說明
σ(sigma) = 母體標準差 · s = 樣本標準差 · Σ = 總和 · xᵢ = 每個資料點 · μ(mu) = 母體平均數 · x̄(x-bar) = 樣本平均數 · N = 母體數量 · n = 樣本數量
為什麼要除以 (n-1)?
在處理樣本時,我們除以 (n-1) 而不是 n。這稱為貝塞爾校正,能提供母體標準差的不偏估計值。
逐步計算教學
讓我們計算這組資料的樣本標準差:4, 8, 6, 5, 3
1
計算平均數
平均數 = (4 + 8 + 6 + 5 + 3) / 5 = 26 / 5 = 5.2
2
求出每個數值與平均數的偏差
4 - 5.2 = -1.2 · 8 - 5.2 = 2.8 · 6 - 5.2 = 0.8 · 5 - 5.2 = -0.2 · 3 - 5.2 = -2.2
3
將每個偏差平方
(-1.2)² = 1.44 · (2.8)² = 7.84 · (0.8)² = 0.64 · (-0.2)² = 0.04 · (-2.2)² = 4.84
4
加總所有偏差平方
1.44 + 7.84 + 0.64 + 0.04 + 4.84 = 14.8
5
除以 (n-1)
變異數 = 14.8 / (5-1) = 14.8 / 4 = 3.7
6
取平方根
標準差 = √3.7 = 1.924
小提示
使用我們的標準差計算機,可以即時計算任何資料集的標準差,並顯示逐步解題過程。
如何解讀結果
理解標準差數值的意義,對於做出正確決策至關重要:
| 標準差數值 | 解讀 | 範例 |
|---|---|---|
| 低標準差 | 資料點緊密聚集在平均數附近;一致性高 | 機器生產的零件,公差範圍很小 |
| 高標準差 | 資料點分佈範圍廣;變異性大 | 每日股價變化 |
| 零標準差 | 所有資料點完全相同 | 商店中固定價格的商品 |
經驗法則(68-95-99.7)
對於常態分配的資料:68% 的資料落在平均數 ±1 個標準差的範圍內 · 95% 落在 ±2 個標準差內 · 99.7% 落在 ±3 個標準差內
實際應用範例
範例 1:考試成績
一個 30 人的班級參加考試,平均成績為 75 分,標準差為 10 分。
解讀: 大多數學生(約 68%)的成績介於 65 到 85 分之間。如果某位學生得了 95 分,表示表現非常優異(高於平均數 2 個標準差);而 55 分則表示學習上需要加強(低於平均數 2 個標準差)。
範例 2:製造品質
一家工廠生產的螺栓直徑應為 10mm。測量 100 顆螺栓後,平均值為 10.02mm,標準差為 0.05mm。
解讀: 製程控制良好。99.7% 的螺栓直徑在 9.87mm 至 10.17mm 之間(±3σ)。如果規格要求為 10mm ± 0.2mm,這個製程完全符合品質標準。
常見錯誤
使用錯誤的公式
當你手上只有樣本資料時,不要使用母體標準差公式(除以 N)。這會低估真實的變異程度。
忽略離群值
標準差對離群值非常敏感。一個極端值就能大幅膨脹標準差。對於含有離群值的資料集,可以考慮使用中位數絕對偏差(MAD)。
假設資料為常態分配
經驗法則(68-95-99.7)只適用於常態分配的資料。在套用這些百分比之前,請先確認你的資料分佈是否為常態。