Σ
SDCalc
入門基礎知識·12 min

標準差完整指南

透過全面的指南掌握標準差。學習公式、逐步計算、實際應用範例,以及何時該使用樣本標準差與母體標準差。

什麼是標準差?

標準差是一種統計量,用來衡量資料集中數值的離散程度。簡單來說,它告訴你資料中的數字與平均值(平均數)之間的差距有多大。

舉個例子:假設你有一組學生的考試成績,標準差能告訴你大多數學生的分數是否接近(低標準差),還是分數差異很大(高標準差)。

Visual Comparison

Low SD (σ = 0.5)

Data clustered tightly around the mean

High SD (σ = 2)

Data spread widely from the mean

標準差為什麼重要?

標準差是最常用的統計量之一,它在幾乎所有領域的決策中都提供了關鍵的參考依據:

  • 金融:衡量投資風險與投資組合波動性
  • 製造業:品質管控與六標準差流程改善
  • 科學研究:報告測量不確定性與實驗精密度
  • 教育:分析考試成績分佈與成績曲線
  • 醫療:臨床試驗與了解病患資料的變異性

標準差公式

標準差有兩種計算公式,取決於你處理的是樣本還是整個母體:

母體標準差

σ = √[Σ(xᵢ - μ)² / N]

樣本標準差

s = √[Σ(xᵢ - x̄)² / (n-1)]

符號說明

σ(sigma) = 母體標準差 · s = 樣本標準差 · Σ = 總和 · xᵢ = 每個資料點 · μ(mu) = 母體平均數 · x̄(x-bar) = 樣本平均數 · N = 母體數量 · n = 樣本數量

為什麼要除以 (n-1)?

在處理樣本時,我們除以 (n-1) 而不是 n。這稱為貝塞爾校正,能提供母體標準差的不偏估計值。

逐步計算教學

讓我們計算這組資料的樣本標準差:4, 8, 6, 5, 3

1

計算平均數

平均數 = (4 + 8 + 6 + 5 + 3) / 5 = 26 / 5 = 5.2
2

求出每個數值與平均數的偏差

4 - 5.2 = -1.2 · 8 - 5.2 = 2.8 · 6 - 5.2 = 0.8 · 5 - 5.2 = -0.2 · 3 - 5.2 = -2.2
3

將每個偏差平方

(-1.2)² = 1.44 · (2.8)² = 7.84 · (0.8)² = 0.64 · (-0.2)² = 0.04 · (-2.2)² = 4.84
4

加總所有偏差平方

1.44 + 7.84 + 0.64 + 0.04 + 4.84 = 14.8
5

除以 (n-1)

變異數 = 14.8 / (5-1) = 14.8 / 4 = 3.7
6

取平方根

標準差 = √3.7 = 1.924

小提示

使用我們的標準差計算機,可以即時計算任何資料集的標準差,並顯示逐步解題過程。

如何解讀結果

理解標準差數值的意義,對於做出正確決策至關重要:

標準差數值解讀範例
低標準差資料點緊密聚集在平均數附近;一致性高機器生產的零件,公差範圍很小
高標準差資料點分佈範圍廣;變異性大每日股價變化
零標準差所有資料點完全相同商店中固定價格的商品

經驗法則(68-95-99.7)

對於常態分配的資料:68% 的資料落在平均數 ±1 個標準差的範圍內 · 95% 落在 ±2 個標準差內 · 99.7% 落在 ±3 個標準差內

實際應用範例

範例 1:考試成績

一個 30 人的班級參加考試,平均成績為 75 分,標準差為 10 分。 解讀: 大多數學生(約 68%)的成績介於 65 到 85 分之間。如果某位學生得了 95 分,表示表現非常優異(高於平均數 2 個標準差);而 55 分則表示學習上需要加強(低於平均數 2 個標準差)。

範例 2:製造品質

一家工廠生產的螺栓直徑應為 10mm。測量 100 顆螺栓後,平均值為 10.02mm,標準差為 0.05mm。 解讀: 製程控制良好。99.7% 的螺栓直徑在 9.87mm 至 10.17mm 之間(±3σ)。如果規格要求為 10mm ± 0.2mm,這個製程完全符合品質標準。

常見錯誤

使用錯誤的公式

當你手上只有樣本資料時,不要使用母體標準差公式(除以 N)。這會低估真實的變異程度。

忽略離群值

標準差對離群值非常敏感。一個極端值就能大幅膨脹標準差。對於含有離群值的資料集,可以考慮使用中位數絕對偏差(MAD)。

假設資料為常態分配

經驗法則(68-95-99.7)只適用於常態分配的資料。在套用這些百分比之前,請先確認你的資料分佈是否為常態。