概述
假設檢定是一種基於樣本資料對母體做出決策的統計方法。標準差在判斷觀察到的差異究竟是統計顯著的,還是僅僅由隨機變異造成的過程中,扮演著關鍵角色。
1
建立假設
陳述虛無假設 (H₀) 和對立假設 (H₁)
2
選擇顯著水準
選擇顯著水準 (α),通常為 0.05
3
計算檢定統計量
利用標準差計算檢定統計量
4
與臨界值比較
與臨界值比較或計算 p 值
5
做出決策
做出決策:拒絕或無法拒絕 H₀
Z 檢定
當你已知母體標準差 (σ) 且樣本數夠大(n ≥ 30)時,使用 Z 檢定。
Z 檢定統計量
z = (x̄ - μ₀) / (σ / √n)
範例
某製造商宣稱電池平均續航 100 小時(μ₀ = 100)。你測試了 36 顆電池,發現 x̄ = 98 小時。已知 σ = 12 小時:
z = (98 - 100) / (12 / √36) = -2 / 2 = -1
在 z = -1 且 α = 0.05(雙尾檢定)的條件下,我們無法拒絕 H₀。這個差異在統計上不顯著。
T 檢定
當你不知道母體標準差,必須用樣本來估計(使用 s 代替 σ)時,使用 t 檢定。
T 檢定統計量
t = (x̄ - μ₀) / (s / √n)
何時用 T 檢定 vs Z 檢定
- Z 檢定: σ 已知,n ≥ 30
- T 檢定: σ 未知(使用 s),任何樣本數
在實務中,t 檢定更為常用,因為我們很少知道真正的母體 σ。
標準誤差
標準誤差 (SE) 衡量的是樣本平均數與母體平均數之間的變異程度。它是連結標準差與假設檢定的關鍵橋樑。
平均數的標準誤差
SE = σ / √n (或使用樣本標準差時為 s / √n)
樣本數越大,標準誤差越小。較大的樣本能提供更精確的估計,也更容易偵測出真實的差異。
統計顯著性
當觀察到的結果純粹因隨機因素出現的機率(p 值)低於你設定的閾值 (α) 時,該結果就是統計顯著的。
若 p 值 < α
拒絕 H₀。結果具有統計顯著性。
若 p 值 ≥ α
無法拒絕 H₀。結果可能是因隨機因素造成的。
統計顯著性 vs 實務顯著性
統計顯著的結果不一定具有實務上的重要性。當樣本非常大時,微小的差異也可能“顯著”,但在實務上毫無意義。因此,在考量 p 值的同時,務必也要考量效果量。