Σ
SDCalc
中級応用·11 min

標準偏差を使った信頼区間の構築

標準偏差を用いた信頼区間の構築方法を解説。信頼水準の意味と、実際の場面での信頼区間の解釈方法を学びましょう。

信頼区間とは?

信頼区間 (CI) とは、真の母集団パラメータが含まれる可能性が高い値の範囲です。1つの点推定値を示す代わりに、範囲を提示することで不確実性を認めます。

「真の平均が48.2から51.8の間にあると95%の確信がある」

95% CI: [48.2, 51.8]

公式

母集団平均の信頼区間は以下の通りです。

信頼区間の公式

CI = x̄ ± z* × (σ / √n)
  • x̄ = 標本平均
  • z* = 臨界値(95%信頼区間の場合は1.96)
  • σ = 標準偏差
  • n = 標本サイズ
  • σ/√n = 標準誤差
信頼水準z*の値
90%1.645
95%1.960
99%2.576

正しい解釈

よくある誤解

95%信頼区間は「真の平均がこの区間内にある確率が95%」という意味ではありません。真の平均はこの区間内にあるかないかのどちらかで、固定されています。

正しい解釈

「この標本抽出の手順を繰り返した場合、計算された区間の95%が真の母集団平均を含む」という意味です。

計算例

例:顧客満足度調査

100人の顧客を調査した結果、満足度スコアの平均は7.5、標準偏差は1.5でした。95%信頼区間を計算しましょう。
1

標準誤差を求める

SE = 1.5 / √100 = 0.15
2

誤差の範囲を計算する

ME = 1.96 × 0.15 = 0.294
3

区間を構築する

CI = 7.5 ± 0.294 = [7.21, 7.79]

解釈: 真の平均顧客満足度が7.21から7.79の間にあると、95%の確信を持てます。

信頼区間の幅に影響する要因

標本サイズ (n)

nが大きいほど = 狭い信頼区間 データが多いほど精度が高まる

標準偏差 (σ)

σが大きいほど = 広い信頼区間 ばらつきが大きいほど確実性が低下

信頼水準

信頼水準が高いほど = 広い信頼区間 99%信頼区間は95%信頼区間より広い