信頼区間とは?
信頼区間 (CI) とは、真の母集団パラメータが含まれる可能性が高い値の範囲です。1つの点推定値を示す代わりに、範囲を提示することで不確実性を認めます。
「真の平均が48.2から51.8の間にあると95%の確信がある」
95% CI: [48.2, 51.8]
公式
母集団平均の信頼区間は以下の通りです。
信頼区間の公式
CI = x̄ ± z* × (σ / √n)
- x̄ = 標本平均
- z* = 臨界値(95%信頼区間の場合は1.96)
- σ = 標準偏差
- n = 標本サイズ
- σ/√n = 標準誤差
| 信頼水準 | z*の値 |
|---|---|
| 90% | 1.645 |
| 95% | 1.960 |
| 99% | 2.576 |
正しい解釈
よくある誤解
95%信頼区間は「真の平均がこの区間内にある確率が95%」という意味ではありません。真の平均はこの区間内にあるかないかのどちらかで、固定されています。
正しい解釈
「この標本抽出の手順を繰り返した場合、計算された区間の95%が真の母集団平均を含む」という意味です。
計算例
例:顧客満足度調査
100人の顧客を調査した結果、満足度スコアの平均は7.5、標準偏差は1.5でした。95%信頼区間を計算しましょう。
1
標準誤差を求める
SE = 1.5 / √100 = 0.15
2
誤差の範囲を計算する
ME = 1.96 × 0.15 = 0.294
3
区間を構築する
CI = 7.5 ± 0.294 = [7.21, 7.79]
解釈: 真の平均顧客満足度が7.21から7.79の間にあると、95%の確信を持てます。
信頼区間の幅に影響する要因
標本サイズ (n)
nが大きいほど = 狭い信頼区間
データが多いほど精度が高まる
標準偏差 (σ)
σが大きいほど = 広い信頼区間
ばらつきが大きいほど確実性が低下
信頼水準
信頼水準が高いほど = 広い信頼区間
99%信頼区間は95%信頼区間より広い