はじめに
標準誤差 (SE) と標準偏差 (SD) は、どちらも散らばりの指標ですが、根本的に異なる問いに答えるものです。この2つの混同は、統計学で最もよくある間違いのひとつです。
よくある混同
多くの人が、標本平均の精度を報告する際にSEを使うべきところでSDを使ってしまいます。これは統計的有意性について誤った結論を導く原因になります。
根本的な違い
標準偏差
個々のデータ点が平均の周りにどれくらい散らばっているかを測定します。
「個々の値はどれくらいばらつくのか?」
標準誤差
母集団平均の推定値としての標本平均の精度を測定します。
「標本平均はどの程度正確か?」
標準誤差の公式
平均の標準誤差
SE = s / √n
sは標本標準偏差、nは標本サイズです。
計算例
25人の学生の標本でテストの平均点 = 75、SD = 10 の場合:
- 標準偏差 (s) = 10点
- 標本サイズ (n) = 25
- 標準誤差 = 10 / √25 = 10 / 5 = 2点
解釈:標本平均75点には約±2点の不確実性があります。
使い分けの方法
- 標準偏差を使う場面:個々の観測値のばらつきを記述する場合、母集団や標本を特徴づける場合、正常範囲を設定する場合(臨床基準値など)、品質管理で許容変動を管理する場合
- 標準誤差を使う場面:標本統計量の精度を報告する場合、信頼区間を構築する場合、グループ間の平均を比較する場合、仮説検定を行う場合
標本サイズの影響
重要な違いがあります。標本サイズが大きくなってもSDはほぼ一定ですが、SEは減少します。
| 標本サイズ (n) | SD | SE = SD/√n |
|---|---|---|
| 25 | 10 | 2.00 |
| 100 | 10 | 1.00 |
| 400 | 10 | 0.50 |
| 10,000 | 10 | 0.10 |
重要なポイント
標準誤差を半分にするには、標本サイズを4倍にする必要があります。非常に精密な推定には大きな標本が必要な理由はここにあります。