標準偏差の公式とは?
標準偏差の公式は、データ値の集合におけるばらつき(変動や散らばり)の度合いを定量化するための数学的な方程式です。標準偏差が小さい(低い)場合は、データポイントが平均(μまたはx̄)の近くに集まっていることを示し、標準偏差が大きい(高い)場合は、データポイントがより広い範囲に散らばっていることを示します。
統計学では、対象が母集団全体なのか、そこから抽出された標本なのかによって、使用する公式が異なります。その核心的な概念は、平均からの偏差の二乗の平均を計算すること(これは分散 (σ²) として知られています)、そして元の単位に戻すために平方根をとることです。
母集団の標準偏差
- σ(シグマ):母集団の標準偏差
- Σ(シグマ):総和
- xi:データセット内の各値
- μ(ミュー):母集団の平均
- N:母集団のデータ数(総数)
母集団と標本の標準偏差の違い
実世界のデータ分析において、母集団全体のデータを入手できることは稀です。多くの場合、より大きな母集団について推測するために標本を収集します。標本は母平均を推定するに過ぎないため、標本に対して母集団の公式を用いて標準偏差を計算すると、真のばらつきを常に過小評価してしまいます。この偏り(バイアス)を補正するために、標本の標準偏差の公式を使用します。
標本の標準偏差
公式を使い間違えないように注意!
公式のステップバイステップ計算手順
手計算で標準偏差を求めるには、体系的なアプローチが必要です。以下の手順に従うことで、任意のデータセットについて母集団または標本の標準偏差を正確に計算することができます。
平均を計算する
偏差を求める
偏差を二乗する
偏差平方和を求める
Nまたはn-1で割る
平方根をとる
なぜ標本の公式はn-1で割るのか?
nの代わりにn-1で割る概念は、ベッセルの補正として知られています。標本平均(x̄)は標本データ自体から計算されるため、偏差(xi - x̄)は数学的に合計がゼロになるという制約があります。つまり、データポイントは真の母平均(μ)よりも標本平均にわずかに近くなってしまうのです。
n-1(自由度)で割ることで、この過小評価を補正するのにちょうど良い大きさに分散を膨らませ、母分散の不偏推定量を提供することができます。
Further Reading
Sources
References and further authoritative reading used in preparing this article.