正規分布とは?
正規分布は、ガウス分布や「ベルカーブ」とも呼ばれ、統計学で最も重要な確率分布です。データの値が中心の平均値の周りにどのように分布しているかを記述します。
The Classic Bell Curve
正規分布は、中心を決める平均 (μ) と、広がりを決める標準偏差 (σ) のわずか2つのパラメータで完全に定義されます。
主な特性
対称性
分布は平均を中心に完全に対称です。左右は鏡像関係にあります。
平均 = 中央値 = 最頻値
正規分布では、中心傾向の3つの指標がすべて等しく、中央に位置します。
漸近的
裾は無限に伸びますが、x軸に接することはありません。極端な値は可能ですが、ますます稀になります。
総面積 = 1
曲線の下の総面積は1(100%)に等しく、すべての可能な結果を表しています。
標準偏差が形状に与える影響
標準偏差は正規分布の「広がり」を制御します。σが小さいほど、背が高く狭い曲線になり、σが大きいほど、背が低く幅広い曲線になります。
Visual Comparison
Low SD (σ = 0.5)
Data clustered tightly around the mean
High SD (σ = 2)
Data spread widely from the mean
Zスコアと標準化
Zスコアは、ある値が平均から標準偏差何個分離れているかを示します。これにより、異なる正規分布の値を比較できるようになります。
Zスコアの公式
z = (x - μ) / σ
| Zスコア | 意味 | パーセンタイル |
|---|---|---|
| -2 | 平均より標準偏差2つ分下 | 約2.3% |
| -1 | 平均より標準偏差1つ分下 | 約15.9% |
| 0 | 平均値 | 50% |
| +1 | 平均より標準偏差1つ分上 | 約84.1% |
| +2 | 平均より標準偏差2つ分上 | 約97.7% |
実世界の例
多くの自然現象は正規分布に従います。
- 身長:ほとんどの人は平均的な身長で、極端に高い人や低い人は少数です
- IQスコア:平均100、標準偏差15の正規分布に従うように設計されています
- 測定誤差:科学的測定におけるランダムな誤差
- 血圧:集団の血圧測定値
正規分布に従わないデータ
すべてのデータが正規分布に従うわけではありません。以下のような場合は注意が必要です。
非正規分布
- 所得データ: 通常は右に歪んでいる(高所得者の長い裾)
- 待ち時間: 指数分布に従うことが多い
- カウントデータ: ポアソン分布に従う場合がある
- 割合: 二項分布に従う