平均と標準偏差を超えて
平均と標準偏差は中心とばらつきを記述しますが、歪度と尖度は分布の形状—非対称性と裾の重さ—を記述します。
統計学では、分布を「モーメント」—形状の異なる側面を捉える数学的要約—で記述します。
- 第1モーメント:平均(中心傾向)
- 第2モーメント:分散/標準偏差(散らばり)
- 第3モーメント:歪度(非対称性)
- 第4モーメント:尖度(裾の重さ)
2つの分布が同じ平均と標準偏差を持っていても、見た目がまったく異なることがあります。歪度と尖度はこれらの違いを捉え、データの分布のより完全な像を提供します。
歪度:非対称性の測定
歪度は分布がどの程度非対称かを測定します。正の歪みは右の裾が長いことを意味し(例:所得分布)、負の歪みは左の裾が長いことを意味します。
標本歪度
- 歪度 = 0:対称分布(正規分布、一様分布)
- 歪度 > 0:右に歪んでいる—平均が中央値を上回る(所得、住宅価格)
- 歪度 < 0:左に歪んでいる—中央値が平均を上回る(定年退職時の年齢、天井効果のある試験成績)
右に歪みやすいデータの例
解釈の目安:
- |歪度| < 0.5:おおむね対称
- 0.5 ≤ |歪度| < 1:中程度の歪み
- |歪度| ≥ 1:強い歪み
尖度:裾の重さ
尖度は正規分布と比較して裾がどの程度重いか、または軽いかを測定します。高い尖度は極端な値(裾が太い)が多いことを意味し、低い尖度はそのような値が少ないことを意味します。
よくある誤解として、尖度が「尖り具合」を測ると思われています。関連はありますが、尖度は本質的には裾に関するものです。高い尖度の分布は裾とピークにより多くの確率質量を持ちますが、「肩」の部分には少なくなります。
超過尖度
- メソクルティック (k ≈ 0):正規分布に近い裾(比較の基準)
- レプトクルティック (k > 0):裾が太く、正規分布より極端な値が多い(株価リターン、地震)
- プラティクルティック (k < 0):裾が薄く、正規分布より極端な値が少ない(一様分布、有界データ)
金融における裾の太さ
実用的応用
リスク管理: 高い尖度は極端な結果がより頻繁に起こることを意味します。正規性を仮定するVaRなどのリスク指標は、尖度が高い場合に真のリスクを大幅に過小評価する可能性があります。
品質管理: 高い尖度を持つ製造データは、平均的な性能は許容範囲であっても、ときに目標から極端に外れることを示唆します。このパターンは工程の不安定性を示し、調査が必要かもしれません。
データ変換: 強く歪んだデータは、分析前に変換(対数、平方根)するとよい場合があります。目標は多くの場合、正規性を仮定する統計検定のために近似的な正規性を達成することです。
統計検定: 多くの検定は正規性を仮定しています。有意な歪度や尖度は、この仮定が破られていることを示す場合があり、ノンパラメトリックな代替手法や頑健な方法の使用を示唆します。
解釈のガイドライン
正規性検定: ジャック-ベラ検定は歪度と尖度を組み合わせて正規性を検定します。いずれかの指標がゼロから有意に外れた場合、正規性を棄却します。
標本サイズの考慮: 小さな標本では歪度と尖度の推定値が信頼できません。n < 50ではこれらの統計量の標本変動が大きくなります。n < 20では本質的に意味がありません。
頑健性: 歪度も尖度も外れ値に敏感です。1つの極端な値でこれらの統計量が劇的に変化する可能性があるため、数値的な要約と合わせて常にデータを視覚化してください。