Σ
SDCalc
上級理論·15 min

歪度と尖度:標準偏差を超えて

分布の形状を平均や標準偏差を超えて記述する第3モーメント(歪度)と第4モーメント(尖度)について学びましょう。

平均と標準偏差を超えて

平均と標準偏差は中心とばらつきを記述しますが、歪度尖度は分布の形状—非対称性と裾の重さ—を記述します。

統計学では、分布を「モーメント」—形状の異なる側面を捉える数学的要約—で記述します。

  • 第1モーメント:平均(中心傾向)
  • 第2モーメント:分散/標準偏差(散らばり)
  • 第3モーメント:歪度(非対称性)
  • 第4モーメント:尖度(裾の重さ)

2つの分布が同じ平均と標準偏差を持っていても、見た目がまったく異なることがあります。歪度と尖度はこれらの違いを捉え、データの分布のより完全な像を提供します。

歪度:非対称性の測定

歪度は分布がどの程度非対称かを測定します。正の歪みは右の裾が長いことを意味し(例:所得分布)、負の歪みは左の裾が長いことを意味します。

標本歪度

g₁ = [n/((n-1)(n-2))] × Σ[(xᵢ - x̄)/s]³
  • 歪度 = 0:対称分布(正規分布、一様分布)
  • 歪度 > 0:右に歪んでいる—平均が中央値を上回る(所得、住宅価格)
  • 歪度 < 0:左に歪んでいる—中央値が平均を上回る(定年退職時の年齢、天井効果のある試験成績)

右に歪みやすいデータの例

多くの実世界の現象は右に歪んでいます:所得、富、企業規模、都市人口、保険金請求額、待ち時間。これらの場合、極端な値によって平均が引き上げられるため、「典型的」な値を示すには中央値の方が適しています。

解釈の目安:

  • |歪度| < 0.5:おおむね対称
  • 0.5 ≤ |歪度| < 1:中程度の歪み
  • |歪度| ≥ 1:強い歪み

尖度:裾の重さ

尖度は正規分布と比較して裾がどの程度重いか、または軽いかを測定します。高い尖度は極端な値(裾が太い)が多いことを意味し、低い尖度はそのような値が少ないことを意味します。

よくある誤解として、尖度が「尖り具合」を測ると思われています。関連はありますが、尖度は本質的には裾に関するものです。高い尖度の分布は裾とピークにより多くの確率質量を持ちますが、「肩」の部分には少なくなります。

超過尖度

g₂ = [n(n+1)/((n-1)(n-2)(n-3))] × Σ[(xᵢ - x̄)/s]⁴ - 3(n-1)²/((n-2)(n-3))
  • メソクルティック (k ≈ 0):正規分布に近い裾(比較の基準)
  • レプトクルティック (k > 0):裾が太く、正規分布より極端な値が多い(株価リターン、地震)
  • プラティクルティック (k < 0):裾が薄く、正規分布より極端な値が少ない(一様分布、有界データ)

金融における裾の太さ

金融リターンは高い尖度(「ファットテール」)を示すことで有名です。正規分布の仮定では100年に一度のはずの事象が、はるかに頻繁に発生します。尖度を無視するとリスクの過小評価につながります—これは数多くの金融危機からの教訓です。

実用的応用

リスク管理: 高い尖度は極端な結果がより頻繁に起こることを意味します。正規性を仮定するVaRなどのリスク指標は、尖度が高い場合に真のリスクを大幅に過小評価する可能性があります。

品質管理: 高い尖度を持つ製造データは、平均的な性能は許容範囲であっても、ときに目標から極端に外れることを示唆します。このパターンは工程の不安定性を示し、調査が必要かもしれません。

データ変換: 強く歪んだデータは、分析前に変換(対数、平方根)するとよい場合があります。目標は多くの場合、正規性を仮定する統計検定のために近似的な正規性を達成することです。

統計検定: 多くの検定は正規性を仮定しています。有意な歪度や尖度は、この仮定が破られていることを示す場合があり、ノンパラメトリックな代替手法や頑健な方法の使用を示唆します。

解釈のガイドライン

正規性検定: ジャック-ベラ検定は歪度と尖度を組み合わせて正規性を検定します。いずれかの指標がゼロから有意に外れた場合、正規性を棄却します。

標本サイズの考慮: 小さな標本では歪度と尖度の推定値が信頼できません。n < 50ではこれらの統計量の標本変動が大きくなります。n < 20では本質的に意味がありません。

頑健性: 歪度も尖度も外れ値に敏感です。1つの極端な値でこれらの統計量が劇的に変化する可能性があるため、数値的な要約と合わせて常にデータを視覚化してください。

Further Reading

How to Read This Article

A statistics tutorial is a practical interpretation guide, not just a formula dump. It refers to the assumptions, notation, and reporting language that analysts need when they explain a result to a teacher, manager, client, or reviewer. The article body covers the specific topic, while the sections below create a common interpretation frame that readers can reuse across related metrics.

Reading goalWhat to focus onCommon mistake
DefinitionWhat the metric is and what quantity it summarizesTreating the formula as self-explanatory
Formula choiceSample versus population assumptions and notationUsing n when n-1 is required or vice versa
InterpretationWhether the result indicates concentration, spread, or riskCalling a large value good or bad without context

Frequently Asked Questions

How should I interpret a high standard deviation?

A high standard deviation means the observations are spread farther from the mean on average. Whether that spread is acceptable depends on the context: wide dispersion might signal risk in finance, instability in manufacturing, or genuine natural variation in scientific data.

Why do some articles mention n while others mention n-1?

The denominator reflects the difference between population and sample formulas. Population variance and population standard deviation use N because the full dataset is known. Sample variance and sample standard deviation often use n-1 because Bessel’s correction reduces bias when estimating population spread from a sample.

What is a statistical interpretation guide?

A statistical interpretation guide is a page that moves beyond arithmetic and explains meaning. It tells you what a metric is, when the formula applies, and how to describe the result in plain English without overstating certainty.

Can I cite this article in a report?

You should cite the underlying authoritative reference for formal work whenever possible. This page is best used as an explanatory bridge that helps you understand the concept before quoting the original standard or handbook.

Why include direct citations on every article page?

Direct citations give readers a route to verify the definition, notation, and assumptions. That improves trust and reduces the chance that a simplified explanation is mistaken for the entire technical standard.

Authoritative References

These sources define the concepts referenced most often across our articles. Bessel's correction is a sample adjustment, variance is a squared measure of spread, and standard deviation is the square root of variance expressed in the same units as the data.