Σ
SDCalc
上級上級·14 min

加重標準偏差

データ点の重要度や頻度が異なる場合の加重標準偏差の計算方法を学びましょう。

加重標準偏差とは?

データ点の重要度が異なる場合や、異なる頻度を表す場合には、加重標準偏差を使用します。ポートフォリオ分析、サンプリングウェイト付きの調査データ、GPA計算などでよく使われます。

通常の(非加重)計算では、すべてのデータ点が平均や標準偏差に等しく寄与します。しかし、実世界では一部の観測値に他より大きな影響力を与える必要がある場面が多くあります。100万ドルの投資はポートフォリオのボラティリティ計算において、1,000ドルのポジションよりも大きな影響を持つべきです。より大きな人口統計グループからの調査回答は、母集団パラメータを推定する際により大きなウェイトを持つべきです。

加重SDを使う場面

データ点の重要度、頻度、または信頼性のレベルが異なる場合は、常に加重標準偏差を使用してください。非加重SDはすべてのデータ点が等しく重要であることを前提としていますが、これは多くの場合、正しくない仮定です。

加重標準偏差の公式

まず、加重平均を求めます。

加重平均

x̄w = Σ(wᵢxᵢ) / Σwᵢ

次に、加重標準偏差(母集団版)を求めます。

加重標準偏差(母集団)

σw = √[Σwᵢ(xᵢ - x̄w)² / Σwᵢ]

ここでwᵢは各重み、xᵢはデータの値、x̄wは加重平均です。

標本データの場合は、バイアス補正公式(ベッセルの補正に相当)を使用します。

加重標準偏差(標本)

sw = √[Σwᵢ(xᵢ - x̄w)² / (Σwᵢ - Σwᵢ²/Σwᵢ)]

標本補正がより複雑なのは、「有効標本サイズ」が重みの分布に依存するためです。すべての重みが等しい場合、これはおなじみのn-1補正に帰着します。

ステップごとの計算

1

加重平均を計算する

各値にその重みを掛け、それらの積を合計し、重みの合計で割ります。
2

加重2乗偏差を計算する

各値について(値 - 加重平均)²を求め、重みを掛けます。
3

加重2乗偏差の合計を求める

ステップ2の全積を足し合わせます。
4

重みの合計で割る

母集団SDの場合はΣwᵢで割ります。標本SDの場合はバイアス補正を使用します。
5

平方根を取る

最終的な加重標準偏差が得られます。

実世界での応用

ポートフォリオのボラティリティ: 金融では、ポートフォリオの標準偏差は異なる資産配分を考慮しなければなりません。株式50%、債券50%のポートフォリオのボラティリティは、配分比率を重みとした加重SDで計算されます。

調査分析: 調査標本では、特定の人口統計グループが過大または過小に代表されることがよくあります。ウェイティングでこれを調整し、結果が真の母集団を反映するようにします。加重SDは標本だけでなく、母集団のばらつきを捉えます。

成績評価: GPAの計算では、科目によって単位数が異なります。4単位の科目は1単位の科目よりもGPAに大きく影響するべきです。加重計算はこれを自然に扱います。

メタ分析: 複数の研究結果を統合する場合、各研究はその精度(多くの場合、分散の逆数)で加重されます。これにより、より大規模で精密な研究により大きな影響力を与えます。

計算例

ポートフォリオの例: 3銘柄のポートフォリオを考えましょう。

  • 株式A:リターン15%、配分50%(重み = 0.50)
  • 株式B:リターン8%、配分30%(重み = 0.30)
  • 株式C:リターン-2%、配分20%(重み = 0.20)

加重平均 = (0.50×15 + 0.30×8 + 0.20×(-2)) / 1.0 = 9.5%

加重SD = √[(0.50×(15-9.5)² + 0.30×(8-9.5)² + 0.20×(-2-9.5)²)] = √[(0.50×30.25 + 0.30×2.25 + 0.20×132.25)] = √[15.125 + 0.675 + 26.45] = √42.25 = 6.5%

影響の大きさに注目

株式Cは配分がわずか20%ですが、リターンが加重平均から大きく乖離しているため、ボラティリティへの寄与が大きくなっています。これこそ加重SDが捉えるもの—偏差と重みの両方が重要なのです。

Further Reading

How to Read This Article

A statistics tutorial is a practical interpretation guide, not just a formula dump. It refers to the assumptions, notation, and reporting language that analysts need when they explain a result to a teacher, manager, client, or reviewer. The article body covers the specific topic, while the sections below create a common interpretation frame that readers can reuse across related metrics.

Reading goalWhat to focus onCommon mistake
DefinitionWhat the metric is and what quantity it summarizesTreating the formula as self-explanatory
Formula choiceSample versus population assumptions and notationUsing n when n-1 is required or vice versa
InterpretationWhether the result indicates concentration, spread, or riskCalling a large value good or bad without context

Frequently Asked Questions

How should I interpret a high standard deviation?

A high standard deviation means the observations are spread farther from the mean on average. Whether that spread is acceptable depends on the context: wide dispersion might signal risk in finance, instability in manufacturing, or genuine natural variation in scientific data.

Why do some articles mention n while others mention n-1?

The denominator reflects the difference between population and sample formulas. Population variance and population standard deviation use N because the full dataset is known. Sample variance and sample standard deviation often use n-1 because Bessel’s correction reduces bias when estimating population spread from a sample.

What is a statistical interpretation guide?

A statistical interpretation guide is a page that moves beyond arithmetic and explains meaning. It tells you what a metric is, when the formula applies, and how to describe the result in plain English without overstating certainty.

Can I cite this article in a report?

You should cite the underlying authoritative reference for formal work whenever possible. This page is best used as an explanatory bridge that helps you understand the concept before quoting the original standard or handbook.

Why include direct citations on every article page?

Direct citations give readers a route to verify the definition, notation, and assumptions. That improves trust and reduces the chance that a simplified explanation is mistaken for the entire technical standard.

Authoritative References

These sources define the concepts referenced most often across our articles. Bessel's correction is a sample adjustment, variance is a squared measure of spread, and standard deviation is the square root of variance expressed in the same units as the data.