가중 표준편차란?
데이터 포인트의 중요도가 다르거나 빈도가 다를 때 가중 표준편차를 사용합니다. 포트폴리오 분석, 표본 가중치가 적용된 설문 데이터, GPA 계산 등에서 흔히 쓰입니다.
일반(비가중) 계산에서는 모든 데이터가 평균과 표준편차에 동등하게 기여합니다. 하지만 실제 상황에서는 일부 관측에 더 큰 영향력을 부여해야 하는 경우가 많습니다. 100만 달러 투자는 1,000달러 포지션보다 포트폴리오 변동성 계산에 더 크게 반영되어야 합니다. 더 큰 인구 집단의 설문 응답은 모집단 모수를 추정할 때 더 큰 가중치를 가져야 합니다.
가중 SD를 사용할 때
가중 SD 공식
먼저 가중 평균이 필요합니다:
가중 평균
그다음 가중 표준편차(모집단 버전):
가중 표준편차 (모집단)
여기서 wᵢ는 가중치, xᵢ는 데이터 값, x̄w는 가중 평균입니다.
표본 데이터의 경우, 편향 보정 공식(베셀 보정과 유사)을 사용합니다:
가중 표준편차 (표본)
표본 보정이 더 복잡한 이유는 “유효 표본 크기”가 가중치의 분포에 따라 달라지기 때문입니다. 모든 가중치가 같으면 익숙한 n-1 보정으로 축소됩니다.
단계별 계산
가중 평균 계산
가중 제곱 편차 계산
가중 제곱 편차의 합 구하기
가중치의 합으로 나누기
제곱근 구하기
실전 응용
포트폴리오 변동성: 금융에서 포트폴리오 표준편차는 서로 다른 자산 배분을 고려해야 합니다. 주식 50%, 채권 50% 포트폴리오의 변동성은 배분 비율을 가중치로 사용하여 가중 SD로 계산합니다.
설문 분석: 설문 표본이 특정 인구통계를 과대 또는 과소 대표하는 경우가 많습니다. 가중치로 이를 보정하면 결과가 실제 모집단을 반영하게 됩니다. 가중 SD는 표본이 아닌 모집단의 변동성을 포착합니다.
학점 계산: GPA를 계산할 때 과목마다 학점이 다릅니다. 4학점 과목이 1학점 과목보다 GPA에 더 큰 영향을 미쳐야 합니다. 가중 계산이 이를 자연스럽게 처리합니다.
메타분석: 여러 연구의 결과를 종합할 때, 각 연구는 정밀도(보통 분산의 역수)로 가중됩니다. 이렇게 하면 표본이 크고 정밀한 연구에 더 큰 영향력이 부여됩니다.
계산 예시
포트폴리오 예시: 세 종목으로 구성된 포트폴리오:
- 주식 A: 수익률 15%, 배분 비율 50% (가중치 = 0.50)
- 주식 B: 수익률 8%, 배분 비율 30% (가중치 = 0.30)
- 주식 C: 수익률 -2%, 배분 비율 20% (가중치 = 0.20)
가중 평균 = (0.50×15 + 0.30×8 + 0.20×(-2)) / 1.0 = 9.5%
가중 SD = √[(0.50×(15-9.5)² + 0.30×(8-9.5)² + 0.20×(-2-9.5)²)] = √[(0.50×30.25 + 0.30×2.25 + 0.20×132.25)] = √[15.125 + 0.675 + 26.45] = √42.25 = 6.5%
주목할 점