변동계수란?
변동계수(CV: Coefficient of Variation)는 상대표준편차(RSD)라고도 하며, 표준편차를 평균의 백분율로 표현한 표준화된 산포 측도입니다. 단위나 척도가 다른 데이터셋 간의 변동성을 비교할 때 유용합니다.
데이터셋 A: 키
평균: 170 cm, SD: 10 cm
CV = 5.9%
데이터셋 B: 체중
평균: 70 kg, SD: 10 kg
CV = 14.3%
SD는 같지만(10), CV를 보면 체중이 상대적으로 더 큰 변동성을 보입니다
CV 공식
변동계수
CV = (σ / μ) × 100%
여기서 σ는 표준편차, μ는 평균입니다. 표본 데이터의 경우 각각 s와 x̄를 사용합니다.
계산 예시
데이터: 12, 15, 14, 18, 11
- 평균 (x̄) = 14
- 표준편차 (s) = 2.74
- CV = (2.74 / 14) × 100% = 19.6%
CV를 사용할 때
CV를 사용하는 경우:
- 단위가 다른 데이터셋을 비교할 때
- 평균이 크게 다른 데이터셋을 비교할 때
- 비율척도 데이터(절대 영점 존재)일 때
- 실험실 측정의 일관성을 평가할 때
- 금융 분석(변동성 비교)할 때
SD를 사용하는 경우:
- 단위와 평균이 비슷한 데이터셋일 때
- 등간척도 데이터(온도 등)일 때
- 평균이 0이거나 0에 가까울 때
- 절대적인 퍼짐 정도가 필요할 때
실전 예시
실험실 품질 관리
분석화학에서 CV가 10% 미만이면 일반적으로 정밀도가 양호하다고 판단합니다. 정밀도가 높은 분석법은 CV < 5%를 달성할 수 있습니다.
| 주식 | 수익률 | SD | CV |
|---|---|---|---|
| 주식 A | 8% | 4% | 50% |
| 주식 B | 12% | 9% | 75% |
주식 A의 CV가 더 낮음 = 위험 단위당 수익이 더 높음
CV의 한계
중요한 한계점
- 평균이 0이면 정의 불가: 0으로 나누기 때문에 CV가 무의미해짐
- 음수 값이 있으면 문제: 오해의 소지가 있는 결과 발생 가능
- 등간척도에는 부적합: 섭씨/화씨 온도는 임의의 영점을 가짐