변동계수 계산기란?
변동계수 계산기는 숫자 집합이 자신의 평균에 대해 상대적으로 얼마나 변동하는지를 측정합니다. 데이터 점을 입력하면 계산기가 평균, 표본 표준편차, 그리고 변동계수(CV)를 보고합니다. CV는 표준편차를 평균에 대한 백분율로 표현한 값입니다.
데이터와 같은 단위로 측정되는 표준편차와 달리, 변동계수는 순수하고 단위가 없는 수입니다. 그래서 단위가 다르거나 척도가 매우 다른 두 데이터 집합의 산포를 비교하는 데 이상적입니다. 예를 들어 월간 강수량(밀리미터)의 변동성과 일일 기온(도)의 변동성을 비교하거나, 저가 주식의 변동성과 고가 주식의 변동성을 비교할 수 있습니다.
작은 CV는 값들이 평균 주위에 빽빽하게 모여 있음을 의미하고, 큰 CV는 평균에 대해 상대적으로 넓게 흩어져 있음을 의미합니다.
어떻게 작동하나요?
변동계수는 표본 표준편차 와 평균 의 비에 100을 곱하여 백분율로 만든 값입니다.
이 계산기는 표본 표준편차(베셀 보정을 적용해 로 나눔)를 사용하므로 최소 두 개의 데이터 점이 필요합니다. 표본 표준편차는 각 값이 평균으로부터 떨어진 거리의 제곱 평균의 제곱근입니다.
계산은 세 단계를 따릅니다.
- 모든 값을 더하고 그 개수로 나누어 평균을 구합니다.
- 평균으로부터의 제곱 편차를 합한 뒤 로 나누고 제곱근을 취하여 표본 표준편차를 구합니다.
- 표준편차를 평균으로 나누고 100을 곱하여 결과를 백분율로 표현합니다.
변동계수는 0이 아닌 양의 평균을 갖는 비율 척도로 측정된 데이터에 대해서만 의미가 있습니다. 평균이 0이면 CV는 정의되지 않으며, 평균이 0에 가깝거나 데이터에 음수 값이 포함되면 이 측도는 신뢰할 수 없게 됩니다.
풀이 예제
데이터 집합 를 생각해 봅시다. 이는 개의 값을 갖습니다.
먼저, 평균은 다음과 같습니다.
평균 으로부터의 제곱 편차는 이고 그 합은 입니다. 로 나누고 제곱근을 취하면 표본 표준편차를 얻습니다.
따라서 변동계수는 다음과 같습니다.
데이터 집합 의 경우 평균은 이고 제곱 편차의 합은 입니다. 로 나누면 표본 표준편차는 이므로 다음과 같습니다.
두 번째 데이터 집합은 평균이 더 높지만 상대적 산포가 더 낮으므로, 원시 표준편차는 더 크더라도 CV는 더 작습니다.
실용적인 참고 사항
변동계수는 표준편차만으로는 비교할 수 없는 데이터 집합 간의 변동성을 비교해야 할 때, 즉 단위가 다르거나 크기가 다르거나 평균이 다를 때 빛을 발합니다. 금융에서는 수익 단위당 위험을 판단하는 데 사용되고, 실험 과학에서는 측정 방법의 정밀도를 정량화하며, 품질 관리에서는 시간에 따른 공정의 일관성을 추적합니다.
CV는 평균과 표준편차 위에 직접 세워지므로 둘 모두와 자연스럽게 어울립니다. 데이터 집합 중심에 대한 더 폭넓은 요약을 원한다면 평균, 중앙값, 최빈값도 살펴보면 좋습니다.
자주 묻는 질문
좋은 변동계수는 얼마인가요?
보편적인 기준값은 없으며 분야에 따라 다릅니다. 대략적인 지침으로, CV가 10% 미만이면 흔히 변동성이 낮다고 보고, 10~30%면 중간, 30%를 넘으면 높다고 봅니다. 항상 자신의 분야 기준에 비추어 CV를 해석하세요.
왜 표준편차 대신 변동계수를 사용하나요?
CV는 단위가 없으므로 단위가 다르거나 평균이 매우 다른 데이터 집합의 상대적 산포를 비교할 수 있게 해 줍니다. 표준편차만으로는 오해를 부를 수 있습니다. 표준편차 10은 평균이 20인 데이터에는 크지만 평균이 10,000인 데이터에는 아주 작습니다.
변동계수가 적절하지 않은 경우는 언제인가요?
평균이 0이거나 음수이거나 0에 가까울 때, 그리고 데이터가 영점이 임의적인 간격 척도(섭씨 온도 등)에 있을 때는 CV를 피하세요. 그런 경우 평균에 대한 비는 불안정하거나 의미가 없습니다.