Калькулятор коэффициента вариации
Что такое калькулятор коэффициента вариации?
Калькулятор коэффициента вариации измеряет, насколько набор чисел изменяется относительно своего собственного среднего. Введите свои данные, и калькулятор сообщит среднее, выборочное стандартное отклонение и коэффициент вариации (CV) — стандартное отклонение, выраженное в процентах от среднего.
В отличие от стандартного отклонения, которое измеряется в тех же единицах, что и ваши данные, коэффициент вариации — это чистое, безразмерное число. Это делает его идеальным для сравнения разброса двух наборов данных, имеющих разные единицы или очень разные масштабы, — например, для сравнения изменчивости месячных осадков (в миллиметрах) с изменчивостью суточных температур (в градусах) или для сравнения волатильности дешёвой акции с волатильностью дорогой.
Малый CV означает, что значения плотно сгруппированы вокруг среднего; большой CV означает, что они широко разбросаны относительно среднего.
Как это работает?
Коэффициент вариации — это отношение выборочного стандартного отклонения к среднему , умноженное на 100, чтобы превратить его в процент:
Этот калькулятор использует выборочное стандартное отклонение (с поправкой Бесселя, то есть с делением на ), поэтому требуется не менее двух точек данных. Выборочное стандартное отклонение — это квадратный корень из среднего квадрата расстояния каждого значения от среднего:
Вычисление выполняется в три шага:
- Найдите среднее, сложив все значения и разделив на их количество.
- Найдите выборочное стандартное отклонение, просуммировав квадраты отклонений от среднего, разделив на и извлекая квадратный корень.
- Разделите стандартное отклонение на среднее и умножьте на 100, чтобы выразить результат в процентах.
Коэффициент вариации имеет смысл только для данных, измеренных на шкале отношений с ненулевым положительным средним. Если среднее равно нулю, CV не определён, и эта мера становится ненадёжной, когда среднее близко к нулю или данные содержат отрицательные значения.
Разобранный пример
Рассмотрим набор данных , в котором значений.
Сначала среднее:
Квадраты отклонений от среднего равны , их сумма составляет . Деление на и извлечение квадратного корня даёт выборочное стандартное отклонение:
Тогда коэффициент вариации:
Для набора данных среднее равно , а сумма квадратов отклонений равна . Деление на даёт выборочное стандартное отклонение , поэтому:
У второго набора данных среднее выше, но относительный разброс ниже, поэтому его CV меньше, хотя его необработанное стандартное отклонение больше.
Практические замечания
Коэффициент вариации проявляет себя всякий раз, когда нужно сравнить изменчивость наборов данных, которые нельзя было бы сравнить с помощью одного лишь стандартного отклонения, — разные единицы, разные порядки величин или разные средние. В финансах он используется для оценки риска на единицу доходности; в лабораторной науке он количественно выражает точность метода измерения; в контроле качества он отслеживает стабильность процесса во времени.
CV строится непосредственно на среднем и стандартном отклонении, поэтому естественно сочетается с обоими. Для более широкого описания центра набора данных вам может также понадобиться среднее, медиана и мода.
Часто задаваемые вопросы
Какой коэффициент вариации считается хорошим?
Универсального порога нет — это зависит от области. В качестве грубого ориентира, CV ниже 10% часто считается низкой изменчивостью, 10–30% — умеренной, а выше 30% — высокой. Всегда интерпретируйте CV с учётом норм вашей собственной области.
Зачем использовать коэффициент вариации вместо стандартного отклонения?
Поскольку CV безразмерен, он позволяет сравнивать относительный разброс наборов данных, имеющих разные единицы или очень разные средние. Одно лишь стандартное отклонение может вводить в заблуждение: стандартное отклонение 10 велико для данных со средним 20, но крошечно для данных со средним 10 000.
Когда коэффициент вариации неуместен?
Избегайте CV, когда среднее равно нулю, отрицательно или близко к нулю, и когда ваши данные находятся на интервальной шкале (такой как температуры в Цельсиях), где нулевая точка произвольна. В этих случаях отношение к среднему неустойчиво или бессмысленно.