什么是变异系数计算器?
变异系数计算器衡量一组数字相对于其自身均值的变化程度。输入你的数据点,计算器会报告均值、样本标准差以及变异系数(CV)——即以均值的百分比表示的标准差。
与以数据相同单位度量的标准差不同,变异系数是一个纯粹的、无量纲的数字。这使它非常适合比较具有不同单位或差异很大的尺度的两个数据集的离散程度——例如,比较月降雨量(以毫米计)的变异性与日气温(以度计)的变异性,或者比较低价股票与高价股票的波动性。
较小的 CV 意味着这些值紧密地聚集在均值附近;较大的 CV 意味着它们相对于均值广泛分散。
它是如何工作的?
变异系数是样本标准差 与均值 之比,再乘以 100 以化为百分比:
本计算器使用样本标准差(采用贝塞尔校正,即除以 ),因此至少需要两个数据点。样本标准差是每个值到均值的距离平方的平均值的平方根:
计算分为三个步骤:
- 将所有值相加并除以它们的个数,求出均值。
- 将相对于均值的平方偏差求和,除以 ,再取平方根,求出样本标准差。
- 将标准差除以均值并乘以 100,把结果表示为百分比。
变异系数只有对于在比率尺度上度量、且均值为非零正值的数据才有意义。如果均值为零,CV 没有定义;当均值接近零或数据包含负值时,该度量会变得不可靠。
计算示例
考虑数据集 ,它有 个值。
首先,均值:
相对于均值 的平方偏差为 ,其和为 。除以 并取平方根,得到样本标准差:
于是变异系数为:
对于数据集 ,均值为 ,平方偏差之和为 。除以 得到样本标准差 ,因此:
第二个数据集均值更高但相对离散程度更低,因此尽管其原始标准差更大,其 CV 却更小。
实用说明
每当你需要比较那些仅凭标准差无法比较的数据集之间的变异性时——不同的单位、不同的量级或不同的均值——变异系数都会大放异彩。在金融中,它用于衡量每单位收益的风险;在实验室科学中,它量化测量方法的精密度;在质量控制中,它跟踪一个过程随时间的一致性。
CV 直接建立在平均数和标准差之上,因此与二者自然搭配。若想对数据集中心有更全面的概括,你或许还需要平均数、中位数和众数。
常见问题
什么是好的变异系数?
不存在通用的阈值——这取决于领域。作为粗略的指导,CV 低于 10% 通常被视为低变异性,10–30% 为中等,高于 30% 为高。请始终结合你自身领域的惯例来解读 CV。
为什么要用变异系数而不是标准差?
因为 CV 是无量纲的,它让你能够比较具有不同单位或差异很大的均值的数据集的相对离散程度。仅凭标准差可能具有误导性:标准差为 10,对于均值为 20 的数据来说很大,但对于均值为 10,000 的数据来说则微不足道。
什么时候变异系数不适用?
当均值为零、为负或接近零时,以及当你的数据处于零点是任意设定的区间尺度上(例如以摄氏度表示的温度)时,请避免使用 CV。在这些情况下,相对于均值的比值是不稳定或无意义的。