变异系数(Coefficient of Variation)比较两组数据离散程度

变异系数(Coefficient of Variation)

用法:

当需要比较两组数据离散程度大小的时候,如果两组数据的测量尺度相差太大,或者数据量纲的不同,直接使用标准差来进行比较不合适,此时就应当消除测量尺度和量纲的影响,而变异系数可以做到这一点,它是原始数据标准差与原始数据平均数的比。

 

计算公式:

 为标准差与平均值之比

 

注意点:

1.一般来说,变量值平均水平高,其离散程度的测度值越大,反之越小

2.在进行数据统计分析时,如果变异系数大于15%,则要考虑该数据可能不正常,应该剔除,对于这段话,我保留意见

3.其数据大小不仅受变量值离散程度的影响,而且还受变量值平均水平大小的影响,也就是说均值比较小时,结果波动会特别大

 

优缺点:

优点:
比起标准差来,变异系数的好处是不需要参照数据的平均值。变异系数是一个无量纲量,因此在比较两组量纲不同或均值不同的数据时,应该用变异系数而不是标准差来作为比较的参考。
缺陷:
1.当平均值接近于0的时候,微小的扰动也会对变异系数产生巨大影响,因此造成精确度不足。
2.变异系数无法发展出类似于均值的置信区间的工具。

原文地址:https://www.cnblogs.com/cgmcoding/p/14137341.html