统计学——中位数、众数

（2）中位数

中位数是指将数据按大小顺序排列起来，形成一个数列，居于数列中间位置的那个数据。中位数用Me表示。

　从中位数的定义可知，所研究的数据中有一半小于中位数，一半大于中位数。中位数的作用与算术平均数相近，也是作为所研究数据的代表值。在一个等差数列或一个正态分布数列中，中位数就等于算术平均数。

在数列中出现了极端变量值的情况下，用中位数作为代表值要比用算术平均数更好，因为中位数不受极端变量值的影响；如果研究目的就是为了反映中间水平，当然也应该用中位数。在统计数据的处理和分析时，可结合使用中位数。

中位数的计算：确定中位数，必须将总体各单位的标志值按大小顺序排列，最好是编制出变量数列。这里有两种情况：

1、对于未分组的原始资料，首先必须将标志值按大小排序。设排序的结果为：

则中位数就可以按下面的方式确定：

例如，根据下表的数据，计算50名工人日加工零件数的中位数。

中位数的位置在（50+1）/2 = 25.5，中位数在第25个数值（123）和第26个数值（123）之间，即Me = (123+123)/2=123(件)。

2、由分组资料确定中位数

由组距数列确定中位数，应先按的公式求出中位数所在组的位置，然后再按下限公式或上限公式确定中位数。

公式中：

Me——中位数；

L——中位数所在组下限；

U——中位数所在组上限；

fm——为中位数所在组的次数；

——总次数；

d——中位数所在组的组距；

Sm − 1——中位数所在组以下的累计次数；

Sm + 1——中位数所在组以上的累计次数。

例：根据上面例表的数据，计算50名工人日加工零件数的中位数。

　　解（某企业50名工人加工零件中位数计算表）：

由上表可知，中位数的位置=50/2=25，即中位数在120～125这一组，L=120，Sm − 1 = 16，U=125，Sm + 1 = 20，fm = 14，d=5，根据中位数公式得：

（3）众数

众数是指一组数据中出现次数最多的那个数据，一组数据可以有多个众数，也可以没有众数。众数是由英国统计学家皮尔生首先提出来的。所谓众数是指社会经济现象中最普遍出现的标志值。从分布角度看，众数是具有明显集中趋势的数值。

统计上把这种在一组数据中出现次数最多的变量值叫做众数。用Mo表示。它主要用于定类（品质标志）数据的集中趋势，当然也适用于作为定序（品质标志）数据以及定距和定比（数量标志）数据集中趋势的测度值。

众数的计算：一般情况下，找出一组数据中出现次数最多的数值即可。但若所掌握的资料是组距式数列，则只能按一定的方法来推算众数的近似值。计算公式为：

公式中：

L——众数所在组下限；

U——众数所在组上限；

——众数所在组次数与其下限的邻组次数之差；

——众数所在组次数与其上限的邻组次数之差；

d——众数所在组组距。

　　例:根据下表的数据，计算50名工人日加工零件数的众数。

解：从表中的数据可以看出，最大的频数值是14，即众数组为120~125这一组，根据公式得50名工人日加工零件的众数为：

众数是一种位置平均数，是总体中出现次数最多的变量值，因而在实际工作中有时有它特殊的用途。诸如，要说明一个企业中工人最普遍的技术等级，说明消费者需要的内衣、鞋袜、帽子等最普遍的号码，说明农贸市场上某种农副产品最普遍的成交价格等，都需要利用众数。但是必须注意，从分布的角度看，众数是具有明显集中趋势点的数值，一组数据分布的最高峰点所对应的数值即为众数。当然，如果数据的分布没有明显的集中趋势或最高峰点，众数也可能不存在；如果有两个最高峰点，也可以有两个众数。只有在总体单位比较多，而且又明显地集中于某个变量值时，计算众数才有意义。

如果一组数据中存在离群值，中位数和众数一般不受离群值的影响，算术平均数容易受到离群值的影响。