四分位数(转)

http://zh.wikipedia.org/wiki/%E5%9B%9B%E5%88%86%E4%BD%8D%E6%95%B0

四分位数Quartile)是统计学分位数的一种,即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数。

概念[编辑]

  • 第一四分位数 (Q1),又称“较小四分位数”,等于该样本中所有数值由小到大排列后第25%的数字。
  • 第二四分位数 (Q2),又称“中位数”,等于该样本中所有数值由小到大排列后第50%的数字。
  • 第三四分位数 (Q3),又称“较大四分位数”,等于该样本中所有数值由小到大排列后第75%的数字。

第三四分位数与第一四分位数的差距又称四分位距InterQuartile Range, IQR)。

运算过程[编辑]

关于四分位数值的选择尚存争议[1]

主要选择四分位的百分比值(p),及样本总量(n)有以下数学公式可以表示:[2]

L_p = (n)left(cfrac{p}{100}
ight)
  • 情况1: 如果 L 是一个整数,则取 第 L 和 第 L+1 的平均值
  • 情况2: 如果 L 不是一个整数,则取下一个最近的整数。(比如  L = 1.2 , 则取 2 )

例如[编辑]

 
图示中箱形图(有四分位数及四分位距)和概率密度函数 为描述一个常规总量 N(0,1σ2)的分布情况

一个算法如下(可以兼用TI-83计算器):

  1. 利用中位数使数据分成两列(不要把中位数放入已分好的数列),
  2. 第一四分位数为第一组数列的中位数;第三四分位数为第二组数列的中位数。

以下例子可以用来参考。

例如 1
数据总量: 6, 47, 49, 15, 42, 41, 7, 39, 43, 40, 36
由小到大排列的结果: 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49

egin{cases}
Q_1  = 15 \
Q_2  = 40 \
Q_3 = 43
end{cases}

例如 2
数据总量: 7, 15, 36, 39, 40, 41

egin{cases}
Q_1 = 15 \
Q_2 = 37.5 \
Q_3 = 40
end{cases}

例如 3
数据总量: 1, 2, 3, 4

egin{cases}
Q_1  = 1.5 \
Q_2  = 2.5 \
Q_3 = 3.5
end{cases}

应用[编辑]

不论Q_1, Q_2, Q_3 的变异量数数值为何,均视为一个分界点,以此将总数分成四个相等部分,可以通过比较Q_1, Q_3 ,分析其数据变量的趋势。

参考文献[编辑]

原文地址:https://www.cnblogs.com/wxdlut/p/4479838.html