箱形图/盒图(转)

http://zh.wikipedia.org/wiki/%E7%AE%B1%E5%BD%A2%E5%9C%96

http://www.blogjava.net/norvid/articles/317235.html

箱形图英文Box-plot),又称为盒须图盒式图盒状图箱线图,是一种用作显示一组数据分散情况资料的统计图。因型状如箱子而得名。在各种领域也经常被使用,常见于品质管理。不过作法相对较繁琐。

箱形图于1977年由美国著名统计学家约翰·图基John Tukey)发明。它能显示出一组数据的最大值最小值中位数下四分位数上四分位数

举例[编辑]

以下是箱形图的具体例子:

                            +-----+-+       
  *           o     |-------|   + | |---|
                            +-----+-+    
                                         
+---+---+---+---+---+---+---+---+---+---+   數線
0   1   2   3   4   5   6   7   8   9  10

这组数据显示出:

  • 最小值(minimum)=5
  • 下四分位数(Q1)=7
  • 中位数(Med)=8.5
  • 上四分位数(Q3)=9
  • 最大值(maximum )=10
  • 平均值=8
  • 四分位间距(interquartile range)=Q3-Q1=2 (即ΔQ)

在区间 Q3+2(或3?)ΔQ, Q1-2(或3?)ΔQ 之外的值被视为应忽略(farout)。

  • farout: 在图上不予显示,仅标注一个符号∇。
  • 最大值区间: Q3+1.5ΔQ  ——如何推导?
  • 最小值区间: Q1-1.5ΔQ

最大值与最小值产生于这个区间。区间外的值被视为outlier显示在图上.

  • mild outlier = 3.5
  • extreme outlier = 0.5

外部链接[编辑]

原文地址:https://www.cnblogs.com/wxdlut/p/4480035.html