箱线图+小提琴图学习[转载]

转自:https://blog.csdn.net/ac540101928/article/details/79235591

1.概念

//从上图中,那么可以看出上限和下限都是加上1.5IQR,应该长度是一样的,但是为什么大多数图中,两者长度就不相同?就像第一张图?

//上边缘——上四分位数的虚线长度和下四分位数——下边缘的虚线长度并不一样,好绝望啊。

//

2.分位数

百度百科中的计算方法:

不大明白。

3.例子

这里计算上下四分位数只是单纯的使用了中位数,求出全局中位数以后呢,分别在两边递归求。

从图中可以看出,对于上下界的选取只是单纯的是用了min和max。

当前的图可分为4段,下界——下四分位点,反应 1 1 2 2 这四个数;

下四分位点——中位数,3 3 4 4;

中位数——上四分位点,7 8 10 11;剩下的就是一个段了。

评论中有指出:

但是到底具体的求分数的方法是什么呢?真的没有找到....

下面是Python中的一个例子:

像查看percentile函数到底是如何计算的,发现它又调用了很多函数,看不太懂。

//这里关于上界,明显不是用Q3+1.5IQR计算出来的,如果是的话那么应该是=7.5+1.5(7.5-2.5)=15,很明显不是。。。

//也许是由不同的计算方法吧,所以结果不同,但是总体来说箱线图是可以反映中位数及异常值分布的。

原文地址:https://www.cnblogs.com/BlueBlueSea/p/10066805.html