Pandas也能修改样式?快速给你的数据换个Style!

前言

在之前的很多文章中我们都说过,Pandasopenpyxl有一个很大的区别就是openpyxl可以进行丰富的样式调整,但其实在Pandas中每一个DataFrame都有一个Style属性,我们可以通过修改该属性来给数据添加一些基本的样式。

使用说明

我们可以编写样式函数,并使用CSS来控制不同的样式效果,通过修改Styler对象的属性,将样式传递给DataFrame,主要有两种传递方式

  • Styler.applymap:逐元素
  • Styler.apply:列/行/表方式

Styler.applymap通过DataFrame逐个元素地工作。Styler.apply根据axis参数,按列使用axis=0,按行使用axis=1,以及axis=None作用于整个表。所以若使用Styler.applymap,我们的函数应返回带有CSS属性-值对的单个字符串。若使用Styler.apply,我们的函数应返回具有相同形状的Series或DataFrame,其中每个值都是具有CSS属性值对的字符串。

不会CSS?没关系,作为调包侠的我们大多是改改HTML颜色代码即可完成样式修改,下面看一些示例。

一些例子

基本样式

首先我们创建一组没有任何样式的数据

img

我们之前说过,DataFrame是有style属性的,所以在没有做任何修改的情况下,使用df.style应该和上图一样

img

现在让我们编写一个简单的样式函数,该函数可以将负数变为红色,使正数保持黑色。

def color_negative_red(val):

    color = 'red' if val < 0 else 'black'
    return 'color: %s' % color

现在来应用这段函数(思考Excel如何实现)

img

现在如果我们想突出显示每列中的最大值,需要重新定义一个函数

def highlight_max(s):

    is_max = s == s.max()
    return ['background-color: yellow' if v else '' for v in is_max]

因为之前我们是以元素为单位判断,所以使用的是.applymap,所以现在我们应对列进行.apply``操作

img

现在可以使用

df.style.applymap(color_negative_red).apply(highlight_max)

来混合修改样式或使用.实现

img

当然我们也可以通过修改样式函数并使用.apply来高亮整个DataFrame的最大值,

img

切片

当然我们也可以使用subset通过切片来完成对指定列进行样式修改,比如高亮部分列的最大值

df.style.apply(highlight_max, subset=['B', 'C', 'D'])

img

对于行和列切片,可以使用我们熟悉的.loc,不过目前仅支持基于标签的切片,不支持位置切片。

格式化输出

我们也可以使用Styler.format来快速格式化输出,比如将小数格式化为百分数

img

也支持使用字典或lambda表达式来更灵活的使用

img

当然是支持和之前的样式结合使用

img

内置样式

开发者们为了尽可能的让作为调包侠的我们使用起来更方便,已经内置了很多写好的样式,拿走就用,比如将空值设置为红色

img

或是结合seaborn使用热力图

img

现在我们就可以通过修改Styler.background_gradient来轻松的修改颜色等样式

img

最后我们可以将数据修改为条形图的样式,这也是我最喜欢的一个功能,能够快速的看出数据的变化!

img

在最新的版本中可以进一步自定义条形图:我们现在可以将df.style.bar以零或中点值为中心来快速观察数据变化,并可以传递颜色[color_negative, color_positive],比如使用align='mid'

img

以上就是对Pandas中如何修改样式的一个简单介绍,更多的操作可以在官方文档https://pandas.pydata.org/pandas-docs/stable/user_guide/style.html中找到与学习。

原文地址:https://www.cnblogs.com/liuzaoqi/p/13335217.html