python----openpyxl模块

一、openpyxl的介绍和安装

1.介绍

openpyxl是一个用来读写xlsx文件的Python库,官方文档https://openpyxl.readthedocs.io/en/stable/tutorial.html.

在使用openpyxl前先要掌握三个对象,即:Workbook(工作簿,一个包含多个Sheet的Excel文件)、Worksheet(工作表,一个Workbook有多个Worksheet,用表名识别,如“Sheet1”,“Sheet2”等)、Cell(单元格,存储具体的数据对象)三个对象。

2.安装

pip install openpyxl

二、工作薄基本操作

1.创建一个工作薄

from openpyxl import Workbook
wb = Workbook()  #创建一个工作簿,默认也至少创建了一个工作表
ws = wb.active   #获得正在运行的工作表,默认第0张;如果是已经存在的工作薄,获得的是打开Excel显示的工作表

2.打开已存在的工作簿

from openpyxl import load_workbook
wb = load_workbook("文件名称.xlsx")  #打开一个已存在的工作薄

3.保存工作簿

wb.save("文件名称.xlsx")  #保存工作簿,不写路径保存在当前文件夹

三、工作表的基本操作

1.创建表

ws1 = wb.create_sheet()  #创建一个工作表,默认位置是最后一个,默认名称是Sheet1(如果前面只有一张工作表);返回工作表
ws2 = wb.create_sheet("test",0) #创建一个工作表,表名是test,位置是第一个
ws3 = wb.create_sheet(title="test2",-1) #创建工作表,表名是test2,位置是倒数第二位

2.选择表

ws1 = wb["test"]  #选择表名是test的工作表
ws2 = wb.get_sheet_by_name("test")  #选择表名是test的工作表

3.表名

title = ws.title  #获取工作表的表名
ws.title = "newtitle"   #修改工作表的表名是newtitle
wb.sheetnames    #获取所有的工作表名称,返回一个列表
wb.get_sheet_names()   #获取所有的工作表名称,返回一个列表
for sheet in wb:   #打印所有工作表名称
    print(sheet)

4.工作表的标签颜色

ws.sheet_properties.tabColor = "B22222"  #设置工作表标签的背景颜色,使用RGB颜色16进制,RGB颜色参考https://tool.oschina.net/commons?type=3

5.删除工作表

del wb["Sheet2"]   #删除title是Sheet的工作表
wb.remove(wb["Sheet2"])   #删除title是Sheet2的工作表

6.复制工作表

ws = wb.copy_worksheet("wb["Sheet"])   #复制Sheet工作表,默认名称是Sheet Copy
ws.title = "Sheet的副本"    #把复制的工作表重命名为Sheet的副本

四、单元格的基本操作

1.获取单个单元格

#获取单个单元格
cell = ws["A1"]  #获取A1单元格,返回单元格<Cell 'Sheet1'.A1>
a = ws["A1"].value   #获取A1单元格的值

a = ws.cell(row=1,column=1).value   #获取A1单元格的值,也可以直接写ws.cell(1,1)第一个参数是行数,第二个参数是列数

2.按行或是按列获取单元格

#按行或是列获取
cells = ws["B"]  #获取第二列的单元格,返回一个元组;有数据或是格式都会被获取
for cell in cells:
    print(cell.value)   #打印第二列单元格的值

cells = ws[2]  #获取第二行的单元格,返回一个元组

#打印奇数行第二列的单元格的数据
for i in range(1,20,2):
    print(ws.cell(i,2).value)

3.获取所有单元格

#获取所有单元格
cells = list(ws.values)   #ws.values获取所有的单元格数据,返回一个生成器,list生成一个列表;列表里面是元组,每行数据组成一个元组
#再对cells进行切片,可以按行获取单元格
cells1 = list(ws.values)[1:3] #获取第二行和第三行
#按行打印所有的单元格
for row in ws.rows: #ws.rows返回一个生成器,返回工作表的所有行,每一行单元格由一个元组包裹;ws.rows直接写成ws也是一样的效果
  for cell in row:
    print(cell.value)
#按列打印所有的单元格
for column in ws.columns: #ws.columns返回一个生成器,返回工作表的所有列,每列单元格由一个元组包裹
  for cell in column:
    print(cell.value)

4.获取区域单元格

#获取区域单元格
cells = ws["A1":"C5"]  #获取A1到C5区域,返回列表,列表里面是元组,每行单元格组成一个元组
for row in cells:
    for cell in row:
        print(cell.value)  #按行打印
#按行
cells = ws[5:10]  #获取第5到10行单元格,返回列表,列表里面是元组,每行单元格组成一个元组
#按列
cells = ws["A:C"]  #获取第A列到第C列,返回列表,列表里面是元组,每列单元格组成一个元组

#按行
cells = ws.iter_rows(min_row=2,min_col=2,max_row=4,max_col=4)  #按行获取单元格,返回列表,列表里面是元组,每行单元格组成一个元组
#按列
cells = ws.iter_cols(min_row=2,min_col=2,max_row=4,max_col=4)  #按列获取单元格,返回列表,列表里面是元组,每列单元格组成一个元组

5.数字字母转换

#Excel的列用字母表示,有时需要转换字母和数字
#数字转字母
a = openpyxl.utils.get_column_letter(23)
print(a)
#字母转数字
b = openpyxl.utils.column_index_from_string("h")
print(b)

6.获取最大行和最大列

#获取工作表的做大行最大列
max_row = ws.max_row  #获取工作表的最大行,返回数字
max_column = ws.max_column  #获取工作表的最大列,返回数字
#用最大行和最大列来按行获取工作表数据
for row in range(1,max_row+1):
  for col in range(1,max_col+1):
    print(ws.cell(row,col).value)

7.写入单元格

#写入单元格
ws["A1"] = 1  #在A1位置写入1
ws["A2"].value = 2  #在A2位置写入2
ws.cell(3,1,value=3)  #在第3行第1列(A3)写入3
ws.append([1,2,3,4])  #在最后一行的下一行写入,即在A4写入1,B4写入2...

8.插入或删除

#插入行
ws.insert_rows(idx=2,amount=3)  #在第2行前插入3行,也可以省略idx和amount
#插入列
ws.insert_columns(2,3)   #在第2列前插入3列
#删除行
ws.delete_rows(2,3)    #删除第2行开始的3行
#删除列
ws.delete_columns(2,3)   #删除第2列开始的3列

9.移动单元格

#移动单元格,rows是正数,向下移动,负数向上移动;cols是正数向右移动,负数向左移动
ws.move_ range("A1:B3",rows=10,cols=10)  #把"A1:B3"单元格向下移10行,向右移10行;移动之前的位置变为空,移动之后的位置如果之前有数据,覆盖原数据

10.冻结单元格

#冻结单元格,如果要冻结首行就写"A2",如果要冻结上面2行和左边2列,就写"C3"
ws.freeze_panes = "A2"   #冻结首行

五、实例

1.将每张表中固定单元格的数据聚合

#求一月、二月、三月的D9单元格的和
from openpyxl import load_workbook

wb = load_workbook("实例1.xlsx")
list = []
for sheet in wb.worksheets:
    list.append(sheet["D9"].value)
print(list)
sum1 = sum(list)
print(sum1)

#列表推导式
sum2 = sum([sheet["D9"].value for sheet in wb.worksheets])
print(sum2)

2.按行或是按列聚合

      

#按行或是按列聚合,加入总分和平均分
from openpyxl import load_workbook

wb = load_workbook("实例2.xlsx")
ws = wb.active
max_row = ws.max_row  #获取最大行号
max_col = ws.max_column  #获取最大列号
#在列后加入总分
ws.cell(1,column = max_col+1,value="总分")   #在最大列后面写入“总分”
for row in ws.iter_rows(min_row=2,min_col=2,max_col=max_col):   #选取分数的范围
    list = []
    row_index = row[0].row  #获得行号,返回数字
    for col in row:
        list.append(col.value)
    ws.cell(row_index,max_col+1,value=sum(list)) #在每一行的最后写入总分

#在行后加入单科平均分
ws.cell(max_row+1,1,value="单科平均分")
for col in ws.iter_cols(min_row=2,min_col=2,max_row=max_row):
    col_index = col[0].column  #获取列号,返回数字
    list = [cell.value for cell in col]  #列表推导式获取范围内每列的数字
    ws.cell(max_row+1,col_index,value=round(sum(list)/len(list),2))  #写入平均分,且保存2位小数;round(a,2)a保存2位小数
wb.save("实例2.xlsx")

3.筛选

     

#筛选
from openpyxl import load_workbook

wb = load_workbook("实例2.xlsx")
ws = wb["Sheet2"]
for row in ws.iter_rows(min_row=2,min_col=2):
    for cell in row:
        print(cell.value)
        if cell.value == None:   #如果单元格的值是空,写入“缺考”
            cell.value = "缺考" 
        elif cell.value < 60:   #如果单元格的值小于60,加上“(不及格)”
            cell.value = str(cell.value) + "(不及格)"              
wb.save("实例2.xlsx")
#删除低于总分低于250的行
from openpyxl import load_workbook

wb = load_workbook("实例2.xlsx")
ws = wb["Sheet3"]
for row in range(ws.max_row,1,-1):  #row表示行号,因为Excel删除一行之后,下面的数据会上移,行号会变,所以要从下往上删除
    s = sum([cell.value for cell in ws[row][1:]])  #除去第一列,计算一行数据的和为总分
    if s < 250:
        ws.delete_rows(row)
wb.save("实例2.xlsx")

4.将单表拆成多表

    

#将表格按班级拆分
from openpyxl import load_workbook

wb = load_workbook("实例3.xlsx")   #打开工作薄
ws = wb.active  #获取工作表
dict = {}  #字典记录工作表数据
for row in ws.iter_rows(min_row=2):  #获取第二行开始的所有行数据
    row_data = [cell.value for cell in row]  #列表推导式获得每行的数据
    if row_data[1] in dict.keys():   #如果班级在字典的键里;row_data表示班级,以班级为键;
        dict[row_data[1]] += [row_data]   #把行数据添加到键的值里面;需要把列表再用一层列表包裹,包裹之后会把列表整个添加;不然+会把列表里的值一个个添加
    else:
        dict[row_data[1]] = [[cell.value for cell in ws[1]]]   #如果班级不在键里,先加上表格第一行的表头
        dict[row_data[1]] += [row_data]  #再添加行数据
for key,value in sorted(dict.items()):  #把字典进行排序
    ws = wb.create_sheet(key)  #创建工作表,表名是键名
    for data in value:  #添加数据
        ws.append(data)
wb.save("实例3.xlsx")

六、单元格的其他操作

1.合并单元格和取消合并

ws.merge_cells("A1:C5")  #合并A1到C5的单元格,如果都有数据,保留A1的数据
ws.merge_cells(start_row=1,end_row=5,start_column=1,end_column=3)  #合并A1到C5的单元格
ws.unmerge_cells("A1:C5")  #取消合并单元格

2.公式

打开工作薄用data_only=False(默认),写入公式之后,保存文件;再用data_only=False打开,打印单元格的value是公式;用data_only=True打开,打印value是None。

要获取单元格的value是数字,要手动打开Excel之后保存,再用data_only=True打开,打印单元格的value是数字,不能保存;用data_only=True打开之后保存,就只有数字没有公式了。

from openpyxl import load_workbook

wb = load_workbook("实例2.xlsx")
ws = wb["Sheet4"]
ws["D6"] = "=sum(D2:D5)"  #使用excel公式
print(ws["D6"].value)   #打印出来的值是公式=sum(D4+D5)
wb.save("实例2.xlsx")
#如果要读取出数据,需要手动打开Excel表保存,openpyxl打开Excel时使用data_only=True,不保存
wb = load_workbook("实例2.xlsx")
print(wb["D6"])   #打印数字

3.分组

ws.column_dimensions.group("A","C")  #按列分组,A到C列为一组
ws.row_dimensions.group(1,3,hidden=True)  #按行分组,1到3行为一组,hidden=True表示隐藏分组的行

 4.批注

#批注
c = openpyxl.comments.Comment("这是一个注释","张三")  #Comment(text, author, height=79, width=144)   
ws["K1"].comment = c  #给单元格设置批注

5.字体

Font(name=None, sz=None, b=None, i=None, charset=None, u=None, strike=None, color=None, scheme=None, family=None, size=None, bold=None, italic=None, strikethrough=None, underline=None, vertAlign=None, outline=None, shadow=None, condense=None, extend=None)

  •  name:字体名称,中文字体名称前面要加u;例u"微软雅黑"
  • sz/size:字体大小,单位px
  • b/bold:是否加粗;True加粗,False不加粗
  • i/italic:是否倾斜;True倾斜,False不倾斜
  • u/underline:下划线;single单下划线,double双下划线,singleAccounting会计用单下划线,doubleAccounting会计用双下划线
  • strike/strikethrough:是否显示删除线,True显示删除线,False不显示删除线
  • verAlign:superscript上标,subscript下标,baseline
  • color:字体颜色,RGB颜色十六进制表示
#设置字体
f = openpyxl.styles.Font(name=u"微软雅黑",sz=16,bold=True,vertAlign="baseline",color="DC143C")
ws["A1"].font = f  #只能设置单个单个单元格,如果需要设置区域,要循环设置
#获取字体
f1 = ws["A1'].font

6.对齐

Alignment(horizontal=None, vertical=None, textRotation=0, wrapText=None, shrinkToFit=None, indent=0, relativeIndent=0, justifyLastLine=None, readingOrder=0, text_rotation=None, wrap_text=None, shrink_to_fit=None, mergeCell=None)

  • horizontal:水平对其方式;"general"常规, "left"靠左, "center"居中, "right"靠右, "fill"填充, "justify"两端对齐, "centerContinuous"跨列剧中, "distributed"分散对齐
  • vertical:垂直对齐方式;"top"顶部, "center"居中, "bottom"底部, "justify"两端对齐, "distributed"分散对齐
  • textRotation/text_rotation:指定文本旋转角度
  • wrapText/wrap_text:是否自动换行
  • shrinkToFit/shrink_to_fit:是否缩小字体填充
  • indent:指定缩进
#设置对齐
a = openpyxl.styles.Alignment(horizontal = "center",vertical = "center")
ws["c1"].alignment = a

7.边框

Side(style=None, color=None, border_style=None)

  • style:边线样式;'dashDot','dashDotDot', 'dashed','dotted', 'double','hair', 'medium', 'mediumDashDot', 'mediumDashDotDot','mediumDashed', 'slantDashDot', 'thick', 'thin'
  • color:边线颜色

Border(left=None, right=None, top=None, bottom=None, diagonal=None, diagonal_direction=None, vertical=None, horizontal=None, diagonalUp=False, diagonalDown=False, outline=True, start=None, end=None)

  • left:左边框
  • right:左边框
  • top:上边框
  • bottom:下边框
  • diagonal:对角线
#边框
s = openpyxl.styles.Side(style = "medium",color = "FF69B4")  #设置边线样式
b = openpyxl.styles.Border(left = s, right = s, top = s, bottom = s)  #设置边框
ws["c2"].border = b

8.填充

PatternFill(patternType=None, fgColor=Color(), bgColor=Color(), fill_type=None, start_color=None, end_color=None)

  • patternType/fill_type:填充样式;'none'不填充,'solid'实心填充,'darkGray'75%灰色,'mediumGray'50%灰色,'lightGray'25%灰色
  • fgColor/start_color:前景颜色
  • bgColor/end_color:背景颜色
#填充
f = openpyxl.styles.PatternFill(fill_type = "mediumGray", end_color ="FF69B4")
f1 = openpyxl.styles.PatternFill(fill_type = "mediumGray",start_color = "FF69B4")
ws["C3"].fill = f
ws["C4"].fill = f1

9.设置行高和列宽

Excel的默认行高是13.5,默认列宽是8.38;即使行高和列宽被设为0,行高最小也是13.5,列宽最小是8.38

#行高,行高的单位是磅,1个单位=0.3612毫米
ws.row_dimensions[3].height = 50  #设置工作表的第三行的高度是50个单位
#列宽,列宽的单位是0.1英寸,一个单位=2.2862毫米
ws.column_dimensions["C"].width = 50   #设置工作表的C列是50个单位

10.插入图片

#插入图片;必须安装Pillow库,不然会报错"You must install Pillow to fetch image objects"
img = openpyxl.drawing.image.Image("E:\图\1\1.jpg")  #创建图片对象
img.height = 100  #设置图片的高,单位是px
img.width = 100  #设置图片的宽,单位是px
ws.add_image(img,"A10")  #在A10位置插入图片

11.插入图表

11.1 柱状图

#制作柱状图
from openpyxl import load_workbook
from openpyxl import chart

wb = load_workbook("实例3.xlsx")
ws = wb["Sheet1"]

#创建一个柱状表对象
c = chart.BarChart()
#设定数据范围
data = chart.Reference(ws,min_row = 1, max_row = 4, min_col = 2, max_col = 4)
#设置x轴的项目
x = chart.Reference(ws, min_row = 2, max_row = 4, min_col = 1)
#柱状图添加数据
c.add_data(data,titles_from_data=True)
#柱状图添加X轴
c.set_categories(x)
#在工作表中添加柱状图
ws.add_chart(c,"F1")

wb.save("实例3.xlsx")

11.2 折线图

# 制作折线图
from openpyxl import load_workbook
from openpyxl import chart

wb = load_workbook("实例4.xlsx")
ws = wb.active
#创建一个折线图对象
c = chart.LineChart()
#设定数据范围
data = chart.Reference(ws, min_row=2, max_row=3, min_col=1, max_col=13)
#设置x轴项目
x = chart.Reference(ws, min_row=1, min_col=2, max_col=13)
c.add_data(data, from_rows=True, titles_from_data=True)  #因为title在行首,from_rows=True
c.set_categories(x)
#在工作表的B5位置添加折线图
ws.add_chart(c,"B5")
wb.save("实例4.xlsx")

11.3 饼状图

#饼图
from openpyxl import load_workbook
from openpyxl import chart

wb = load_workbook("实例4.xlsx")
ws = wb["Sheet2"]
pie = chart.PieChart()
data = chart.Reference(ws, min_row=2, max_row=7, min_col=2)
x = chart.Reference(ws, min_row=2, max_row=7, min_col=1)
pie.add_data(data)
pie.set_categories(x)
pie.title = "饼状图"   #设置饼状图的标题
ws.add_chart(pie,"D1")
wb.save("实例4.xlsx")
原文地址:https://www.cnblogs.com/he-202007/p/14338762.html