使用win32com操作woord的方法记录

CSDN博客平台中有众多的 win32com 库操作word 的说明,对于通用的内容将一笔带过,主要介绍目前看来独一无二的内容。

import win32com
from win32com.client import Dispatch
#导入库
word_app = win32com.client.Dispatch('Word.Application')
#调用word程序
word_app.Visible = 0
word_app.DisplayAlerts = 0
#不在前台显示文档及错误,在实际使用阶段可以全部关闭,提高运行速度,但是在调试时打开还是用处挺大的,可以对操作是否实现自己的需求进行直观的判断,比如说我们选中的内容是否已经高亮等等。
doc = word_app.Documents.Open(u'C:\模板.doc')
#文档路径,暂时未尝试路径能否直接使用变量解决
#路径前的u还是必要的,尤其是路径中存在中文时,否则会报错
title_list = []
for lenth in range(0,len_tables):
#这里的len_tables是在其他函数中已经定义的变量,其为读取的整个文档表格个数。
    table_index = lenth + 1
    #个人感觉win32com库操作word时也用到了很多vba的功能,例如很多代码就和vba比较相似,但是又有一些不同,所以在操作时报错报到怀疑人生。
    #在这里doc.Range().Tables(table_index)中,表格的序号不再是从0开始,而是从1开始。
    for i in range(0,5): 
    #循环获取指定表格前的第一段文字,一般第一段文字就是表格标题,绝大多数的文档排版后表格前一般会有一段空行,但一般也不会太多。
        x = doc.Range().Tables(table_index).Range.Start
        #获取表格开始的位置,即在整个word文档中的位置
        f = doc.Paragraphs(doc.Range(0,x).Paragraphs.Count - i).Range()
        #获取最后一段的内容,其原理为先计算从文档开头到表格开始时总共有几段,然后从最后一段开始向前数
        if f.replace(" ","").replace("
","").replace("
","") != "":  
        #去除换行符及空格影响,并且判断是否为空行。
            title_list.append(f)
            #将获取的表格标题放到列表中,由于列表有顺序,之后取用也就方便多了。
            break
    doc.Close()
    #关闭文档
    word_app.Quit()
    #关闭word程序

核心内容卸载代码注释里面,逐行解释代码更直观明确。

文章主要时想来说明如何将word中的表格和段落结合操作,核心思想寻找段落或者表格在

文档中的定位,在根据定位进行下一步的操作

原文地址:https://www.cnblogs.com/jcjc/p/11353231.html