python从word中取得完整的内容

#只关心word文档中的文本,不关心样式信息,就可以利用getText()函数
import docx
def getText(filename):
  doc=docx.Document(filename)
  fullText=[]
  for para in doc.paragraphs:
    fullText.append(para.text)
  return ' '.join(fullText)
print(getText('example.docx'))
#下面的代码可以实现同样的功能
doc2=docx.Document('example.docx')
#paragraphs是paragraph对象的列表 所以下面这个会显示数字
for i in range(0,len(doc2.paragraphs)):#获取段落的数量
  print(doc2.paragraphs[i].text)#text显示段落的文本

原文地址:https://www.cnblogs.com/shunguo/p/11399299.html