Djangoueditor（富文本）纯文字提取及导出word实现下载

富文本在存储时是带有HTML代码的，因此在将富文本导出word文档时需要将富文本内容提取为纯文本

纯文字提取有两种方法推荐第二种

方法一：

后台导入包

from django.template.defaultfilters import striptags #提取富文本文字

需要提取处调用

text = striptags(obj_wen.ued) #obj_wen.ued为富文本存储在数据库中的名

原文本

输出纯文本

通过对比，该方法可以提取纯文本但对英文过滤不佳

方法二

采用djangoueditor官方文档的方法

在富文本编辑页面在前端获取纯文本内容然后通过表单存入后台

function getPlainTxt() {

text = UE.getEditor('id_content').getPlainTxt(); //获取富文本编辑器中纯文本

//document.getElementById("wenben").innerHTML=text;

$("#wenben").attr("value",text); //赋值给value传入后台

}

id_content为前端ueditor id 可通过打开该页面按F12查看如图：

提取结果

该方法基本完美解决英文纯文本提取，该方法需要注意在调用提取纯文字时需要在作者编辑完后开始，可写在表单提交时

导出为word并实现下载基本一致

首先导入python word包

from docx import Document

然后构建文档

document = Document() #docx函数

document.add_heading(obj_wen.biaoti, 0) #写入标题

text = (obj_wen.textfield) #数据库纯文本

#text = striptags(obj_wen.ued) #此为方法一 obj_wen.ued 为需要导出的ueditor在数据库存储的内容

document.styles['Normal'].font.name = u'黑体' #字体格式黑体

p = document.add_paragraph()

p.paragraph_format.alignment = WD_ALIGN_PARAGRAPH.CENTER #居中

run = p.add_run(text) #写入文字

导入包实现下载文件名实现中文

from django.utils.http import urlquote #中文文件名

response = HttpResponse(content_type='application/octet-stream') #缓存申明 octet-stream为文件类型

response['Content-Disposition']='attachment;filename="%s.doc"'% urlquote(obj_wen.biaoti) #下载说明文件名

document.save(response) #文件保存入缓存

return response

前端调用即可实现下载

希望对你有所帮助！