PDF补丁丁将字符识别结果写入PDF文件功能即将完成

今天做出了一个新功能,PDF补丁丁在导出识别结果为XML文件后(见附图一:识别结果XML),可以将其重新写入PDF文档,变成可以检索的文本PDF(输出效果见附图二、附图三,为检查输出字符位置是否正确,特意将文字显示出来,在正式发布时文字将是隐形字符)。

目前尚有少量问题需要修复,将不日内将提供测试版下载。

附图一:识别结果XML 

 附图二: 输出效果(黑白竖排文本)

 附图三:输出效果二(JPEG灰度图片、横排文本)

原文地址:https://www.cnblogs.com/pdfpatcher/p/2234729.html