OCR之表格识别

在杂七杂八的事中坚持处理表格的OCR,历经一周时间,终有阶段结果。

主要工作:

自动分区、文字识别。

象这样一个表格:

自动分区后,得到正确分区效果:

其中,各分区模块颜色配置:

文字识别结果:

识别正确率在70%-80%。可以手动校对:

剩下的工作是自动生成WORD与PDF。这两项工作完成后,可以定一版了。

6.10前预交付市场。

原文地址:https://www.cnblogs.com/drgraph/p/3116281.html