[转]常用OCR软件介绍

转载出处:http://blog.csdn.net/zhulinu/article/details/9095585

常用OCR软件介绍                          

 
1、ABBYY ***ABBYY FineReader 简介:驰名品牌,全球都在用,国外4大OCR公司之一,众多打印机、扫描仪都自带它为ocr软件。安装程序约300MB,选择词库安装后约500MB。 评价:功能齐全,众多软件中应该是第一。 缺点:占cpu/内存大。有时会识别出一些不存在的字(和正确的字很相像,但不存在。造字?) 友情提醒:Win有Corporate 和Professional (企业和专业)版,也有苹果Mac版,大家选自己要的。 ***ABBYY Screenshot Reader 简介: 功能类似汉王屏幕摘抄、Mini Ocr是专门OCR识别屏幕截图用的。
2、I.R.I.S. Readiris 简介:驰名品牌,全球都在用,国外4大OCR公司之一,众多印机、扫描仪都自带它为ocr软件。安装程序约200MB,选择词库安装后约100MB。 评价:功能可以,对表格的识别率ms比ABBYY FineReader高。没遇到FineReader的造字问题。 缺点:没自带校对功能。 友情提醒: 一定用Asian版,没写Asian的不支持中文! 导入图片时勾上“使用300dpi分辨率” 不然若图片不达标会弹出提示叫你从扫。 (废话,我要是有好的干嘛不用,设计师nc) Win有Corporate 和Professional (企业和专业)版,也有苹果Mac版,大家选自己要的。
3、汉王 简介:国产企业,值得支持 缺点:不支持多页单TIF文档 ***汉王文本王文豪7600 评价:功能满全的,自带的几个小工具不错(汉王拼图精灵、汉王屏幕摘抄、汉王照片摘抄) 友情提醒: 1.貌似该公司目前开发重点是硬件,2007后出了文本王文豪7600就没更新了。 2.网上一个366MB的是完整CD ,包括了Hwdochasp 和hwdocsafe 这两个文件夹,大家装hwdocsafe 文件夹里的。另166MB的是光光hwdocsafe 这个文件夹。 3.设置里选“忽略段内回车换行”。 4.汉王屏幕摘抄、汉王照片摘抄貌似是用特征库,效果跟Mini Ocr一样。所以识别结果跟文本王不一样。 ***汉王 PDF OCR 简介: 停止开发文本王但是品牌名声和功能还是要维护的。这个免费使用的才40MB。 评价: 什么PDF OCR啊?我的一个图像pdf就根本识别不了.... ***汉王尚书七号 简介:尚书OCR软件是MICROTEK中晶科技公司,向汉王科技购买授权,赠送给用户使用的旧版OEM软件。安装程序约60MB. ***Founder 方正OCR 简介:本来不想写这个的,方正OCR软件是方正公司,向汉王科技购买授权,赠送给用户使用的旧版OEM软件。安装程序约40MB. ***汉王文友 简介:旧版 ***超星阅览器 简介:向汉王买的技术。 ***RapidScan高速扫描影像优化OCR识别系统 简介:向汉王买的技术。
4、清华文通TH-OCR 简介:国产(清华+文通)+国外企业Scansoft Nuance,值得支持,与汉王不同的是清华国际知名度比较好。微软向他买技术,满多印机、扫描仪也带它为ocr软件。 评价:功能还可以,(可以把汉王认为是国内的FineReader ,清华则是Readiris....或者反过来?) 嗯nb!还带语音效稿! 缺点:不支持多页单TIF文档 友情提醒:"清华紫光OCR"是旧版 ***文通慧视小灵鼠 简介:简单的说就是增加了手写识别的增强版。 ***CAJViewer 简介:向清华买的识别程序。 ***《文档天地》综合管理与处理系统 简介:向清华买的技术。 ***netocr.net在线OCR 简介:
应用了由清华大学电子系研制的国际领先的最新OCR识别技术,提供一天之内不超过99幅图像的免费的文字识别服务。 还有后台人工校对识别。。。
由文通搞的,貌似搞不下去了。
6、Microsoft微软 简介:微软,nb公司啊!开玩笑,其实用清华(中文?)和Scansoft Nuance(英文?)的引擎。 Office Document Imaging Office OneNote 评价:用的像是清华早期的特征库。比较好笑的是,网上有人测试的比清华现在的词库识别好。 缺点:懒着写 友情提醒: 默认装了跟Office的相同语言的特征库,其他语言特征库手动添加,若装office多语言版ms就免了. ***老马的UnicornViewerPdg2PicTextForever 简介:套用微软yy过的OCR引擎和词库来实现批量OCR http://www.comicer.com/stronghorse/water/software/pdg2text.htm ***创华OCR 简介:套用微软yy过的OCR引擎和词库
7、Adobe Acrobat Pro 简介:Adobe,nb公司啊!开玩笑,其实是买IRIS Readiris的技术。 评价: 其实他的OCR技术也是给图片式PDF用的,识别后会在图片PDF的文字上附上识别文字,这样你可以拷贝pdf上的东西. (表达能力有限,类似onenote的使用方法) 缺点:没自带校对功能。 友情提醒:不是免费的Reader,是Acrobat Pro或Acrobat Pro Extended版
8、Mini Ocr 简介:作者马飞涛知道是谁不?是护花使者的作者。用他的话说:
我在开发护花使者反黄图像识别软件的时候,遇到有些图像里,嵌有某些文字,如果能 把文字识别出来,图像的含义就很容易让计算机理解了。

是的,专门设计给截图用的 评价:看看过滤效果,就知道多利害了吧,而且是他自制的特征库. 缺点:可惜无法手动选择识别区域 友情提醒:有点类似汉王屏幕摘抄、汉王照片摘抄
9、文粹OCR 简介:国产企业,值得支持。识别率不比汉王差! 缺点:功能不够强大、完善。 友情提醒: 去worldrobot.NET/download.html 下最新2009版。华军,天空的都不是最新版。 默认快捷方式“文粹OCR”是update.exe,为避免每次升级,把路径改成WencuiOcr.exe。 ***文粹在线OCR 貌似搞不下去了。
10、Newsoft 丹青文件辨识系统 MaxReader、Presto OCR 简介:应该是tw的Newsoft公司和国外Presto合搞的(这不重要)。 这Presto公司在9x年代买了ABBYY的识别引擎,然后丹青又买/合作/使用了Presto版的ABBYY识别引擎。(10年前旧版的ABBYY不支持中文,所以有的搞,不过现在。。。。) 评价:看他网上上吹的多nb(10年前的技术也敢吹?!),但是识别繁体竖排或简体都不见得有多好。安装程序越越约300MB,安装后130MB。 缺点:懒着写 友情提醒:我情愿用汉王,这不过是个旧版的ABBYY
11、Scansoft Nuance 简介:国外4大OCR公司之一,自己号称全球都在用(估计没算中国),微软、清华还向他买技术 ***OmniPage (最贵的,$499.99 ) ***PaperPort (才$79.99 ) ***TextBridge (才$79.99 ) 友情提醒+评价 缺点:吹的多nb。下一个MULTi LANGUAGE多语言版,500MB,吓一跳。打开后发现带2个软件OmniPage和PDFCreate5。我们当然装最贵的OmniPage咯,实际安装程序越越约300MB。选择安装后250MB,kao,中文词库只不过是做样子呢!难怪微软也同时向清华买OCR技术。
12、ExperVision TypeReader 简介:新人可能不知道,但是n年前还是满有名的。 (才$395.00 )同时也曾是国外4大OCR公司之一。 评价:ms2008年后就没更新,以前拿了n多奖,若oem盘有带,用来ocr英文还可以。 25MB。 缺点:不支持中文算不? 友情提醒:此东东不好下,没特别需要别下
13、赛酷OCR 简介:使用云系统来OCR,说土点就是叫你装一个客户端,把图片上传到服务器上,识别后再发回来。 优点:机子配置不好的,用这东东占资源少。客户端安装文件也小。 缺点: 识别率不咋的,可能还没丹青好。除了简体,繁体竖排根本不行。 机密文件你甲认为我会安心上传给你? 万一断网,偶要OCR咋办? 友情提醒:偶就纳闷,网上关于该软件的评价很高。 (有人发帖问用啥OCR软件好,基本上就有人回“用赛酷”)就首次使用送10次识别,网上可能有那么多有钱的潜水支持者?可见肯定是1毛党!
14、SimpleOCR 简介:本来不想写这个的,但是这免费的东东名声蛮大的,我不说,人家可能会去下。 缺点:不支持中文
15、奥普ocr 简介:停止开发的东东。

注1:以上,就前9名OCR软件值得试! 注2:在线网页OCR不实际 注3:该软件的比较写于2010年,估计5年内有效 注4:此贴由winny社长验证,内容非常包青天 注5:软件按引擎Engine+词库分类

 

备注:

本人测试过Tesseract,汉王,识别看看三款软件。

识别看看的识别率最高。好像是一个人开发的。牛啊。 顺便给他做个推广吧,http://blog.sina.com.cn/u/2863794612

原文地址:https://www.cnblogs.com/Crysaty/p/6080281.html