识别验证码,你有几分成功率?

http://aoingl.iteye.com/blog/1389232 现 在验证码几乎在任何一个网站的交互界面中都存在,目的当然是为了防止恶意程序的攻击。如果我们想获取到验证码,就需要从这个验证码的图片中分析出来到底是什么字符。这就需要 OCR 技术。

  Optical character recognition(OCR)   是指从扫描的图片或者手写的输入转换成相应的字符的技术。大家用到最多的是手机上的手写功能,或者手写板。有 2 个 OCR 项目大家用的比较多: 1. Tesseract OCR 2. Asprise OCR , 其中 Tesseract OCR 是开源的, Asprise 是商业的。另外, 我还发现了一个基于纯 java 实现的 OCR 项目: Java OCR , 目前还只是 Alpha 版本。

原文地址:https://www.cnblogs.com/svennee/p/4089743.html