验证码破解分析

  突然发现好久没有写过博客了,不知曾经几时申请了这个园了,也不曾经几时来过一次...

就在前不久 编写一次网络爬虫程式中验证码功能 让我头痛了几天 如今破解了 虽不是最优的方法 但适合通用方法,废话就不多说了 

现将本人研究思路分享给大家,希望大家给出建议和批评 谢谢 ....

https://e-commerce.chinalife.com.tw/online/common/image.jsp

一.首先分析验证码的特点 是我们破解其关键.

我们发现 其验证码除字码外还有部分干扰线组成,并且干扰线与字码颜色一致,瞬间想死的心都有了 怎么办,怎么才能让其分开呢,

哈哈不要怕  我相信你能行了哦

二.不但的要给自己打气 ,不但提醒自己 ,我能行

   没有什么问题能难住我们的,只有我们放弃寻找解决问题的办法 ,废话不多说了 开始分析 寻找不同点吧!

仔细观察我们发现 字码与干扰线的像素点 不一样 , 并且他们之间像素分部密度不一样 ,这就是我们的突破口哦

三.去掉干扰线,噪点,得到干头净的字码

四.切图 得到我们想要的字码部分

   

五.将图片进行二值化 存入资料库

六.使用LevenshteinDistance求临进值 

结果如下 

以上网站仅供学习参考,请读者不要客意破坏他人网站,若造成非法行为,后果自负..

原文地址:https://www.cnblogs.com/tx720/p/5035232.html