第四周

本周开始着手准备了中国软件杯比赛的作品,所以本周学习了使用python和tesseract-ocr来实现对一种图片里面文字的识别。

首先是要安装tesseract-ocr软件,这要到GitHub上去寻找安装包,下载好了之后开始安装:

 然后点击next

 继续点击next,展开最后一项选择语言chi_sim(简体中文)然后点击next

 选择安装路径,点击next

 点击安装,等待安装成功

 然后再在环境变量中写入安装的地址即可。

然后需要在pycharm中下载两个库:PIL和pytesseract,然后还要配置pytesseract.py文件

 

 

 将该处的地址修改为你本人的tesseract安装路径即可然后再编写代码,

 制定路径的图片中的信息就会打印出来了。

原文地址:https://www.cnblogs.com/lijiawei1-2-3/p/13513682.html