tesseract-ocr安装问题

今天安装tesseract-ocr的时候,载了坑,记录一下。

1. 安装时语言库的选择,我把 aditional language data 这一项全选中了,装的时候那叫一个慢啊,差不多3个小时装好的。如果不是必要的话,建议选择其中的一部分去安装。

2. 安装好了,在命令行里直接输入 “tesseract“  也是没有问题,但是在实际使用的过程中,总是报错。如下

Traceback (most recent call last):
  File "C:/Users/Administrator/******.py", line 6, in <module>
    print(tesserocr.image_to_text(image))
  File "tesserocr.pyx", line 2400, in tesserocr._tesserocr.image_to_text
RuntimeError: Failed to init API, possibly an invalid tessdata path: C:ProgramDataAnaconda3

最简单的解决方法,一个是检查环境变量的问题。

另一个就是,将C:Program Files (x86)Tesseract-OCR目录(tesseract-ocr默认安装目录)下的tessdata文件夹拷贝到C:ProgramDataAnaconda3目录,就是报错信息的最后,那个目录。

有问题可以留言,可能解决方法并不适用各种情况,大家一起研究。

原文地址:https://www.cnblogs.com/zrmw/p/9740339.html