Tesseract-OCR text2image.exe [ x86 支持 XP ]

Tesseract-OCR 工具中的 text2image.exe ,下载其他人编译的在 win 系统都无法正常运行.
折腾了好久终于编译出能正常运行的.
--font="font name"  指定字体名字时需要用双引号, 不能用单引号.
--text="input file" 要输入的文本文件需要用 UTF-8 格式.

字体名字需要先运行 text2image --list_available_fonts 命令, 查看有效字体.
比如:
$ text2image --list_available_fonts
  0: Agency FB
  1: Agency FB Bold
  2: Agency FB Bold Oblique
  3: Agency FB Oblique
  4: Algerian
  5: Arial
  6: Arial Black, Heavy
  7: Arial Black, Heavy Oblique

想用第6个字体, 字体名字要写成 --font="Arial Black, Heavy"
字体名字中的逗号也一定要写.


_Tesseract-3.05-training-bin-win32-20160805-shared.7z
_Tesseract-3.05-training-bin-win32-20160808-static.7z
原文地址:https://www.cnblogs.com/nlsoft/p/5742118.html