linux tesseract识别名片

用tesseract识别名片,无任何训练



数字,字母识别的准确率比较高,没有错误,规范的汉字识别的还可以,比如名片背面,正面的就错误比较多了;

没有任何训练,识别的还算可以了;我们主要要的电话和QQ

 712  wget https://github.com/tesseract-ocr/tessdata/blob/master/chi_sim.traineddata
  713  ls -lth
  714  rm chi_sim.traineddata #下载太慢了,还是用浏览器下载快,然后上传过去
  715  rz -e
  716  ls
  717  tesseract test.jpg result -l chi_sim
  718  cp chi_sim.traineddata /usr/local/share/tessdata/
  719  sudo cp chi_sim.traineddata /usr/local/share/tessdata/
  720  tesseract test.jpg result -l chi_sim


原文地址:https://www.cnblogs.com/mtcnn/p/9410036.html