Ubuntu 上安装 OCR 扫描软件 gImageReader

gImageReader 是一款开放源码的 OCR(光学字符识别)扫描工具软件,支持 Linux 和 Windows 系统,用户可用来扫描 JPEG,PNG,TIFF,GIFF 或 PDF 文件或者从扫描仪直接导入的文件,并识别字符。

GitHub 地址:https://github.com/manisandro/gImageReader

添加 PPA --> 更新软件源 --> 安装软件:

sudo add-apt-repository ppa:sandromani/gimagereader
sudo apt update
sudo apt install gimagereader tesseract-ocr tesseract-ocr-eng tesseract-ocr-chi-sim tesseract-ocr-chi-tra  -y
sudo apt install tesseract-ocr-chi-sim-vert tesseract-ocr-chi-tra-vert  -y

卸载软件 --> 移除 PPA:

sudo apt remove gimagereader -y
sudo apt install ppa-purge -y
sudo ppa-purge ppa:sandromani/gimagereader

举例: 利用 gImageReader 识别下面两页图片中的字符。

图一:

图二:

操作步骤

  1. 打开 gImageReader
  2. 添加上面两页图片
  3. 识别语言选择 多种语言(Multilingual)=chi_sim+eng
  4. 依次选择图一图二进行识别
  5. 复制或保存识别文本

操作结果参照下图:


See also


寻找知识的源头,探索宇宙的奥秘。
知识的存放地址:人的大脑里、书里、互联网上、自然界里。
获取知识的最优路径:精品课程 > 精品书籍 > 官方文档 > 优质文章 > 与人交流(互为补充,构建知识体系)。
内外兼修,形神合一。

原文地址:https://www.cnblogs.com/keatonlao/p/12585750.html