[转载]OCR原理

[转载]OCR原理

之前上某门课的时候一个project用到了OCR,但是是仅限于概念,没有自己实现。今天突发奇想,想看看主流的OCR实现方法是怎样的,下面这两篇文章说的非常好:

  1. https://mp.weixin.qq.com/s?__biz=MzA3MDExNzcyNA==&mid=402907292&idx=1&sn=889c4abcf576e24525ea6a705069c4de
  2. https://mp.weixin.qq.com/s?__biz=MzA3MDExNzcyNA==&mid=2650391990&idx=1&sn=a6f4607867441c60b00730afe53325a7#rd

上面的文章中用的不是机器学习和深度学习的方法,而是一些比较传统的方法,可能效果也是不错的,并且如果相关的开源资料足够多、效果足够好,不用计算机视觉也没什么,很可能速度还快点。但是这其实也是一个目标检测和实例分割的典型运用,选择合适的数据集跑出来效果应该会挺不错的。这就是我喜欢深度学习的地方:在具体问题上,不一定是最优的解,但是它足够的通用、迁移成本很低。

原文地址:https://www.cnblogs.com/jiading/p/12098307.html