[转载]OCR原理

之前上某门课的时候一个project用到了OCR，但是是仅限于概念，没有自己实现。今天突发奇想，想看看主流的OCR实现方法是怎样的，下面这两篇文章说的非常好：

https://mp.weixin.qq.com/s?__biz=MzA3MDExNzcyNA==&mid=402907292&idx=1&sn=889c4abcf576e24525ea6a705069c4de
https://mp.weixin.qq.com/s?__biz=MzA3MDExNzcyNA==&mid=2650391990&idx=1&sn=a6f4607867441c60b00730afe53325a7#rd

上面的文章中用的不是机器学习和深度学习的方法，而是一些比较传统的方法，可能效果也是不错的，并且如果相关的开源资料足够多、效果足够好，不用计算机视觉也没什么，很可能速度还快点。但是这其实也是一个目标检测和实例分割的典型运用，选择合适的数据集跑出来效果应该会挺不错的。这就是我喜欢深度学习的地方：在具体问题上，不一定是最优的解，但是它足够的通用、迁移成本很低。