基于笔画宽度变换的自然场景文本检测方法

依据:自然场景中的文字笔画倾向于固定的宽度。

检测流程如下图:

笔画宽度的算法如下:

首先将图像中每个像素的笔画宽度值设置为无穷大。

(1)利用边缘检测算子(Canny)对图像I(x,y)进行边缘检测,可以得到每个边缘像素点都具有一个方向梯度值;

(2)假设p为一个边缘像素点,Dp为其梯度方向,按照梯度方向沿着路线r=p+Dp*n(n>=0)寻找另一个边缘象素点q,Dq为这个像素点的梯度方向,Dp和Dq方向相反;

在这个步骤中,如果没有找到q或者二者的梯度方向不是相反的,则重新寻找;找到之后计算||p-q||;

(3)重复步骤(2)找到所有的笔画宽度值。

笔画宽度用于文本定位的原理是:如果相邻像素的笔画宽度大致相等则可能会被合并起来,一般约定2个相邻的笔画宽度比不超过3。

候选区域的筛选步骤如下:

(1)噪声的消除。单个的字符一般不会出现在图像中,出现后按照随机噪声消除。

(2)候选区域的面积。若面积小于20像素被删除。

(3)候选区域的笔画宽度。变化太大的区域将被消除。

(4)候选区域的长宽比。一般在0.1到10之间。

(5)候选区域的字符大小。字符高度像素一般在10-300之间。

原文地址:https://www.cnblogs.com/1510152012huang/p/5767269.html