2.DB算法及代码问题分析

1. 大量文本框丢失:

原因一:opencv 轮廓近似:

epsilon值设置偏大,导致不足四个点,进而导致后续必要的处理将其滤掉(此工程后续处理必须大于四个点才能正常进行)

原因二:short_side过滤:

最短边小于设置的阈值,将会当做干扰滤掉

2.部分模糊文本框丢失:

原因一:thresh设置大了:

预测第一步的pred通过thresh二值化成bitmap时,可能造成该区域较多内部像素无效变黑,进而拉低box的平均值得分

原因二:box_thresh设置大了:

模糊区域的box平均值得分较低,低于box_thresh的将会被滤掉

3.边界线不准确:

原因一:thresh决定:

边界轮廓由bitmap二值图正成,thresh分割直接决定轮廓形状

原因二:opencv轮廓近似影响:

轮廓近似可能轻微改变轮廓形状

方法三:cv2.minAreaRect(points):

不治本但很治标的方法,找到最小外接矩形,直接画成矩形

4.区域分隔不连通改善:

原因一:thresh决定:

降低thresh,放进来更多像素,可能连通部分模糊区域

原文地址:https://www.cnblogs.com/shendaw/p/13847000.html