基于水平投影，垂直投影的字符图像分割思路和代码实现

首先介绍算法思路：图像对应方向的投影，就是在该方向取一条直线，统计垂直于该直线（轴）的图像上的像素的黑点数量，累加求和作为该轴该位置的值；基于图像投影的切割就是将图像映射成这种特征后，基于这种特征判定图像的切割位置（坐标），用这个坐标来切割原图像，得到目标图像。

其实，可以用多次的腐蚀后再膨胀进行边界定位处理，但是如果图像（比如打印字体）非常规范，简单的投影就可以了。

java代码实现：

java的图像处理，这里大部分是由im.read读取，bufferedimage，然后转为二值bitset做处理（0，1或者说是true和false，一个bitset是整张图片的0，1像素值的一维行向量。bitset.length=width*height）

/**

* 图像向x轴做投影后的数组

* @param imagedata

* @param w

* 宽

* @param h

* 高

* @return

public static int[] xpro(BitSet bitSet, int width, int height) {

int xpro[] = new int[width];

for (intj = 0; j < width; j++) {

for (inti = 0; i < height; i++) {

if (bitSet.get(i *width + j) ==true)

xpro[j]++;

}

returnxpro;

}

/**

* 图像向y轴做投影后的数组

* @param imagedata

* @param w

* @param h

* @return

public static int[] ypro(BitSet bitSet, int width, int height) {

int ypro[] = new int[height];

for (inti = 0; i < height; i++) {

for (intj = 0; j < width; j++) {

if (bitSet.get(i *width + j) ==true)

ypro[i]++;

}

returnypro;

}

public static Rectangle[] yproSegment(int[] ypro, int width,int height) {

ArrayList<Integer> lline =new ArrayList<Integer>();

ArrayList<Integer> rline =new ArrayList<Integer>();

// 两种情况：sku区域起始位置元素为空白区域；起始位置含字符元素

if (ypro[0] != 0) {

lline.add(0);

}

for (inti = 4; i < height; i++) {

if (ypro[i] > 0 &&ypro[i - 1] > 0 &&ypro[i - 2] > 0

&& ypro[i - 3] > 0 &&ypro[i - 4] == 0) {

lline.add(i-4);

} else if (ypro[i] == 0 &&ypro[i - 1] > 0 &&ypro[i - 2] > 0

&& ypro[i - 3] > 0 &&ypro[i - 4] > 0) {

rline.add(i);

}

if (ypro[ypro.length - 1] != 0) {

rline.add(height);

}

List<Rectangle> c = new ArrayList<Rectangle>();

for (inti = 0; i < rline.size(); i++) {

if (rline.get(i) != 0 &&lline.get(i) <rline.get(i)) {

c.add(new Rectangle(0,lline.get(i),width, rline.get(i)-lline.get(i)));

} else {

break;

}

return c.toArray(new Rectangle[0]);

}

matlab代码实现：

python代码实现：