基于金字塔的模板匹配算法

  在目标检测过程中,常用的方法就是设置一个模板,以滑动窗口的形式遍历整幅源图像(待检测的图像);每次滑动都会产生一个和模板等大小的ROI图像,基于某种度量方式,计算模板与当前ROI图像的相似性度量值。这样遍历完整幅图像后就会形成一个图像,找出最大值对应的位置(x,y),它就是我们要寻找的目标的位置。

  上面是模板匹配大致的步骤,当源图像很大,遍历完整幅图像很耗时,故提出了基于金字塔的模板匹配方法,下面是该方法涉及到几点:

  (1) 设置金字塔层数nLevels,创建源图像和模板图像对应的nLevels层金字塔图像;

  (2) 创建每层金字塔图像时,涉及到降采样(除以2),降采样后会出现锯齿,需要采用平滑滤波器进行处理;高斯平滑滤波器效果好但耗时,可以直接采用小模板的均值滤波器;

  (3) 计算模板与ROI图像的相似性值时,需要选择相似性度量准则;相似性度量准则有SAD(绝对值总和),SSD(平方差总和)和NCC(归一化相关系数),NCC的计算最耗时但效果最好,能很好的适应光照变化。

  理解了大致的流程和涉及到的操作后,可以直接写代码,金字塔匹配算法如下:

  1 function [r,c,nccImg] = pyramidMatch(img, template, nLevels)
  2 % -------------------------------------------------------------------------
  3 % 采用金字塔匹配算法进行模板匹配
  4 %
  5 % 过程:(1)为待匹配的图像和模板图像创建nLevels层金字塔图像
  6 %       (2)从金字塔最高层开始进行匹配,最高层的要完全扫描匹配,得到的最佳匹配位置
  7 % 后向下层传递(乘以2);根据传递的位置,在5*5的窗口范围内进行扫描匹配,如此这样
  8 % 直到最低层。
  9 %       (3)匹配时采用的相似性度量为归一化相关系数
 10 %       (4)创建金字塔时进行了降采样(除2),然后用2*2的平滑滤波器进行了处理
 11 % 
 12 % img-- 源图像(这里假设为灰度图)
 13 % template-- 模板图像(假设为灰度图)
 14 % nLevels-- 金字塔层数
 15 % @r,c-- 源图像中最匹配的位置
 16 % @nccImg-- 进行金字塔匹配时每层对应的归一化相关系数图像
 17 %
 18 % Author: L.L.He
 19 % Time: 26/7/2014
 20 %%-------------------------------------------------------------------------
 21 imshow(img);
 22 hold on;
 23 [t_r,t_c] = size(template);
 24 nccImg = cell(nLevels, 1);
 25 % 这里计算待匹配图像和模板的图像金字塔
 26 nStep = 2; %5*5
 27 srcPrad = pyramid(img, nLevels);
 28 temPrad = pyramid(template, nLevels);
 29 [r,c,nccImg{nLevels}] = matchTemplate(srcPrad{nLevels}, temPrad{nLevels});
 30 for i=nLevels-1:-1:1
 31     r_start = 2*r - floor((size(temPrad{i},1)-1)/2) - nStep;
 32     r_end = r_start+2*nStep+1;
 33     c_start = 2*c - floor((size(temPrad{i},2)-1)/2) - nStep;
 34     c_end = c_start++2*nStep+1;
 35     [r,c,nccImg{i}] = matchTemplate(srcPrad{i}, temPrad{i},...
 36                       r_start, r_end, c_start, c_end);
 37 end
 38 c_r = round(t_r/2);
 39 c_c = round(t_c/2);
 40 rectangle('Position',[c-c_c+1,r-c_r+1,t_c,t_r], 'edgecolor', 'r');
 41 end
 42 % -------------------------------------------------------------------------
 43 
 44 % =========================================================================
 45 % 模板匹配算法
 46 function [objr, objc, ncc_Img] = matchTemplate(img, template, r_start, ...
 47                                 r_end, c_start, c_end)
 48 [src_r,src_c] = size(img);
 49 [t_r,t_c] = size(template);
 50 if nargin == 2
 51     r_start = 1;
 52     r_end = src_r-t_r+1;
 53     c_start = 1;
 54     c_end = src_c-t_c+1;
 55 end
 56 % 这里先计算模板图像的归一化图像
 57 norm_Img = normalize(template);
 58 ncc_Img = zeros(r_end-r_start+1, c_end-c_start+1);
 59 c_r = round(t_r/2);
 60 c_c = round(t_c/2);
 61 for r = r_start:r_end
 62     for c = c_start:c_end
 63         currPatch = img(r:r+t_r-1,c:c+t_c-1);
 64         currPatch = normalize(currPatch);
 65         ncc_Img(r+c_r-1,c+c_c-1) = NCC(norm_Img, currPatch);
 66     end
 67 end
 68 [val_1,pos] = max(ncc_Img);
 69 [val_2,objc] = max(val_1);
 70 objr= pos(find(val_1==val_2));
 71 end
 72 % =========================================================================
 73 
 74 % =========================================================================
 75 % 计算两幅图像的归一化相关系数(一种相似性度量),其绝对值越大表示越相似
 76 function ncc = NCC(img_1, img_2, isNorm)
 77 if ~exist('isNorm','var')
 78     isNorm = 1;
 79 end
 80 % 判断参数是否是归一化后的图像
 81 if ~isNorm
 82     img_1 = normalize(img_1);
 83     img_2 = normalize(img_2);
 84 end
 85 ncc = sum(sum(img_1.*img_2)) ./ size(img_1(:),1);
 86 end
 87 % =========================================================================
 88 
 89 % =========================================================================
 90 % 图像归一化
 91 function norm_Img = normalize(img)
 92 if size(img, 3) ~= 1
 93     img = rgb2gray(img);
 94 end
 95 norm_Img = zeros(size(img));
 96 mu = mean(img(:));
 97 st = max(std(double(img(:))), eps);
 98 norm_Img = bsxfun(@minus, img, mu);
 99 norm_Img = bsxfun(@rdivide, norm_Img, st);
100 end
101 % =========================================================================
102 
103 % =========================================================================
104 % 计算图像的金字塔,层数由nLevels参数指定,返回一个结构体,其中包含nLevels张图像
105 function pyImg = pyramid(img, nLevels)
106 % 创建金字塔中的每一层图像
107 pyImg = cell(nLevels, 1);
108 pyImg{1} = img;
109 for i=2:nLevels
110     pyImg{i} = downSample(pyImg{i-1});
111 end  
112 end
113 % =========================================================================
114 
115 % =========================================================================
116 % 对图像进行降采样(2*2)并平滑处理
117 function d_img = downSample(img)
118 % 如果原图像的行列是基数则补齐
119 if mod(size(img,1), 2) ~= 0
120     img = [img(1,:); img];
121 end
122 if mod(size(img,2), 2) ~= 0
123     img = [img(:,1), img];
124 end
125 [r,c] = size(img);
126 d_img = zeros(r/2, c/2);
127 for i=1:2:r
128     for j=1:2:c
129         x = (i+1)/2;
130         y = (j+1)/2;
131         d_img(x,y) = sum(sum(img(i:i+1,j:j+1)))/4;
132     end
133 end
134 end

  测试代码如下:

1 src = rgb2gray(imread('src.jpg'));
2 template = rgb2gray(imread('template.jpg'));
3 [x,y,ncc_Img] = pyramidMatch(src, template, 4);

左图为源图像,中间图为模板图像,右边图为效果图

原文地址:https://www.cnblogs.com/Happyhe/p/3870702.html