OpenCV2马拉松第13圈——模版匹配

收入囊中

http://blog.csdn.net/abcd1992719g/article/details/25505315这里,我们已经学习了怎样利用反向投影和meanshift算法来在图像中查找给定模版图片的位置。meanshift针对的是单张图像,在连续图像序列的跟踪中。camshift(Continuously Adaptive Mean-SHIFT)是一种著名的算法。但在这里。我们先不讨论camshift,而是先讨论最简单的模版匹配。

  • 模版匹配算法
  • opencv normalize函数
  • opencv matchTemplate函数
  • opencv minMaxLoc函数
当中,normalize归一化函数和minMaxLoc函数我们曾经用过,在本节将具体阐述他们的使用方法。


葵花宝典
本节的算法也是属于比較简单的。
我们举个样例:以下各自是源图像和模版图像


站在最单纯的角度,你会怎么做?
毫无疑问,我们要找到一个标准来衡量。square error是最普遍简单的.
步骤:
  1. 遍历图像的全部点
  2. 对于一个点(m,n),计算square error.也就是遍历模版图像的长和高,计算sum( (src(m+x,n+y)-template(x,y))^2 )
  3. 遍历完后,就有了一个和原图大小相等的square error(不考虑边缘)矩阵,然后取出值最小的那个位置
OpenCV就是这么做的。仅仅只是它提供了6种方法(事实上是3种,另外3种仅仅只是多了归一化),square error是当中一种


初识API
循环遍历计算的过程OpenCV帮我们做了,matchTemplate
C++: void matchTemplate(InputArray image, InputArray templ, OutputArray result, int method)
 
  • image – 输入图像
  • templ – 模版图像,不能比输入图像大,类型要和输入图像一致
  • result – 输出的结果,单通道32位浮点数.result图像比输入图像要小,由于考虑了边界.If image is W 	imes H and templ is w 	imes h , thenresult is (W-w+1) 	imes (H-h+1) .
  • method – 有6种方法

 method=CV_TM_SQDIFF

R(x,y)= sum _{x',y'} (T(x',y')-I(x+x',y+y'))^2

  • method=CV_TM_SQDIFF_NORMED

    R(x,y)= frac{sum_{x',y'} (T(x',y')-I(x+x',y+y'))^2}{sqrt{sum_{x',y'}T(x',y')^2 cdot sum_{x',y'} I(x+x',y+y')^2}}

  • method=CV_TM_CCORR

    R(x,y)= sum _{x',y'} (T(x',y')  cdot I(x+x',y+y'))

  • method=CV_TM_CCORR_NORMED

    R(x,y)= frac{sum_{x',y'} (T(x',y') cdot I(x+x',y+y'))}{sqrt{sum_{x',y'}T(x',y')^2 cdot sum_{x',y'} I(x+x',y+y')^2}}

  • method=CV_TM_CCOEFF

    R(x,y)= sum _{x',y'} (T'(x',y')  cdot I'(x+x',y+y'))

    where

    egin{array}{l} T'(x',y')=T(x',y') - 1/(w  cdot h)  cdot sum _{x'',y''} T(x'',y'') \ I'(x+x',y+y')=I(x+x',y+y') - 1/(w  cdot h)  cdot sum _{x'',y''} I(x+x'',y+y'') end{array}

  • method=CV_TM_CCOEFF_NORMED

    R(x,y)= frac{ sum_{x',y'} (T'(x',y') cdot I'(x+x',y+y')) }{ sqrt{sum_{x',y'}T'(x',y')^2 cdot sum_{x',y'} I'(x+x',y+y')^2} }

NOTE:之前我们用square error时,值越小说明越匹配,可是并非上面全部的方法都是这样子.
R越小越匹配 (when CV_TM_SQDIFF was used) 
R越大越匹配 (whenCV_TM_CCORR or CV_TM_CCOEFF was used) 



归一化?normalize
我们发现,上面3种是没有归一化的,也就是result可能会是一个值非常大的矩阵,几万几十万,imshow是一片黑乎乎。

假设我们想看效果。就必需要做归一化了.


C++: void normalize(InputArray src, OutputArray dst, double alpha=1, double beta=0, int norm_type=NORM_L2, int dtype=-1, InputArraymask=noArray() )

如果我有[1,4,5,6,7,10]的矩阵,我们先看3种归一化类型
L1_norm: 每個元素乘上1/sqrt(1+4+5+6+7+10)
L2_norm: 每個元素乘上1/sqrt(1+16+25+36+49+100)
NORM_MINMAX:使每個元素限制在[a=5,b=0]之間算法例如以下:dst(i)=(src(i)-min(src))*(5-0)/(max(src)-min(src))
1-->0
4-->3*5/9=1.6666
5-->4*5/9=2.2222
比較经常使用的还是MinMAX,OpenCV默认使用NORM_L2
在使用L1_norm,L2_norm时,alpha,beta就没效果了.
在使用NORM_MINMAX时候。alpha,beta就是你要缩放的范围,我发现两个值换一下没关系,大概OpenCV帮我们推断了大小。


找到最大最小值。minMaxLoc

double minVal; double maxVal; Point minLoc; Point maxLoc;

minMaxLoc( image, &minVal, &maxVal, &minLoc, &maxLoc, Mat() );

the function calls as arguments:

  • image: 输入图像
  • &minVal and &maxVal: Variables to save the minimum and maximum values in result
  • &minLoc and &maxLoc: The Point locations of the minimum and maximum values in the array.
  • Mat(): Optional mask



荷枪实弹
#include "opencv2/highgui/highgui.hpp"
#include "opencv2/imgproc/imgproc.hpp"
#include <iostream>
#include <stdio.h>

using namespace std;
using namespace cv;

Mat img; Mat templ; Mat result;
const char* image_window = "Source Image";
const char* result_window = "Result window";

int match_method;
int max_Trackbar = 5;

void MatchingMethod( int, void* );

int main( int, char** argv )
{
  /// Load image and template
  img = imread( argv[1], 1 );
  templ = imread( argv[2], 1 );

  /// Create windows
  namedWindow( image_window, CV_WINDOW_AUTOSIZE );
  namedWindow( result_window, CV_WINDOW_AUTOSIZE );

  /// Create Trackbar
  const char* trackbar_label = "Method: 
 0: SQDIFF 
 1: SQDIFF NORMED 
 2: TM CCORR 
 3: TM CCORR NORMED 
 4: TM COEFF 
 5: TM COEFF NORMED";
  createTrackbar( trackbar_label, image_window, &match_method, max_Trackbar, MatchingMethod );

  MatchingMethod( 0, 0 );

  waitKey(0);
  return 0;
}

void MatchingMethod( int, void* )
{
  Mat img_display;
  img.copyTo( img_display );

  //重要。调用模版匹配再进行归一化
  matchTemplate( img, templ, result, match_method );
  normalize( result, result, 0, 1, NORM_MINMAX);


  double minVal; double maxVal; Point minLoc; Point maxLoc;
  Point matchLoc;
  //找到最大最小点
  minMaxLoc( result, &minVal, &maxVal, &minLoc, &maxLoc, Mat() );


  //依据我前面讲的。分方法取最大还是最小值
  if( match_method  == CV_TM_SQDIFF || match_method == CV_TM_SQDIFF_NORMED )
    { matchLoc = minLoc; }
  else
    { matchLoc = maxLoc; }

  //画上矩形框框
  rectangle( img_display, matchLoc, Point( matchLoc.x + templ.cols , matchLoc.y + templ.rows ), Scalar::all(0), 2, 8, 0 );
  rectangle( result, matchLoc, Point( matchLoc.x + templ.cols , matchLoc.y + templ.rows ), Scalar::all(0), 2, 8, 0 );

  imshow( image_window, img_display );
  imshow( result_window, result );

  return;
}


举一反三
有时候。图像中要有多个匹配的地方,这时候就不能仅仅用一次minMaxLoc来攻克了,能够去遍历我们的结果矩阵.





计算机视觉讨论群:162501053
转载请注明:http://blog.csdn.net/abcd1992719g


原文地址:https://www.cnblogs.com/blfbuaa/p/6835100.html