OpenCV离散傅里叶变换

离散傅里叶变换

  • 作用:得到图像中几何结构信息
  • 结论:傅里叶变换后的白色部分(即幅度较大的低频部分),表示的是图像中慢变化的特性,或者说是灰度变化缓慢的特性(低频部分)。
    傅里叶变换后的黑色部分(即幅度低的高频部分),表示图像中快变化的特性,或者说是灰度变化快的特性(高频部分)。

dft()函数

函数原型

void dft(InputArray src, OutputArray dst, int flage=0, int nonzeroRow=0)
  • InputArray 类型的src。输入矩阵,可以为实数或者虚数。
  • OutputArray 类型的dst。函数调用后的运算结果存在这里,其尺寸取决于标识符,也就是第三个参数。
  • int 类型的falgs。转换的标识符,有默认值0,取值可以为表中的结合。

标识符名称 | 意义
-|
DFT_INVERSE | 用一维或二维逆变换代替默认的正向变换。
DFT_SCALE | 缩放比例标识符,输出的结果都会以1/N进行放缩,通常擦很难过会结合DFT_INVERSE一起使用。
DFT_ROWS | 对输入矩阵的每行进行正向或反向的变换,此标识符可以在处理多种矢量的时候用于减小资源的开销,这些处理常常是三维或高位变换等复杂操作
DFT_COMPLEX_OUTPUT | 进行一维或二维复数苏胡祖反变换。这样的结果通常是一个大小相同的复矩阵。如果输入的矩阵有复数的共轭对称性(比如是一个带有DEF_COMPLEX_OUTPUT标识符的正变换结果),便会输出实矩阵。

  • int 类型的nonzeroRows,有默认值0.当此参数设为非零时(最好是取值为想要处理的那一行的值,比如C。rows),函数会假设只有输入矩阵的第一个非零行包含非零元素(没有设置DFT_INVERSE标识符),或只有输出矩阵的一个非零行包含非零元素(设置了DFT_INVERSE标识符)。这样的话,函数就可对其他行进行更高效的处理,以节省时间开销。

返回DFT最优尺寸大小:getOptimalDFTSize()函数

函数原型

int getOptimalDFTSize(int vecsize)
  • int 类型的vecsize,向量尺寸,即图片的rows、cols。

扩充图像边界:copyMakeBorder()函数

函数原型

void copyMakeBorder(InputArray src, OutputArray dst, int top, int bottom, int left, int right, int borderType, const Scalar& value=Scalar())
  • InputArray 类型的src,输入图像,即源图像,填Mat类型的对象即可。
  • OutputArray 类型的dst,函数调用后的运算结果存在这里,即这个参数用于存放函数调用后的输出结果,需和源图片有一样的尺寸和类型,且size 应该为Size(src.cols+left+right , src.rows+top+bottom)。
  • 接下来的4个参数分别是为int 类型的top、bottom、left、right,分别表示在源图像的四个方向上填充多少像素。
  • 第七个参数,int 类型的 borderType,边界类型,常见取值为BORDER_CONSTANT,可参考borderInterpolate()得到更多细节。
  • 第八个参数,const Scalar& 类型的value,有默认值Scalar(),可以理解为默认值为0。当borderType取值为BORDER_CONSTANT时,这个参数表示边界值。

计算二维矢量的幅值:magnitude()函数

函数原型

void magnitude(InputArray x, InputArray y, OutputArray magnitude)
  • InputArray 类型的x,表示矢量的浮点型X坐标值,也就是实部。
  • InputArray 类型的y,表示矢量的浮点型Y坐标值,也就是虚部。
  • OutputArray 类型的magnitude,输出的幅值,它和第一个参数x有着同样的尺寸和类型。

计算自然对数:log()函数

计算数组元素绝对值的自然对数
函数原型

void log(InputArray src, OutputArray dst)
  • 输入图像
  • 得到的对数值

矩阵归一化:normalize()函数

函数原型

void normalize(InputArray src, OutputArray dst, double alpha=1, double beta=0, int norm_type=NORM_L2, int dtype=-1, InputArray mask=noArray())
  • InputArray 类型的src。输入图像,即源图像,填Mat类的对象即可。
  • OutputArray 类型的dst。函数调用后的运算结果。和源图片有一样的尺寸和类型。
  • double 类型的alpha。归一化后的最大值,默认值1。
  • double 类型的beta。归一化后的最小值,默认值0。
  • int类型的norm_type。归一化类型,有NORM_INF、NORM_L1、NORM_L2和NORM_MINMAX等参数可选,有默认值NORM_12。
  • int 类型的dtype,有默认值-1。当参数去负值时,输出矩阵和src有同样的类型,否则,它和src有同样的通道数,且此时图像深度为CV_MAT_DEPTH (dtype)。
  • InputArray 类型的mask,可选的操作掩膜,有默认值noArray()。

综合示例

#include<core.hpp>
#include<imgproc.hpp>
#include<highgui.hpp>
#include<iostream>
using namespace cv;
using namespace std;


int main()
{
	// 1.以灰度模式读取
	Mat srcImage = imread("..//..//0.jpg",0);
	if (!srcImage.data)
	{
		printf("读入错误");
		return false;
	}
	imshow("原始图像", srcImage);

	// 2.将输入图像延扩到最佳尺寸,边界用0补充
	int m = getOptimalDFTSize(srcImage.rows);
	int n = getOptimalDFTSize(srcImage.cols);
	// 将添加的像素初始化为0。
	Mat padded;
	copyMakeBorder(srcImage, padded, 0, m - srcImage.rows, 0, n - srcImage.cols, BORDER_CONSTANT, Scalar::all(0));

	// 3.为傅里叶变换的结果(实部和虚部)分配空间。
	// 将planes数组组合合并成一个多通道的数组complexI
	Mat planes[] = { Mat_<float>(padded), Mat::zeros(padded.size(),CV_32F) };
	Mat complexI;
	merge(planes, 2, complexI);

	// 4.进行离散傅里叶变换
	dft(complexI, complexI);

	// 5.将复数转换为幅值,即 log(1+sqrt(Re(DFT(I))^2 + Im(DFT(I))^2)
	split(complexI, planes);	//将多通道数组complexI分离成几个单通道数组,[0]=Re,[1]=Im
	magnitude(planes[0], planes[1], planes[0]);	//planes[0] = magnitude
	Mat magnitudeImage = planes[0];

	// 6.进行对数尺度(logarithmic scale)缩放
	magnitudeImage += Scalar::all(1);
	log(magnitudeImage, magnitudeImage);	//求自然对数

	// 7.剪切和重分布幅度图象限
	//若有奇数行或奇数列,进行频谱裁剪
	magnitudeImage = magnitudeImage(Rect(0, 0, magnitudeImage.cols & -2, magnitudeImage.rows & -2));

	// 重新排列傅里叶图像中的象限,使得原点位于图像中心
	int cx = magnitudeImage.cols / 2;
	int cy = magnitudeImage.rows / 2;
	Mat q0(magnitudeImage, Rect(0, 0, cx, cy));		//ROI区域的左上
	Mat q1(magnitudeImage, Rect(cx, 0, cx, cy));	//ROI区域的右上
	Mat q2(magnitudeImage, Rect(0, cy, cx, cy));	//ROI区域的左下
	Mat q3(magnitudeImage, Rect(cx, cy, cx, cy));	//ROI区域的右下
	//交换象限(左上与右下进行交换)
	Mat tmp;
	q0.copyTo(tmp);
	q3.copyTo(q0);
	tmp.copyTo(q3);
	//交换象限(右上与左下进行交换)
	q1.copyTo(tmp);
	q2.copyTo(q1);
	tmp.copyTo(q2);

	// 8.归一化,用0到1之间的浮点值将矩阵变换为可视化的图像格式
	normalize(magnitudeImage, magnitudeImage, 0, 1, NORM_MINMAX);

	// 9.显示效果图
	imshow("频谱幅值", magnitudeImage);
	waitKey();

return 0;
}

原文地址:https://www.cnblogs.com/ishero/p/11136317.html