相机标定

先放一个知乎上面通俗易懂的解答：

作者：陈明猷
链接：https://www.zhihu.com/question/29448299/answer/102658379
来源：知乎
著作权归作者所有，转载请联系作者获得授权。

我们从单目视觉说起。平时我们都说要做视觉识别、测量云云，然后我们就会去拍照，再对数字图像做各种处理，颜色处理、灰度化、滤波、边缘检测、霍夫变换，最后得到了希望得到的特征，是这样的对吧？

不过请注意！到了这一步，其实我们仅仅是得到了一坨坨感兴趣的像素而已！究竟要怎样才能把这些像素转化到现实世界的对象中呢？也就是说，究竟要怎样对这些仅存在于图像中的东西进行测量，才能得到具有实际意义和尺度的数据呢？这个时候我们就懵逼了……

没错，摄像机标定的存在意义就是解决这个蛋疼的问题！！！

我们继续看看，通过摄像机标定我们可以知道些什么:

1.外参数矩阵。告诉你现实世界点(世界坐标)是怎样经过旋转和平移，然后落到另一个现实世界点(摄像机坐标)上。

2.内参数矩阵。告诉你上述那个点在1的基础上，是如何继续经过摄像机的镜头、并通过针孔成像和电子转化而成为像素点的。

3.畸变矩阵。告诉你为什么上面那个像素点并没有落在理论计算该落在的位置上，还tm产生了一定的偏移和变形！！！

好了，到这里是不是明白了一点？上述3点的每一个转换，都有已经有成熟的数学描述，通过计算，我们完全可以精确地重现现实世界的任意一个点到其数字图像上对应像素点的投影过程。
对于双目视觉系统，通过立体标定还能进一步得到下面的参数:

4.结构参数。告诉你右摄像机是怎样相对于左摄像机经过旋转和平移达到现在的位置。
通过结构参数，便能把左右摄像机获取的图像的每一个像素点之间的关系用数学语言定量描述，保证两个相机都处于我们“可求”的状态。

总的来说，摄像机标定是通过寻找对象在图像与现实世界的转换数学关系，找出其定量的联系，从而实现从图像中测量出实际数据的目的。

当然，其实上述的各个转换过程大部分都不需要用户自己一个个写程序实现，比如opencv就集成了单目标定函数calibracamera()、畸变校正函数undistortinitialmap()、双目标定函数stereocalibrate()……
其实自己亲自走一遍流程就很容易领会到整个视觉测量的逻辑。比如说，在畸变校正中需要用到单目标定的畸变参数输出和内参数输出，在双目标定中需要用到单目标定的外参数输出，在外极线校准中需要用到双目标定的结构参数输出，在立体匹配中中需要用到外极线校准的输出参数，在三维反求中需要用到立体匹配的输出参数。用户自己走完一遍这个流程，基本上就发现没有做标定的话，几乎什么都干不了。

什么是相机标定?

1：相机标定含义（解决什么是相机标定）

在图像测量过程以及机器视觉应用中，为确定空间物体表面某点的三维几何位置与其在图像中对应点之间的相互关系，必须建立相机成像的几何模型，这些几何模型参数就是相机参数。在大多数条件下这些参数必须通过实验与计算才能得到，这个求解参数的过程就称之为相机标定（或摄像机标定）。

基本的坐标系：

世界坐标系(world coordinate system)；
相机坐标系(camera coordinate system)；
图像坐标系(image coordinate system)；

一般来说，标定的过程分为两个部分：

第一步是从世界坐标系转换为相机坐标系，这一步是三维点到三维点的转换，包括
第二部是从相机坐标系转为图像坐标系，这一步是三维点到二维点的转换，包括

相机坐标系转换到图像坐标系

坐标系介绍

相机到图片

如上图所示（图片来自UIUC计算机视觉课件），是一个小孔成像的模型，其中：

像平面上的
相机坐标系是以
像平面坐标系是以
图像坐标系一般指图片相对坐标系，在这里可以认为和像平面坐标系在一个平面上，不过原点是在图片的角上，而且度量值为像素的个数（pixel）；

相机转换到像平面

知道上面的简单知识后，如果知道相机坐标系中的一个点

可以表示为矩阵计算为（在这里用的是齐次坐标的表示方式，关于齐次坐标文章最下面有介绍）：

可以简写为（

加入偏移量

通过上面，可以把相机坐标系转换到像平面坐标系，但是像平面坐标系和图像坐标系虽然在同一个平面上，但是原点并不是同一个，而目标是要转换到图像坐标系下，所以还需要一步操作，如下图：

这里写图片描述

如上图所示（图片来自UIUC计算机视觉课件），其中主点

相当于在上面的基础上加了一个p点坐标的偏移量，同时可以表示为矩阵计算为（在这里用的是齐次坐标的表示方式）：

整理一下得：

所以最后可以得到

像素坐标

前面也提到了在图像坐标系中用的不是现实生活中的m来度量，而是用的 pixel 的个数，所以在上面转换到图像坐标系中还有个问题，就是坐标的表示还是m，并没有转换到像素坐标系统；在这里需要引入一个新概念就是：

可能有人奇怪为啥不是一个值，还需要分别指定

但是需要说明的是像素并不一定是一个正方形，有时候可能也是一个矩形，所以要分别指定。
所以可以把上面相机内参

一般来说，在使用相机内参K计算坐标系转换时，提供的都是已经变换后的值；例如会提供

世界坐标系转换到图像坐标系

坐标系介绍

如上图所示（图片来自UIUC计算机视觉课件），从世界坐标系转换到相机坐标系是三维空间到三维空间的变换，一般来说需要一个平移操作和一个旋转操作就可以完成这个转换，用公式表示如下（可以理解为世界坐标系原点先平移到相机坐标系的位置然后在做一次坐标系旋转，使坐标轴对齐。）：

世界转换到相机

根据上面的公式可以得到从一个三维点从世界坐标系转换到相机坐标的变换公式如下（也是用的齐次坐标的表示方式）：

世界转换到图像

根据上面的讨论知道了怎样从世界坐标系转换到相机坐标系（平移和旋转）以及从相机坐标系转换到图像坐标系（相机内参变换），所以带入上面的矩阵计算，可以得到：

这样就得到了最终的投影矩阵

其中：

在这里，

畸变参数(`distortion parameters`)

在几何光学和阴极射线管(CRT)显示中，畸变（distortion）是对直线投影（rectilinear projection）的一种偏移。简单来说直线投影是场景内的一条直线投影到图片上也保持为一条直线。那畸变简单来说就是一条直线投影到图片上不能保持为一条直线了，这是一种光学畸变（optical aberration）。可能由于摄像机镜头的原因，这里不讨论，有兴趣的可以查阅光学畸变的相关的资料。
畸变一般可以分为两大类，包括径向畸变和切向畸变。主要的一般径向畸变有时也会有轻微的切向畸变。

径向畸变（`Radial distortion`）

径向畸变的效应有三种，一种是桶形畸变（barrel distortion），另一种是枕形畸变（pincushion distortion），还有一种是两种的结合叫做胡子畸变（mustache distortion），从图片中可以很容易看出区别，具体见下图(图片来自wikipedia)：

径向畸变可以用如下公式修正：

切向畸变（`tangential distortion`）

切向畸变是由于透镜与成像平面不严格的平行，其可以用如下公式修正：

其中：

所以最终得到5个畸变参数：

相机标定

2：相机标定意义（解决为什么要进行相机标定）

计算机视觉的基本任务之一是从摄像机获取的图像信息出发计算三维空间中物体的几何信息，并由此重建和识别物体，而空间物体表面某点的三维几何位置与其在图像中对应点之间的相互关系是由摄像机成像的几何模型决定的，这些几何模型参数就是摄像机参数。在大多数条件下，这些参数必须通过实验与计算才能得到。无论是在图像测量或者机器视觉应用中，相机参数的标定都是非常关键的环节，其标定结果的精度及算法的稳定性直接影响相机工作产生结果的准确性。因此，做好相机标定是做好后续工作的前提，提高标定精度是科研工作的重点所在。

3：相机标定的方法（解决如何进行相机标定）

相机标定方法有：传统相机标定法、主动视觉相机标定方法、相机自标定法。

摄像机相对于世界坐标系的方位。标定精度的大小，直接影响着计算机视觉（机器视觉）的精度。迄今为止，对于摄像机标定问题已提出了很多方法，摄像机标定的理论问题已得到较好的解决，对摄像机标定的研究来说，当前的研究工作应该集中在如何针对具体的实际应用问题，采用特定的简便、实用、快速、准确的标定方法。

相机标定

什么是相机标定?

相机坐标系 转换到 图像坐标系

坐标系介绍

相机 转换到 像平面

加入偏移量

像素坐标

世界坐标系 转换到 图像坐标系

坐标系介绍

世界 转换到 相机

世界 转换到 图像

畸变参数(distortion parameters)

径向畸变（Radial distortion）

切向畸变（tangential distortion）

相机标定

相机坐标系转换到图像坐标系

相机转换到像平面

世界坐标系转换到图像坐标系

世界转换到相机

世界转换到图像

畸变参数(`distortion parameters`)

径向畸变（`Radial distortion`）

切向畸变（`tangential distortion`）