立体视觉 之 刚体变换

1  投影空间

 欧氏空间,主要描述角度和形状,针对的是理想几何物体。例如,两条 ∥ 线永不相交,或交于无穷远点 (虚拟的点)。中学时代的 “平面与立体几何”,便属于欧式空间。

 投影空间,指实际的物体,被相机拍摄后,成像所在的空间,常用于计算机视觉中。在投影空间里,两条直线必然会相交于一点,只不过当这两条线平行时,交点为无穷远。

  

 如图所示,现实中的两条铁轨,成像在投影空间时,相交于某一点,也即无穷远点;但在欧氏空间中,无穷远点是理想点,并没有实际意义。

 这样,就需要一种新的表示方法 -- 齐次坐标,将欧氏空间的无穷远点,与投影空间中有实际意义的点,建立起映射关系

 2  齐次坐标

 在平面几何里,采用笛卡尔坐标,则一个点可表示为 $(x, y)^{T}$。如果增加一个坐标值,表示为 $(x, y, 1)^{T}$,且约定 ($x, y, 1)^{T}$ 和 $(kx, ky, k)^{T}$ 表示的是同一个点 (其中 k ≠ 0),

则这种用一个 N+1 维的向量,来表示 N 维向量的方法,称为齐次坐标法。

 这样,由齐次坐标 $(x, y, w)$,可推导出笛卡尔坐标 $ (dfrac{x}{w}, dfrac{y}{w})$

2.1  无穷远点

    欧式空间中,两条平行线方程组,如下:

 $egin{cases} AX + BY + C = 0 \ AX + BY + D = 0 end{cases} $ ,其中 C ≠ D

 齐次坐标点$(x, y, w)^{T}$ 与 欧氏空间点 $(X, Y)^{T}$ 的对应关系为: $ X = dfrac{x}{w}, Y = dfrac{y}{w}$,代入上面方程组得:

 $egin{cases} Adfrac{x}{w} + Bdfrac{y}{w} + C = 0 \ Adfrac{x}{w} + Bdfrac{y}{w} + D = 0 end{cases} $  =>  $egin{cases} Ax+ By + Cw = 0 \ Ax+ By + Dw = 0 end{cases} $ => $w = 0$

 既然 w = 0,则齐次坐标为 $(x, y, 0)^{T}$,对应笛卡尔坐标 $(dfrac{x}{0}, dfrac{y}{0})^{T}$,表示的是无穷远点 $(∞, ∞)^{T}$

2.2  合并加法

 点 $(x, y, z)^{T}$,经过伸缩和平移后,成为点 $ (x', y', z')^{T} = (r_{1}x+t_{1}, r_{2}y+t_{2}, r_{3}z+t_{3})^{T}$,该变换过程可用如下公式表示:

 $egin{bmatrix} x' \ y' \ z' end{bmatrix} = egin{bmatrix} r_{1} \ r_{2} \ r_{3}  end{bmatrix} egin{bmatrix} x \ y \ z end{bmatrix} + egin{bmatrix} t_{1} \ t_{2} \ t_{3} end{bmatrix} $

 如果使用齐次坐标,则可将平移变换,转化为矩阵乘法,消除了上式中的矩阵加法

 $egin{bmatrix} x' \ y' \ z' \1 end{bmatrix} = egin{bmatrix} r_{1} & 0 & 0 & t_{1} \ 0 & r_{2} & 0 & t_{2} \ 0 & 0 & r_{3} & t_{3} \ 0 & 0 & 0 & 1  end{bmatrix} egin{bmatrix} x \ y \ z \ 1end{bmatrix} $

2.3 向量和点

    齐次坐标还可以区分向量和点,具体如何区分的,尚待研究 ... ...

3  刚体变换

3.1  刚体定义

 欧氏空间中,当物体被视为刚体时,不管是该物体的位置或朝向发生变化,还是更换观察的坐标系,其大小和形状都保持不变

    形象点说,猪八戒的九齿钉耙,由冰铁铸造而成,便是一种刚体;而镇元子大仙的七星鞭,由于是龙皮做的,故为非刚体。

3.2  位置和朝向

 所谓刚体变换,就是一个可被看做刚体的物体,从一个状态 (位置朝向),转换为另一个状态的过程。

   

 如上所示,从世界坐标系相机坐标系的转换,朝向由旋转矩阵 $R$ 表示,位置则由平移矩阵 $T$ 来表示: $ P_{c} = R cdot P_{w} + T$

 其中,旋转矩阵 $  R = egin{bmatrix} r_{11} & r_{12} & r_{13} \ r_{21} & r_{22} & r_{23} \ r_{31} & r_{32} & r_{33} end{bmatrix} $,平移矩阵 $  T = egin{bmatrix} t_{1} \ t_{2} \ t_{3}   end{bmatrix} $

 旋转矩阵 R 为正交矩阵 (也即,RR' = E,E 为单位矩阵),则满足以下 6 个约束条件

 (1)  大小约束   $egin{cases} r_{11}^2 + r_{12}^2 + r_{13}^2 = 1 \ r_{21}^2 + r_{22}^2 + r_{23}^2 = 1 \ r_{31}^2 + r_{32}^2 + r_{33}^2 = 1end{cases} $        (2) 方向约束   $egin{cases} r_{11}*r_{21} + r_{12}*r_{22} + r_{13}*r_{23} = 0 \ r_{21}*r_{31} + r_{22}*r_{32} + r_{23}*r_{33} = 0 \ r_{31}*r_{11} + r_{32}*r_{12} + r_{33}*r_{13} = 0end{cases} $

   可用一个最简单的正交矩阵 E,来理解上面的约束条件

       $egin{bmatrix} 1 & 0 & 0 \ 0 & 1 & 0 \ 0 & 0 & 1 end{bmatrix}$

3.3  转换关系

    若已知 $R$ 和 $T$,则可将世界坐标系内的空间点,与相机坐标系内的空间点,建立起一一对应的关系

 $ egin{bmatrix} X_{c} \ Y_{c} \ Z_{c} end{bmatrix} = egin{bmatrix} R & T end{bmatrix} egin{bmatrix} X_{w} \ Y_{w} \ Z_{w} end{bmatrix}$

3.3.1  约束分析

    $R$ 和 $T$ 共有 12 个未知量,减去正交约束的 6 个方程,则还剩 6 个未知量。

    表面上看,似乎只需 2 组共轭点,就可得到 6 个约束方程,对应求出剩余的 6 个未知量。实际上,这 6 个方程是有冗余信息的 (两组共轭点,在各自的坐标系下,两点之间的距离相等)

    因此,第 2 组共轭点,只是提供了 2 个约束方程,加上第 1 组共轭点的 3 个约束,共有 5 个独立的约束方程。

    显然,还需要第 3 组共轭点,提供 1 个独立的方程,才能求得 $R$ 和 $T$

3.3.2  几何解释

    如下图所示,考虑两个刚体,它们之间存在着相互 旋转 和 平移

   

   首先,在每个刚体上,各选一个点 L1 和 R1,移动其中一个刚体,使得这两个点重合。此时,一个刚体可相对于另一个刚体转动 (以三种不同的方式)。

   然后,在每个刚体上,再分别取一个点 L2 和 R2,并且 | L2 - L1 | = | R2 - R1 |,移动一个刚体,使得这两对点,分别重合。此时,一个刚体可以相对另一个转动 (以一种方式)。

   最后,在每个刚体上,分别取第三个点 L3 和 R3,满足 | L3 - L1 | = | R3 - R1 | 且 | L3 - L2 | = | R3 - R2 |,然后将这三个点对齐。此时,两个刚体便牢牢的连在了一起。

 参考资料

    <视觉测量> 张广军,第2章

    <Robot Vision> Chapter 13

    <An Invitation to 3D Vision> Chapter 2

    Homogeneous Coordinates

原文地址:https://www.cnblogs.com/xinxue/p/7513192.html