OpenGL学习之路（二）

1　引子

在上一篇读书笔记中，我们对书本中给出的例子进行详细的分析。首先是搭出一个框架；然后填充初始化函数，在初始化函数中向OpenGL提供顶点信息（缓冲区对象）和顶点属性信息（顶点数组对象），并启用顶点数组对象；最后填充绘制函数，首先清空颜色缓存，然后调用glDrawArray来绘制基本图形。例子中使用的坐标都是二维坐标，所以画出来的图形是二维图形（这里是两个三角形），而我们知道OpenGL最主要是用来进行三维图形的渲染的，所以有必要在学习OpenGL相关API之前对三维变换做一个简要的介绍。其实这一部分应该属于红宝书中第五章的内容，这里我们将其提前了，在读书笔记（二）就拿出来介绍——这是我们三维渲染的最基本的知识点，也是最关键的知识点，理解起来也有一定的难度。本次读书笔记主要讲述平移、旋转、缩放变换的变换矩阵，投影变换将在下一篇读书笔记再做记录。本篇读书笔记主要是自己对一些数学概念的理解和记录，仅供参考，如有不同理解的，大家可以一起讨论哈！

2　点、坐标系与向量

讨论三维变换之前，得先了解点、向量和坐标系这些基本数学概念。这部分内容可能比较抽象，下面记录的是我对这些概念的一些理解。

2.1　位置的相对性

在日常生活中，我们在向别人描述一个陌生的地方的时候，通常会选择一个他熟悉的地方作为一个参考点。例如：我们向老外介绍河北的一座古城邯郸，老外知道北京，我们就会说邯郸在北京往西南走300km；如果老外知道石家庄，那我们也可以告诉他，邯郸在石家庄往南走100km。这说明，位置是一个相对的概念，要描述一个位置，首先要选择参考点；参考点的选择是任意的，所选取的参考点不同，位置的描述也就不同。

在几何中，位置用“点”这一概念来描述，即点是一个只有位置没有大小的量。描述一个点和描述一个位置是一回事，刚才已经说了位置是一个相对的概念，所以首先就要用到参考点。我们以最简单的一维数轴为例来说明描述点的位置，如下图所示：

对于数轴上同一点$A$，要描述$A$点的位置，先要选取任意一个参考点，如果选择的参考点是$O_1$，则$A$点在$O_1$点右边$l_1$的地方；如果选择的参考点是$O_2$，则$A$点在$O_2$点左边$l_2$的地方。通过数轴和参考点，我们就将数轴上的几何点用抽象的数字表达出来了。

2.2 坐标系与向量

从图上可以看出，数轴上的点只能沿着数轴方向进行变化，即它是一维的。如果点在一个平面上或一个空间中变化，那么数轴这一工具是无法描述的。这时就要引入二维坐标系和三维坐标系来描述点的位置。介绍坐标系之前，首先介绍一下向量的概念。

在我们还是十七八岁学习高一几何的时候，我们就已经接触到了向量——既有大小，又有方向的量，用一个有向线段来表示。说白了，向量定义了一个方向、一个长度和一个单位长度。如上图中，$O_1A$和$AO_2$就是两个向量，大小分别为$l_1$和$l_2$，方向为水平向右。

一个平面上，有无数这样的向量。但是关于向量，有一个非常重要的法则——使用平行四边形法则来对任何一个向量进行分解。平行四边形法则来自于物理学中力的分解与合成，后被引入数学中加以抽象来描述向量的分解与合成。所谓平行四边形法则，指的是任何一个平面向量都可以用一个不共线的两个向量表示。于是，平面中无数的向量就可以用两个不共线的向量来表示。由这两个向量及它们的公共起点构成的数学结构就是二维坐标系，用坐标系就可以描述二维平面上的任意点，当然也可以描述二维平面上的任意向量，这两个向量就是线性代数中的基向量。我们知道，在数学中，向量是位置无关的（即自由向量），只要大小相等，方向相同的两个向量就是同一个向量（这和物理学中的力不一样）。所以要描述二维空间中的点，还需要一个参考点，于是就定义了这两个向量的公共起点作为参考点——即我们熟知的坐标原点。坐标轴向量和坐标原点就构成了坐标系，可以用坐标系来描述其中的任何向量和任一点。

三维坐标系和二维坐标系是类似的，使用两次平行四边形法则，从而将任意一个三维向量表示为三个不共面的三维向量(基向量)来表示，这三个向量移到一起的公共起点定义为三维坐标系的坐标原点。二维和三维笛卡尔坐标系就是基向量垂直的二维和三维坐标系，也是应用最为广泛的坐标系，也称为平面直角坐标系和空间直角坐标系。

下面，我们来看看向量的表示方法。同样在我们懵懵懂懂的青春岁月里，我们就已经知道向量有两种表示方法：第一种是符号表示法，如$mathbf{a}, mathbf{b}$等；另一种是坐标表示法，这里对坐标表示做较详细的说明。刚才已经说了，任意一个二维向量都可以用两个不共线的向量来表示，假设两个基向量为$mathbf{i}$和$mathbf{j}$，且长度为1。则对任一个向量$mathbf{a}=x_amathbf{i} + y_amathbf{j}$，这样，向量$mathbf{a}$可用一个有序对$(x_a, y_a)$来唯一表示，这就是向量的坐标表示。三维乃至$N$维向量的坐标表示都是一样的。在这里，博主还是想强调一下，向量的坐标并不是该向量在坐标轴上的投影，只有笛卡尔坐标是向量在基向量上的投影。所以，在普通坐标系下，一个向量的坐标不是很好求，但在直角坐标系下，就变得很好求了——求投影，这也是笛卡尔坐标系应用的如此广泛的原因。下面我们来看看，什么是投影，其实高一数学中也已经接触到了，如下图所示：

假设$c$为向量$mathbf{a}$在向量$mathbf{b}$上的投影，那么：

egin{equation} c = mathbf{a} cos<mathbf{a}, mathbf{b}>end{equation}

所以，在二维直角坐标系中，如果二维向量$mathbf{a}$长度为$l$，该向量与$x$轴和$y$轴的夹角分别为$alpha$和$eta$，则我们很容易得到该向量的坐标表示为$mathbf = (lcosalpha, lcoseta)^ ext{T}$；同样地，对三维空间向量$mathbf{b}$，其长度为$L$，与$x$轴、$y$轴和$z$轴的夹角分别为$alpha$、$eta$和$gamma$，则其坐标表示为$mathbf{b}=(Lcosalpha, Lcoseta, Lcosgamma)^ ext{T}$。

2.3 点的表示

刚才我们定义了坐标系——坐标原点和三个不共面的向量组成，并且三维空间中的任意向量都可以由这三个向量唯一表示，但我们没有讲点怎么由坐标系来定义。设在三维笛卡尔坐标系中，坐标原点为$O$，三个基向量分别为$mathbf{i}$，$mathbf{j}$，$mathbf{k}$，我们要求$P$点的坐标，那么

$$vec{OP} = x_{1}mathbf{i} + y_{1}mathbf{j} + z_{1}mathbf{k}$$

于是，点$P$可以表示为

$$P = x_{1}mathbf{i} + y_{1}mathbf{j} + z_{1}mathbf{k} + mathbf{O}$$

所以，要想表示一个三维的点，可以用四维坐标来表示，例如刚才的$P$可以表示为$P = (egin{array}{cccc} x_1 & y_1 & z_1 & 1end{array})$，这就是齐次坐标。对顶点来说，齐次坐标才是其真正的表示方式。向量可以表示为$mathbf{v} = (egin{array}{cccc} x_1 & y_1 & z_1 & 0end{array})$。

3　线性变换与齐次坐标

3.1 概述

代数中的线性变换的概念很抽象，涉及到向量空间、线性映射之类的概念，在这里不做过多解释，如下想了解可以度娘或必应。给一个通俗点的解释，三维线性变换就是将点/向量的坐标值做一个运算，使其坐标值发生改变，这在几何中的反映就是几何体的形状被改变了。在计算机图形学中，线性变换一般是指平移、旋转、缩放、投影（正交投影和透视投影）以及这些基本变换的综合运算。通过刚才的描述，我们知道一下几点信息：几何中的点或向量由四个坐标值确定，而坐标值是由坐标系确定的，坐标系又是由三个不共面的向量和坐标原点构成。也就是说，对于同一点，在不同的坐标系下，描述它的坐标值是不一样的，而变换就是建立这两种不同描述之间的联系——所以在以前我们称之为坐标变换。例如：在坐标系$mathbf{O}_1-mathbf{i}_1mathbf{j}_1mathbf{k}_1$坐标系下，某一点可以描述为$P$点可以用四元祖$(x_1, y_1, z_1, o_1)$描述，

egin{equation}label{p2}P = egin{array}{cccc} (x_1 & y_1 & z_1 & o_1)end{array}left(egin{array}{c}mathbf{i}_1 \ mathbf{j}_1 \ mathbf{k}_1 \ mathbf{O}_1end{array} ight) = (egin{array}{cccc} mathbf{i}_1 & mathbf{j}_1 & mathbf{k}_1 & mathbf{o_1}end{array})left(egin{array}{c}x_1 \ y_1 \ z_1 \ o_1 end{array} ight)end{equation}

在另一个坐标系为$mathbf{O}_2-mathbf{i}_2mathbf{j}_2mathbf{k}_2$，可以用另一个有序元组描述它，设为$(x_2, y_2, z_2, o_2)$

egin{equation}label{p1}P = egin{array}{cccc} (x_2 & y_2 & z_2 & o_2)end{array}left(egin{array}{c}mathbf{i}_2 \ mathbf{j}_2 \ mathbf{k}_2 \ mathbf{O}_2end{array} ight) = (egin{array}{cccc} mathbf{i}_2 & mathbf{j}_2 & mathbf{k}_2 & mathbf{O_2}end{array})left(egin{array}{c}x_2 \ y_2 \ z_2 \ o_2 end{array} ight)end{equation}

那么怎么建立$( ef{p1})$和$( ef{p2})$之间的联系呢？还是之前我们说的，任意一个三维向量都可以表示用三个不共面的向量表示，所以$mathbf{i}_2, mathbf{j}_2, mathbf{k}_2$可以用$mathbf{i}_1, mathbf{j}_1, mathbf{k}_1$线性表出：

$$mathbf{i}_2 = T_{11} mathbf{i}_1 + T_{21} mathbf{j}_1 + T_{31} mathbf{k}_1 + 0 mathbf{O}_1$$

$$mathbf{j}_2 = T_{12} mathbf{i}_1 + T_{22} mathbf{j}_1 + T_{32} mathbf{k}_1 + 0 mathbf{O}_1$$

$$mathbf{k}_2 = T_{13} mathbf{i}_1 + T_{23} mathbf{j}_1 + T_{33} mathbf{k}_1 + 0 mathbf{O}_1$$

$$mathbf{O}_2 = T_{14} mathbf{i}_1 + T_{24} mathbf{j}_1 + T_{34} mathbf{k}_1 + T_{44} mathbf{O}_1$$

即：

$$(egin{array}{cccc}mathbf{i}_2 & mathbf{j}_2 & mathbf{k}_2 & mathbf{O}_2 end{array}) = (egin{array}{cccc}mathbf{i}_1 & mathbf{j}_1 & mathbf{k}_1 & mathbf{O}_1 end{array})left(egin{array}{cccc}T_{11} & T_{12} & T_{13} & T_{14} \T_{21} & T_{22} & T_{23} & T_{24}\T_{31} & T_{32} & T_{33} & T_{34}\0 & 0 &0& T_{44}end{array} ight)$$

于是，我们就可以写出从$(egin{array}{cccc}x_1 & y_1 & z_1 & o_1 end{array})^{ ext{T}}$变换到$(egin{array}{cccc}x_2 & y_2 & z_2 & o_2 end{array})^{ ext{T}}$的变换表达式为：

$$left(egin{array}{c}x_2 \ y_2 \ z_2 \ o_2 end{array} ight) = (egin{array}{cccc}mathbf{i}_1 & mathbf{j}_1 & mathbf{k}_1 & mathbf{O}_1 end{array})left(egin{array}{cccc}T_{11} & T_{12} & T_{13} & T_{14} \T_{21} & T_{22} & T_{23} & T_{24}\T_{31} & T_{32} & T_{33} & T_{34}\0.0 & 0.0 &0.0& T_{44}end{array} ight)left(egin{array}{c}x_1 \ y_1 \ z_1 \ o_1 end{array} ight) $$

其中，将

$$T=left(egin{array}{cccc}T_{11} & T_{12} & T_{13} & T_{14} \T_{21} & T_{22} & T_{23} & T_{24}\T_{31} & T_{32} & T_{33} & T_{34}\0.0 & 0.0 &0.0& T_{44}end{array} ight)$$

称为坐标变换矩阵。接下来主要就是讲解怎么求基本的坐标变换(仿射变换)矩阵。

3.2 缩放

缩放应该是所有线性变换中最简单的变换了。执行缩放操作，例如将一个向量缩放为原来的$s$倍，相当于原点不变，$x$、$y$、$z$三个坐标轴缩放为原来的$s$倍。根据3.1介绍的，缩放操作的变换矩阵为：

$$T_s = left(egin{array}{cccc}s & 0 & 0 & 0 \ 0 & s & 0 & 0 \ 0 & 0 & s & 0 \ 0 & 0 & 0 & 1end{array} ight)$$

3.3 平移

所谓平移，就是在坐标系中的三个坐标轴保持不变，原点沿着平移向量移动到新位置。假设平移向量为$v_p = (egin{array}{cccc}x_p & y_p & z_p & 0 end{array})$同样，根据可以得到，平移操作的变换矩阵为：

$$T_p = left(egin{array}{cccc}1 & 0 & 0 & x_p \ 0 & 1 & 0 & y_p \ 0 & 0 & 1 & z_p \ 0 & 0 & 0 & 1end{array} ight)$$

3.4 旋转

最后来推导最难的旋转变换矩阵。与平移、旋转矩阵的不同，旋转矩阵就不那么直观了。下面，我们来具体看一下旋转矩阵的推导，这个推导是执行三次向量的平行四边形法则进行分解得到，整个分解过程如下图所示：

三次分解由不同的颜色表示出来了，分别是红色、浅蓝色和紫色。

已知条件：$mathbf{i}$、$mathbf{j}$和$mathbf{k}$是三维笛卡尔坐标系的基向量，原点为$O$，旋转轴为$mathbf{u}$，也是单位向量，向量$mathbf{i'}$为$x$方向的基向量$mathbf{i}$绕旋转轴$mathbf{u}$旋转$ heta$后的新向量——旋转后坐标系$x$轴的基向量。

我们的目的：将向量$mathbf{i'}$用基向量$mathbf{i}$、$mathbf{j}$和$mathbf{k}$表示出来。

第一步向量分解：将$mathbf{i'}$分解为沿着旋转轴$mathbf{u}$的向量$vec{OA}$和垂直于$mathbf{u}$的向量$vec{OB}$，则：

egin{equation}label{341}mathbf{i'} = vec{OA} + vec{OB}end{equation}

且：

egin{equation}label{342}vec{OA} = u_x mathbf{u} = u_x^2mathbf{i} + u_xu_ymathbf{j} + u_xu_zmathbf{k}end{equation}

第二步向量分解：将$mathbf{i}$分解为沿着旋转轴$mathbf{u}$的向量$vec{OA}$和垂直于$mathbf{u}$的向量$vec{OC}$，则

$$mathbf{i} = vec{OA} + vec{OC}$$

且：

egin{equation}label{344}vec{OC} = mathbf{i} - u_xmathbf{u} = (1-u_x^2)mathbf{i} - u_xu_ymathbf{j} - u_xu_zmathbf{k} end{equation}

第三步向量分解：建立$vec{OB}$与$vec{OC}$之间的联系，将向量$vec{OB}$分解为沿着$vec{OC}$方向的向量$vec{OD}$和垂直于$vec{OB}$的向量$vec{OE}$，则

egin{equation}label{345}vec{OB} = vec{OD} + vec{OE}end{equation}

根据$ ef{344}$可得：

egin{equation}label{346}vec{OD} = |vec{OB}|cos hetafrac{vec{OC}}{|vec{OC}|} = cos heta vec{OC} = cos heta(mathbf{i} - u_xmathbf{u}) = (1-u_x^2)cos heta mathbf{i} - u_xu_ycos heta mathbf{j} -u_xu_zcos heta mathbf{k} end{equation}

另外，注意到$vec{OE}$和$vec{OC}$垂直，$mathbf{u}$是旋转轴，则$mathbf{u}$与平面$OEBD$垂直，所以$mathbf{u}$与$OE$垂直，则$vec{OE}$在向量$mathbf{u}$和向量$vec{OC}$的叉乘向量上，假设 $vec{OF} = mathbf{u} imes vec{OC}$，于是：

$$vec{OE} = kvec{OF} = kmathbf{u} imes vec{OC}=kmathbf{u} imes (mathbf{i} - u_xmathbf{u}) = k mathbf{u} imes mathbf{i}$$

所以现在求出$k$就可以了，由叉乘定义：$|vec{OF}| = |mathbf{u}||vec{OC}|sin(90) = |vec{OC}| = |vec{OB}|$，所以：$k=sin heta$，最后得到

egin{equation}label{349}vec{OE}=sin heta mathbf{u} imes (mathbf{i} - u_xmathbf{u}) = sin heta left(egin{array} mathbf{i} & mathbf{j} & mathbf{k} \ u_x & u_y & u_z \ 1 & 0 & 0 end{array} ight) = u_zsin hetamathbf{j} -u_ysin hetamathbf{k}end{equation}

将$( ef{346})$和$( ef{349})$代入$( ef{345})$得：

egin{equation}label{3410}vec{OB} = (1-u_x^2)cos hetamathbf{i} - (u_xu_ycos heta - u_zsin heta)mathbf{j} - (u_xu_zcos heta + u_ysin heta)mathbf{k} end{equation}

最后，将$( ef{342})$和$( ef{3410})$代入$( ef{341})$可得

$$mathbf{i'} = (cos heta + u_x^2(1-cos heta))mathbf{i} + (u_xu_y(1-cos heta) + u_zsin heta)mathbf{j} + (u_xu_z(1-cos heta) - u_ysin heta)mathbf{k} + 0mathbf{O}$$

其余两个变换后的基向量$mathbf{i'}$和$mathbf{j'}$也可以由$mathbf{i}$、$mathbf{j}$和$mathbf{k}$表示出来，最终得到齐次旋转矩阵为

$$M_r = left(egin{array}{cccc}cos heta+u_x^2(1-cos heta)& u_xu_y(1-cos heta)-u_zsin heta & u_xu_z(1-cos heta+u_ysin heta & 0 \ u_yu_x(1-cos heta)+u_zsin heta & cos heta+u_y^2(1-cos heta) & u_yu_z(1-cos heta)-u_xsin heta & 0 \ u_zu_x(1-cos heta)-u_ysin heta & u_zu_y(1-cos heta)+u_xsin heta & cos heta+u_z^2(1-cos heta) & 0 \ 0 & 0 & 0 & 1end{array} ight)$$

4 总结

最后总结一下，在这篇博文中我们讲述了点及其相对性，接着介绍了向量的概念，由平行四边形法则引出坐标系的概念，然后介绍了点在坐标系下的表示，最后介绍了坐标变换和变换矩阵的概念，给出了三种基本变换——平移变换、旋转变换和缩放变换的变换矩阵。这些矩阵综合运用，就构成了三维空间中复杂的变换了，三维变换是三维图形绘制的基础，也是学习OpenGL时较难理解的知识点之一。