Reversed-Z详解

　　在3D渲染管线中，Z这个家伙几乎无处不在，如Z-Buffer，Early-Z，Z-Cull，Z-Test，Z-Write等等，稍有接触图形学的人都会对这些术语有所耳闻。

　　那么Z到底是什么呢？首先Z当然可以是任意坐标系下的z坐标值，但我们这里要说的Z值，就是深度值，上面几个包含Z的术语里面的Z也都是深度值的意思，深度值是物体变换到屏幕空间后的z坐标的值，因为NDC空间转屏幕空间时并不会改变z值，所以也可以说是NDC空间中z坐标的值，有些读者可能认为在屏幕空间中Z值已经不存在了，这也是有道理的，因为屏幕是一个2d空间，没有z轴，但我们在这里不做2d，3d区别，认为都有z轴。在DirectX中，Z值得取值范围是[0,1]，在OpenGL中，其取值范围为[-1,1]，这篇拟在DirectX环境下讨论Z。

　　Z值的推导请参见：

http://www.codeguru.com/cpp/misc/misc/graphics/article.php/c10123/Deriving-Projection-Matrices.htm

　　这里我们直接用上文中的一个结果（建议没推导过的读者按照这一篇的思路推导一遍，必定会受益匪浅），即Z值在透视投影后的结果：

$$ZZ_{c}={frac{f}{f-n}Z_{c}}-{frac{fn}{f-n}}$$

　　上面的方程中，$Z$即我们要求的深度值，$Z_{c}$是物体在Eye Space中的z坐标，f是视锥体远裁剪*面在Eye Space中的z坐标，n是视锥体*裁剪*面在Eye Space中的z坐标。由上式可求得($ZZ_{c}$其实是Clip Space中的z值，除以$Z_{c}$就是透视除法，得到NDC空间的z值，也即是深度值Z)：

$$Z={frac{f}{f-n}}-{frac{fn}{(f-n)*Z_{c}}}quad ①$$

　　对于$Z_{c}$，我们可以证明其关于物体在World Space中的z值$Z_{w}$为线性关系，那么根据上式可知$Z$与$Z_{c}$、$Z_{w}$皆不为线性关系。简单起见，我们取f=1000，n=0.01，有：

$$Z≈-{frac{0.01}{Z_{c}}}+1quad②$$

其函数图像如下（$Z_{c}>0$）:

图1

　　图中A点表明了$Z_{c}$∈[0.01,0.1]的物体占用了十分之九（0~0.9）的深度值，这说明在z轴方向上与相机距离为0.1到1000的物体只用到了十分之一（0.9~1.0）的深度值。这个结果是令人印象深刻的，因为Z值的分布太不均匀了，就好像世界上的绝大部分钱都被一个人占有了一样。那Z值的分布情况对于3d渲染来说重要吗？它意味着什么呢？

　　深度值的不均分分配会导致非常严重的后果，那就是Z-Fighting。深度值的取值范围是[0,1]，但这并不代表它存到Z-Buffer里面后也一定是[0,1]的浮点数，事实上在过去很长一段时间乃至现在很多时候，深度值被保存在16位或者24位的无符号整数中。这里我们用范围更小的16位来存储深度值，因为这能更好的凸显出问题。当深度值存储为16位无符号整型格式时，其取值范围是[0,65535]，现在我们来算一算当深度值为65534时，$Z_{c}$是多少?65534映射到[0,1]中，值为65534/65535。连同f=1000，n=0.01代入①式（①比②可获得更精确的结果）可解得：$Z_{c}$≈395.9005401718437≈395.9，这说明在Eye Space中在z轴方向上距离相机395.9到1000的物体的深度值都是65535！当两个物体拥有同样的深度值时，就会产生非常丑陋的Z-Fighting(详见：https://en.wikipedia.org/wiki/Z-fighting）:

(相同的深度值导致GPU不能正确分辨哪个在前，哪个在后)。

在3d渲染中，应该尽可能的避免产生Z-Fighting，即应该尽可能的改善深度值分布的均匀程度。提高用来保存深度值类型的精度可以起到改善z值冲突的情况，比如用24位甚至32位的数据类型来存储深度会比16位好很多，但由于硬件条件的限制和Z值的非线性增长，目前来说不可能用太多位的硬件出现。有的人也许会想到用浮点数来保存深度值，但其实这毫无作用的，甚至可以说更为浪费，因为对于32位浮点数，其尾数（Mantissa）只有23位二进制数，规格化浮点数加上一位保留位也只有24位，这与24位无符号整数表示的精度是一样的，而浮点数还多使用了8位来存储其他信息。另外，虽然浮点数本身表示的范围更广，但我们知道深度值的范围不过为[0,1]，当我们用浮点数来存储深度值时，当然不会再去做映射，这样，深度值其实只占到了范围在[0,1]的浮点数所占的精度，这势必就更少了，不过好在浮点数的精度分布也主要分布在0值附*，0值附*的符点数拥有更好的精度，但不管怎样，目前来说想依靠浮点数来改善状况是不可取的。

　　除了提高Z-Buffer的精度以外，还有一些方法也可以改善Z值冲突的情况，如增大*裁面与相机位置z值距离（即n值）就是一种方法。对①式我们取n=0.1，f=1000（不变），有：

$$Z≈-frac{0.1}{Z_{c}}+1$$

其图像如下：

图2

　　对比图1，图2的情况好了很多，对比两个图中的点A，前0.9的深度值表示的范围从0.1扩大到了1，说明有更多的深度值用来表示$Z_{c}$比较大的情况，如果还以16位无符号整数来存储深度值，计算后可得$Z_{c}$在区间[868,1000]时共享65535这个深度值，这比[396,1000]的冲突少了非常多，降低了出现Z-Fighting的概率。而我们仅仅是将n从0.01提高到0.1而已，这对一般的应用场景几乎不会产生影响。

　　既然如此，我们将n值继续增大，比如取n=100，会怎样呢?我们将n=100，f=1000（不变）代入1式得：

$$Z=-frac{1000}{9Z_{c}}+frac{10}{9}$$

图像如下（我必须把x轴压缩400倍才能截个图）：

图3

　　可以看到0到0.9的深度值已经可以表示到大约=600的时候了，要知道n=0.01的时候， 0.9的深度值$Z_{c}$只能表示到0.1；n=0.1的时候$Z_{c}$只能表示到1。依然将深度值存入到无符号整型中，我们可以计算出当物体的$Z_{c}$∈[999.863,1000]时，它们才共用65535这个深度值，通过取n=100我们很好地改善了Z值的分布情况。至少看起来已经是个很好——甚至可以说*乎完美的办法了。但是，事实并非如此，由于取得n=100，我们舍弃了整个$Z_{c}$∈[0,100]的物体，我们将永远看不到那些离相机z轴距离少于100的物体！增大*裁剪面的值以换取深度值的分布均匀程度，难言利弊得失。

难道就没有更好的改善深度值分布的办法了吗？当然有了，办法就是神奇的Reversed-Z，Reversed-Z的做法其实是很简单的，即将原本*裁剪*面映射到深度值0，远裁剪*面映射到深度值1的映射关系反过来，让*裁剪*面映射到深度值1，远裁剪*面映射到深度值0。即将[n,f]映射到[1,0]，按照上文给出的投影矩阵推导链接中的方法，我们可以推导出Reversed-Z的情况下Z与$Z_{c}$的关系（其实就是①式中n与f互换）：

$$Z={frac{n}{n-f}}-{frac{fn}{(n-f)*Z_{c}}}$$

　　我们取n=0.1，f=1000，有：

$$Z≈frac{0.1}{Z_{c}}$$

函数图像如下：

图4

看到上面的图，细心的读者可能会发现，这不跟图2一样嘛，都是$Z_{c}$=1的时候，深度值Z就用了十分之九（0.9）了，不过是前者是[0, 0.9]，这里是[0.1, 1]而已，有区别吗？如果我们还是以无符号整型来存储深度值，的确对我们达成目的没有帮助，依然是靠**裁剪*面的少数物体占据了大多数深度值。但是我说过Reversed-Z是神奇的，它的神奇之处是当它搭配上我前面否定过的浮点数时，Reversed-Z在"提高深度值均分分布程度" 这件事上就变得非常有效了。

让我们回到浮点数，前面有提到过 "0值附*的符点数拥有更好的精度"，这是有依据的，浮点数具体介绍请参考维基百科：https://en.wikipedia.org/wiki/IEEE_floating_point，这里以单精度符点类型做简单说明。规约化单精度浮点数的有效位数只有7位（实际是7点多位，这里简单起见取7），当一个浮点数小于1的时候，它可以确保有6位小数位是精确的，也就是说，在(0,1)这个开区间内至少可以包含999999（6位）个误差允许的单精度浮点数，1~9同理，但由于非规约化浮点数（主要是在0值左右）的存在，使得(0,1)这个区间内的浮点数个数要比(1,2),(2,3)…(9,10)这些区间内的符点数要多。在(10, 11)这个区间内，由于整数位占去了两位，所以这个区间内至少只可以包含99999（5位）个有效单精度浮点数，以此类推，(100,101)开区间内包含9999个有效单精度浮点数，(1000,1001)开区间内包含999个有效单精度浮点数等等，当数量级来到[1000000,1000001]时(注意这里是闭区间)，这个区间内能保证有效的单精度浮点数不过就两个：1000000与1000001本身。这说明浮点数的分布与深度值的分布一样是不均与的，越靠*0的浮点数分布越密集，越远离0的浮点数分布越稀疏：

浮点数分布情况图

　　当我们用正常的Z值系统（[n,f]映射到[0,1]）与浮点数配合时，符点数没有任何帮助(原谅这个不一样的画风，由于我还不太会使用GeogeBra作图，我把本文的主要参考文章Depth Precision Visualized的图拿过来用了)：

图5

　　图5中z1到z2这么远的距离依然只共享一个深度值0.99。

但当我们将Reversed-Z（[n,f]映射到[1,0]）与浮点数结合起来，情况就变成了：

图6

随着$Z_{c}$的增大，深度值Z的降幅越来越小，看似又要陷入精度不够的死胡同，但浮点数的分布规律恰好弥补了这一不足，使得较大的也有足够的精度表示，图6中z1到z2比之图5中多获得了5个深度值。这样，距离相机*和远的物体分得的深度值就比较*均了，变相的实现了"改善深度值分布状况"这一目的，从而也达到了降低Z-Fighting出现的概率（是的，虽然Reversed-Z这么神奇，但Z-Fighting还是不能完全避免的，虽然概率已经降到很低）。

作为依赖Unity引擎的开发者，很高兴看到Unity在其5.5以及以后的版本中引入了Reversed-Z的做法，在这里也提醒一下大家以后为Unity写shader的时候，如果用到深度值Z，一定要记得 [n,f] 是映射到[1,0]，否则就会写出错误的效果J。

参考与说明：

本文参考：Depth Precision Visualized，对Reversed-Z进行思考与分析，希望能对读者有所帮助。

文中的函数图像使用GeoGeBra软件绘制，公式用LaTex 语法写成。