Display Lists在内存中的形式

OpenGL显示列表的设计能优化程序运行性能,尤其是网络性能。它被设计成命令高速缓存,而不是动态数据库缓存。也就是说,一旦建立了显示列表,就不能修改它。因为若显示列表可以被修改,则显示列表的搜索、内存管理的执行等开销会降低性能。

  采用显示列表方式绘图一般要比瞬时方式快,尤其是显示列表方式可以大量地提高网络性能,即当通过网络发出绘图命令时,由于显示列表驻留在服务器中,因而使网络的负担减轻到最小。另外,在单用户的机器上,显示列表同样可以提高效率。因为一旦显示列表被处理成适合于图形硬件的格式,则不同的OpenGL实现对命令的优化程度也不同。例如旋转矩阵函数glRotate*(),若将它置于显示列表中,则可大大提高性能。因为旋转矩阵的计算并不简单,包含有平方、三角函数等复杂运算,而在显示列表中,它只被存储为最终的旋转矩阵,于是执行起来如同硬件执行函数glMultMatrix()一样快。一般来说,显示列表能将许多相邻的矩阵变换结合成单个的矩阵乘法,从而加快速度。

用来绘图并且维护显示列表内容的硬件被称作图形加速器。图形加速器一般都有一个预先分配好的内存区域来维护显示列表内容(译者:注意,不一定是主内存)。图像中每个可见的象素都由图形加速器中的一个或更多的字节内存来描述。一个灰度图可能只有一个字节来表述象素的灰度。而一个彩色图像则可能给红,绿,蓝每个分量各分配一个字节。T为了保持在屏幕上不闪烁地显示,这个所谓的显示内存每秒钟要被扫描相当多次。图形加速器通常还有一个叫做“脱屏缓存”(OFFSCREEN MEMORY)的内存区域,这个缓存是无法被显示的,它被用来存储那些不可见的信息。

  OpenGL假设显示内存和脱屏缓存由窗口系统来管理。窗口系统决定内存的哪一部分可以被OpenGL访问以及这些部分是如何组织的。在每个OpenGL的环境里,都有一个函数集(其包含函数通常不多)来把OpenGL绑定到某个特别的环境上。在MS的Windows环境中,这组函数叫做WGL。在X窗口系统环境下,这组函数叫做GLX。在苹果机上,这组函数又叫做AGL。在每个环境里,这些函数都提供对图形内存区域的分配/释放操作的支持。分配/释放的数据结构叫做图形上下文(CONTEXT),图形上下文里存储了OpenGL状态,当前图形上下文的选择情况,哪快图形内存是用来绘制的,以及OpenGL与窗口系统之间的指令同步。

  随着OpenGL的渲染而改变内容的那一部分图形内存区域叫做帧缓存(frame buffer)。在窗口系统里,OpenGL通过帧缓存来与窗口通信。窗口系统为OpenGL提供了一组工具来为窗口选择帧缓存特性,而这组工具,通常是系统相关的。典型地,窗口系统也会制定当窗口重叠时OpenGL帧缓存的行为。在没有窗口的系统中,OpenGL帧缓存与整个显示设备通信。


一个支持OpenGL渲染的窗口 (即帧缓存) 可能包含以下的组合:

· 至多4个颜色缓存

· 一个深度缓存

· 一个模板缓存

· 一个积累缓存

· 一个多重采样缓存

  为了能够执行双缓存构架,大多数图形硬件同时支持前后缓存。这将允许应用程序在显示前缓存(可见的)的时候渲染到后缓存(离屏缓存)。当渲染结束的时候,这两个缓存进行交换,以便已经完成渲染的缓存像前缓存一样进行显示,这样渲染就能在后缓存重新开始了。一旦使用双缓存,在绘制过程当中用户将不能看到图像。这种技术通常被用来实现实时交互的平滑动画。

  如果为左眼和右眼各实现一个颜色缓存的话,那么就可以支持立体视觉效果了。双缓存技术由前后缓存来支持。因此一个双缓存的立体视觉将会有4各颜色缓存:前左,前右,后左,后右。一个普通的(非立体的)双缓存窗口将会仅仅有前后两个缓存。一个单缓存的窗口将会只有一个缓存。

  如果绘制3D对象时需要剔除隐藏表面的话,深度缓存是必要的。这个缓存在每个象素上存储了显示对象的深度值。当绘制附加对象的时候,会在每个象素上进行深度比较,这样就能决定新的对象是否可见。

  模板缓存用来进行复杂的掩模(masking)操作。一个复杂的形状可以存储在模板缓存里,然后绘制子序列操作可以使用模板缓存里的内容来决定是否更新象素。

  积累缓存是一个颜色缓存,不过典型地它有比颜色缓存更高的精度。这就允许一些图像通过积累产生一些合成的图像。比如说一个作用就是可以在积累缓存里对一个对象随着他的运动绘制一些帧数。在积累缓存中的象素除以帧数以后,结果图像就展现出了运动模糊效果。相似的技巧也可以用来模拟景深效果以及高质量的全屏抗锯齿。

  而通常的,当一个对象被绘制的时候,对于某个图元是否影像屏幕上的象素,会做一个单独的决议。多重采样缓存正是这样一个缓存,它允许每个渲染的对象在象素内被采样多次,以进行高质量的全屏抗锯齿,而不必对这个对象渲染多次。每个象素内的采样包括:颜色,深度,模板信息。每个象素采样的次数当然是必须的。当窗口包含多重采样缓存的时候,它将不回包括单独的深度或者是模板缓存。随着对象的渲染,颜色样本会被组合生成一个单一的颜色值,然后这个颜色值被传递,并写入到颜色缓存里。因为他们包括窗口中每个象素的多个颜色、深度以及模板样本(通常是4,8或者是16),因此多重采样缓存会消耗相当数量的离屏缓存。

立即模式

显示列表 

保留模式

显示列表的数据放哪里不是固定的,而是要看具体优化,显示列表只是提供了优化的可能性。
原则上说,概念上是server memory。实现上,包括显存、驱动内核级内存、驱动用户级内存。
顶点和纹理是可以放到显存的,但其它的操作还是需要驱动来调度的。显存不够时当然就要做内存交换。

提高速度,并不只是因为显存快,而是还有并行。GL提出server/client的两部分不只是为了支持远程模式,也包含了两部分是并行的含义,这和硬件加速下的情况是一样的。GPU和驱动都是与用户程序并行的。

-------lidudu

原文地址:https://www.cnblogs.com/minggoddess/p/1908732.html