深入GeForce3

  解决带宽问题

  由于一台计算机中的许多部件都依赖于接收数据完成自己的工作,如果一个关键部件的处理速度显著慢于系统其他部分、或者如果数据传输速度不够快,那么整个系统的运行速度也会减缓。计算机显卡就存在这样一个瓶颈问题,很难制造出足够快的显存来传递目前快速图形芯片在高分辨率3D场景处理过程中所需的全部数据。更高的分辨率意味着屏幕上同时要显示出更多的像素,因此,由于每个像素在传送到显示器之前必须存储在显存中,显存总线就需要传输更多的数据。没有象以往那样依赖更快的显存,GeForce3通过更有效地传输数据和只传输绝对需要的数据避开了显存带宽瓶颈的问题。

隐藏表面去除   Nvidia称之为光速显存架构的第一部分是PowerVR和Mosaic芯片设计中已经得到大量论述的关键技术:隐藏表面去除(hidden surface removal)。如果没有这种技术,一块图形芯片必须处理CPU传送来的每个3D对象,甚至那些在最终图像中被临时遮蔽的对象。绘制隐藏对象或表面的过程称之为超量绘制(overdraw),它意味着图形芯片在一个典型3D游戏中要渲染两到四倍于所需的像素。GeForce3通过在绘制一个帧的早期检查深度值来取消隐藏的像素,也就是在应用转换和光源效果之后。Nvidia声称它预防超量绘制的方法在实际处理过程中可以获得50%-100%的性能提升。

交叉显存控制器   GeForce3显存改进的第二部分是交叉显存控制器(crossbar memory controller),实际上就是为了获得更高效率平行工作的四个显存控制器。现在采用DDR显存的显卡可以在每个时钟周期内传输两次128位的数据,可以将此视为一个单独的256位数据包。然而,由足够的小型多边形组成复杂的3D对象,同时每个三角形只需要在屏幕上绘制几个像素这种现象非常普遍。在这种情况下,图形芯片完全不需要256位的数据渲染那些像素,但是在目前的显卡中这个处理过程仍然使用了显存总线的全部256位传输能力。交叉显存控制器使GeForce3有可能利用四个64位通道传输更小的数据包。四个控制器将动态平衡工作量,通过每次传输中处理更多的数据可以在复杂场景中获得最高四倍于目前设计的性能提升。

Ballistics   GeForce3设计的第三个重要特点是传输深度数据(即Z数据,因为在一个XYZ坐标系中深度是Z轴),以便让图形芯片决定在物体交迭时显示哪些像素。由于芯片处理每个像素的时候要考虑到一个Z值,这个数据将是显存和芯片之间数据传递的关键部分。Nvidia已经开发了一个可以将Z轴数据压缩四倍的程序,这也带来了重要的带宽改进。

 

转载自ZDNet China游戏基地

2/4

[上一页][下一页]