G70的架构改进

从上面的架构图可以看出，G70拥有8个顶点着色单元，它的fragment shader（片段着色器，顶点经过三角形设置引擎后被称为fragment）有24条（6个quads操作），16条ROP（光栅输出处理），这意味着它在每周期最大像素采样下可以进行16色或32 Z缓存/模板操作，这种结构的片段着色器和ROP的配置非常类似NV43，这也说明了显卡瓶颈在于像素着色处理器上。内存总线仍然是256位，分成四个区块。

G70拥有8个顶点着色单元，采用MIMD（多指令、多数据）架构，和NV40一样，它的每个单元包括一个矢量运算单元和一个标量运算单元，在一个周期可以并行执行两条指令，而且没有指令分支的性能损失。NVIDIA表示，每个顶点着色单元具有一个顶点fetch（拾取）处理，它能够拾取四个点采样材质。G70的顶点着色单元具有单周期的MADD能力，它提升了超标量性能。NVIDIA提升了顶点剔除和设置能力，增加了顶点着色单元的呑吐量。

G70采用了一个快速的三角形设置引擎，可以更快的完成顶点到fragment（像素）的转换。

像素着色管线的改进较大，同NV40一样，G70采用了超标量架构，第一个像素着色单元具有浮点材质地址处理单元，NVIDIA增加了每时钟周期材质地址处理性能，达到双倍材质地址处理能力。乘法和加法是三维图形芯片常用的数学函数，也被称为乘-加（MADD）运算。在转换、照明、法线贴图运算以及许多其他运算中，都包含这种运算方式。G70在第一个像素着色单元中增加了MADD处理能力，G70的MADD运算能力最高可达上一代GPU的两倍。

相关文章

分享到