![]() |
从上面的架构图可以看出,G70拥有8个顶点着色单元,它的fragment shader(片段着色器,顶点经过三角形设置引擎后被称为fragment)有24条(6个quads操作),16条ROP(光栅输出处理),这意味着它在每周期最大像素采样下可以进行16色或32 Z缓存/模板操作,这种结构的片段着色器和ROP的配置非常类似NV43,这也说明了显卡瓶颈在于像素着色处理器上。内存总线仍然是256位,分成四个区块。
![]() |
G70拥有8个顶点着色单元,采用MIMD(多指令、多数据)架构,和NV40一样,它的每个单元包括一个矢量运算单元和一个标量运算单元,在一个周期可以并行执行两条指令,而且没有指令分支的性能损失。NVIDIA表示,每个顶点着色单元具有一个顶点fetch(拾取)处理,它能够拾取四个点采样材质。G70的顶点着色单元具有单周期的MADD能力,它提升了超标量性能。NVIDIA提升了顶点剔除和设置能力,增加了顶点着色单元的呑吐量。
G70采用了一个快速的三角形设置引擎,可以更快的完成顶点到fragment(像素)的转换。
![]() |
像素着色管线的改进较大,同NV40一样,G70采用了超标量架构,第一个像素着色单元具有浮点材质地址处理单元,NVIDIA增加了每时钟周期材质地址处理性能,达到双倍材质地址处理能力。乘法和加法是三维图形芯片常用的数学函数,也被称为乘-加(MADD)运算。在转换、照明、法线贴图运算以及许多其他运算中,都包含这种运算方式。G70在第一个像素着色单元中增加了MADD处理能力,G70的MADD运算能力最高可达上一代GPU的两倍。

