【IT168评测中心】NVIDIA发布的G80图形核心占据桌面单卡性能之王已经将近一个季度了,在这段时间内,ATI保持了沉默状态,ATI的旗舰级产品仍然是X1950XTX,而NVIDIA则动作连连,不停地对7600系列、7900系列的降价。不过玩家们会发现,由于缺乏竞争对手,G80显卡的售价仍未见有所松动,随着7900系列的逐渐降价,7900系列和8800系列之间的产品线空隙越来越大,对填补空缺的产品的需求越来越显见。
在NVIDIA的消息中,官方声明暂时没有G81这样的G80简化版本的产品规划,在现下的市场情况下,NVIDIA假如不推出这样的新核心产品,就势要推出8800GTS的简化版本,因此,320MB的8800GTS显卡产品的推出也属情理之中了。
|
XFX 8800GTS 320MB的规格对比与8800GTX也毫不逊色
我们收到了来自四个显卡厂商的GF8800GTS 320MB产品,从电路板、用料等设计上看,它们大致上相同,除了XFX讯景显得比较特别一些,虽然这种高集成度的产品的差别也不会太大。这些显卡具有三个不同的规格,差别比较明显,其中ASL翔升和Colorful七彩虹的显卡规格基本一致,而Foxconn富士康和XFX讯景送来的是两款超频版的8800GTS,核心频率达到了580MHz,显存频率达到了1800MHz,这跟8800GTX官方575MHz/1800MHz的频率一致,而XFX的更为变态,Streaming Processor的频率——也就是Shader的频率——达到了前所未有的1500MHz,8800GTS的官方SP频率为1200MHz,8800GTX的也只有1350MHz,可以看出XFX GF8800GTS 320MB的硬件规格在不少的地方超出了GF8800GTX的标准,弱处只在SP的数量、ROP的数量以及显存的容量。
这些显卡各个不同的一处地方是BIOS的版本,其中XFX的版本号最新。相信XFX也是通过BIOS的不同,而使得其SP流处理器/Shader单元的频率变得如此之高。
![]() |
4款320MB 8800GTS的先行者
下面开始,我们会先介绍一下320MB 8800GTS相对于以往图形芯片的架构优势,再分别介绍4张显卡实物,最后是它们的性能测试数据,并与更为高档的8800GTS 640MB/8800GTX进行对比,到最后,我们将会清楚320MB 8800GTS的真正实力,以及扮演的市场角色。
Unified Shader Architecture统一渲染架构
传统的分离式渲染架构与革新的统一渲染架构
![]() |
在G80以往的图形芯片产品中,都采用了和DirectX Shader Model 3.0对应的分离式的渲染架构,如图所示,Vertex Shader顶点处理器和Pixel Shader像素处理器都属于流水线中的先后一部分,NVIDIA的G7x系列和ATI的R5xx系列都是这样的架构。
![]() |
NVIDIA G70的架构图,代表性产品是GF7600系列和GF7900系列,也是基于Vertex Shader和Pixel Shader分离的架构
![]() |
ATI R5xx系列的Ring Bus架构图,代表性产品是X1900系列,可以清晰地看到Vertex Shader和Pixel Shader的分离架构
在这些分离式架构的产品,Vertex Shader和Pixel Shader都占据了核心的大部分晶体管,事实上在以往的图形核心的时钟频率,就等同于它们的频率,如ATI X1950XTX的核心频率为650MHz,实际上就是说X1950XTX的48个像素处理单元和8个顶点处理单元的频率为650MHz。
说到核心频率,必须注明一下,对于大部分的图形核心产品而言,几乎所有部分都运行在相同的一个频率下面——就是称之为核心频率,而对于NVIDIA而言,早在G70时代起,就将Shader频率和ROP频率分离了,NVIDIA对Shader的频率进行了提升,因此对于G70/G80这些产品而言,需要分别给出核心频率和Shader频率才行——因此我们的测试平台中分别给出了核心、Shader、显存三个频率。
![]() |
实际的应用中,图形操作对Vertex Shader和Pixel Shader的资源需求度以及它们的比率都是不停变化的,传统的分离式渲染架构中固定的VS和PS比率不能很好地适应这些变化,运行中总会出现其中一种Shader过载而另一种Shader处于空闲的状态,这时就浪费了GPU的运行效率。为了打破这种陈旧的架构,同时也为了更好地适应DirectX 10带来的Shader Model 4.0,NVIDIA的G80采用了革命性的渲染架构:Unified Shader Architecture统一着色结构,这是一种Direct X 10推荐的渲染架构。
![]() |
在这种结构中,G80取消了传统意义的Vertex Shader和Pixel Shader,取而代之的是即能扮演Vertex Shader,又能扮演Pixel Shader,还能担当Geometry Shader(DirectX 10 SM 4.0中出现的一种Shader)以及Physical Shader(笔者的创作,指的是Physical Engine物理引擎)等角色的多用途Shader,这个Shader在G80中的名字就是Streaming Processor(流处理器)。
G80核心最多具有128个标量着色单元——其中简化版本的G80-100(就是8800GTS)只有96个——因为源于DX10的Stream Output特性,NVIDIA就自然地称之为Streaming Processor(流处理器)。128个流处理器分为8个区,每个区具有16个Streaming Processor以及4个Texture Address Unit(纹理寻址单元) 以及8个Texture Filtering Unit(纹理过滤单元) ,所有的这些单元共享着一个速度非常快、近乎0延迟的L1缓存。最后输出的数据写入一个全局共享的L2缓存,或者继续输出到ROP单元进行操作,或者重新返回流水线进入Streaming Processor。
整个G80架构提供了128个标量着色单元、64个纹理过滤单元。毫无疑问,这些标量着色单元——Streaming Processor(流处理器)支持SIMD处理。
![]() |
由于Streaming Processor(流处理器)的多面手特性,系统就可以根据自由地实际的图形工作负荷分配Vertex Shader、Pixel Shader、Geometry Shader以及Physical Shader资源,这样图形核心的处理能力就可以得到极高的利用效率。而G80的Streaming Processor(流处理器)的频率非常高,如官方规格的8800GTX的SP频率为1350MHz,8800GTS的SP频率为1200MHz,这比以往架构中运行于较低的500MHz~600MHz的Shader频率要高得多了,这也赋予了G80强大的性能,在我们测试的新版320MB 8800GTS中,XFX的产品甚至达到了1500MHz的Shader频率。
新的统一纹理处理单元
除了SP的多面手特性之外,G80的纹理拾取单元(TF,Texture Filtering Unit)和纹理寻址单元(TA,Texture Address Unit)也和以往的架构不同,如下图所示,NVIDIA以往的设计是VS和PS分别具有自己的TF和FA单元,并且数量通常和VS和PS的数量相对应,如GF7900GTX就拥有24个PS的TF、8个VS的TF,以及总共24个的TA,而ATI的R5xx则采用了稍微不同的设计,它的TF和TA是整个系统共用的,如X1950XTX就具有16个TF和16个TA。
![]() |
NVIDIA G70的架构中,Vertex Shader和Pixel Shader各自具有各自的纹理拾取单元和纹理寻址单元
![]() |
而ATI的R5xx架构中,系统共同享用一套纹理拾取单元和纹理寻址单元,由Ultra-Threading Dispatch Processor统一调度
![]() |
由于采用了统一渲染架构,Vertex Shader和Pixel Shader各自的TF和TA自然也就消失,并统一成为Streaming Processor(流处理器)的TF和TA单元,在单个的SP分区中(8800GTX具有8个SP分区,8800GTS则具有6个SP分区),同时具有着16个Streaming Processor(流处理器)、4个Texture Address Unit(纹理寻址单元) 、8个Texture Filtering Unit(纹理拾取单元),然后TA、TF就直接对极高速的L1缓存进行操作。这样的做法比较类似于ATI的Ring Bus架构的做法,系统具有统一的TA和TF,避免了G70架构VS和PS独立的TF、TA带来的带宽需求冲突以及资源浪费,不同的是G80的TF、TA数量更多。8800GTX具有32个TA、64个TF,8800GTS则具有24个TA、48个TF,远比传统架构的TF、TA单元要来得多,这大大提升了G80在纹理过滤方面的能力,G80能毫无性能损失地执行16x角度无关各向异性过滤的原因也在这里。G80的TA、TF时钟频率仍和传统的做法一样,即等同于核心频率。
Shader Model 4.0
Direct X 10带来了Shader Model 4.0,对于这种渲染架构级别的升级,从来都是影响深远的。和上一代的Shader Model 3.0相比,SM 4.0带来了一个新的统一指令集、更多的寄存器和参数量、更多的整数计算和无限的程序长度,MRT(Multiple Render Target,多渲染目标)也从4个提升到了8个,同时渲染过程的所有阶段都可以存取缓存,同时可以重新进入流水线处理(Stream Output特性),Shader Model 4的批处理效率更高,对CPU的依赖更低。
![]() |
显存配置
![]() |
为了让Unified Shader Architecture统一着色结构具有很高的效率,G80必须提供巨大的显存带宽,以应付Stream Output特性带来的重复多次处理过程,上面提及8800GTX的8个Streaming Processor分区就对应着8个芯片内建的极快速L1缓存(8800GTS则是6个),然后通过一个交换结构,所有的Streaming Processor分区都可以任意地将数据传输给6个ROP(Raster Operations)分区或者6个L2缓存(8800GTS为5个),这6个ROP分区或者6个L2缓存再通过6个64bit的内存界面存取显存(8800GTS为5个),由于是交换结构,因此存取效率很高,所有的内存带宽都能得到高效的利用。
原始的8800GTS采用的是640MB内存,而我们测试的新版本8800GTS采用了320MB的配置,由于显存带宽并没有降低,因此8800GTS 320MB版本的性能并不弱。
HDR+AA+AF/Lumenex Engine流明引擎
玩家们可能会对G80可以同时实现HDR和AA的特性熟知能详了,基于NVIDIA最新的Lumenex Engine流明引擎,G80完美地解决了这个问题,还更进一步提升了图像质量。
G80的High Dynamic Range (HDR,高动态范围)光照特性现在支持128-bit精度(32-bit每通道,RGB+Alpha),提供了非常真实的光影效果,而过去的7系列GeForce只能实现64-bit精度(16-bit每通道)。新的HDR技术让暗的地方更暗,亮的地方更亮,在两个极端都能同时得到完美的细节表现,同时过渡也更加平滑,实际上,NVIDIA称之为True HDA技术。
G80的Lumenex Engine提供了全新的超高质量Anti-Aliasing(抗锯齿)和AF(Anisotropic Filtering,各项异性过滤)引擎。传统的超采样技术通常都只是对模型的覆盖面进行采样,G80的新抗锯齿技术同时使用到了覆盖面采样和几何采样,最后被称为Coverage Sampling Antialiasing(CSAA), 即覆盖面采样抗锯齿。G80图形芯片仍旧支持Multisampling Anti-Aliasing(MSAA),SupersamplingAnti-Aliasing(SSAA),以及Transprency Adaptive Anti-Aliasing(TAA,透明度适应性抗锯齿)特性,并增加了4种单GPU AA模式:8x,8xQ,16x和16xQ,16xQ是目前桌面PC的抗锯齿所能达到的最高画质的抗锯齿。
![]() |
16x CSAA提供了更完美的AA效果,同时NVIDIA表明,在大部分情况下,使用16x AA模式可以达到4x MSAA模式相似的性能,这意味着几乎所有的游戏都可以立即享受到16x AA模式带来的画质。
Anisotropic Filtering各项异性过滤也有了进步,现在NVIDIA可以提供角度无关的各项异性过滤,可以明显地提升AF效果,G80支持16x的AF模式,关于G80的AA、AF等的详细的功能、技术细节,可以参阅3D世界的革命 GF8800显卡深入剖析、摆脱邋遢锯齿 更平滑动人的曲线、和远近如一 更平滑动人的曲线。
![]() |
ASL翔升近来在显卡方面下了不少力气,其高端产品系列都以权杖命名。
![]() |
简洁设计的散热器印刷。
![]() |
Sanyo SVP固体聚合物电容。
![]() |
双卡槽双DVI-I接口设计,G80显卡都采取了这样的设计。
![]() |
320MB Hynix HY5AS573225A FP-11 GDDR3显存,速度1.1ns,被设定运行在1600MHz频率下,还具有超频的一点空间。
![]() |
NVIO芯片提供了10bit色彩输出能力。
![]() |
A2步进的G80-100核心,集成了6.81亿晶体管。
![]() |
![]() |
![]() |
七彩虹是国内强劲的通路厂商,此次在推出320MB G80显卡方面能抢先一步,也表明了七彩虹的实力。
![]() |
只有风扇印刷进行了改动。
![]() |
![]() |
我们发现七彩虹也采用了1.1ns的Hynix HY5AS573225A FP-11 GDDR3显存颗粒,而七彩虹8800GTS的显存频率被设定为1600MHz,这表明其具有一定的超频能力。
![]() |
![]() |
![]() |
外表坚固耐用的G80-100核心。
![]() |
![]() |
![]() |
![]() |
FOXCONN富士康进入显卡尚不算太久。富士康8800GTS的包装看起来比较卡通化一些。
![]() |
主卡外形看起来就比较科幻,除去印刷图案的不同,各个8800GTS的散热器并无不一致之处。
![]() |
![]() |
|
![]() |
![]() |
一样是Hynix HY5AS573225A FP-11 GDDR3显存颗粒,总容量当然也是320MB,速度1.1ns,富士康320MB 8800GTS的显存频率也是1800MHz。
![]() |
NVIO负责色彩输出,IO包含有输入的意思,然而我们猜测SLI使用的MIO接口是直接跟GPU连接的,并不经过NVIO芯片。
![]() |
都采用了A2步进的G80-100核心。
|
![]() |
![]() |
XFX的一贯黑白风格。
![]() |
从外观上看,和XFX640MB 8800GTS的没有什么分别,显存上的不同被厚实的散热器遮盖住了。
![]() |
双卡槽设计,一个槽放置两个Dual-Link DVI-I接口,另一个卡槽作为散热器的出风口。G80系列显卡全面支持10bit的色彩输出。
![]() |
|
![]() |
XFX 320MB 8800GTS也使用了Hynix的HY5AS573225A FP-11 GDDR3显存,总容量为320MB,速度为1.1ns,刚好和默认的1800MHz运行频率相对应。我们测试的所有320MB 8800GTS都采用了1.1ns的显存。
![]() |
NVIO芯片,由于是模拟、数字电路混合的芯片,并且支持真正的10bit色彩输出,集成在图形核心内的难度就升高了,NVIDIA就将其设计在GPU外部。
![]() |
一丝不苟的供电线路,三洋SVP固态聚合物电容,不敢马虎。
![]() |
G80-100是8800GTS的核心编号,假如为G80-300,那么就是一块8800GTX显卡。这个G80-100核心集成了6.81亿晶体管,因此看上去面积颇大,由于采用了金属散热外壳封装设计,因此拆卸散热器导致显卡损坏的心理压力也就消失了。
![]() |
![]() |
![]() |
|
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Doom3、HL2、Quake 4是三款代表性的OpenGL游戏。
![]() |
|
NFS和FEAR则是两款Direct3D游戏。
实际游戏中也表现出跟3DMark相似的结果,不同的是,两款标准规格的320MB 8800GTS性能要比XFX 640MB 8800GTS要略低,差距很小,而两款超频的320MB 8800GTS——FOXCONN和XFX的,则性能要比XFX 640MB 8800GTS要高出不少,而且XFX 320MB 8800GTS的性能在多个游戏中都接近8800GTX的成绩,8800GTX只有在FEAR测试当中表现出明显的优势。
【IT168评测中心】凭着过往的经验,不怎么用测试我们就可以猜测这些320MB 8800GTS显卡具有很不错的性能,而由于少了一半的显存,它们的价格要比高一档的640MB 8800GTS要低一千元以上,这无疑是非常大的诱惑。320MB 8800GTS填补了79系列和原来G80之间的市场空隙,而较低的价格,将会迅速提升G80的市场占有率,将会对价格要高、性能却未必要高的X1950XTX造成很大的威胁。
![]() |
代表性的高端产品对比图,G80的一体化Shader架构拥有较好的优势
通过测试,我们可以看到,320MB 8800GTS具有着强劲的性能,缺少的320MB显存对性能的影响非常之小。标准规格的320MB 8800GTS跟640MB 8800GTS的频率规格是一致,因此它们在实际的表现中成绩非常接近,如ASL翔升和Colorful七彩虹的两块320MB 8800GTS;超频规格的320MB 8800GTS非常之强劲,如FOXCONN富士康的和XFX讯景的,这两块320MB 8800GTS的性能表现都超越了XFX 640MB 8800GTS,其中XFX讯景的320MB 8800GTS由于1500MHz的SP/Shader频率,远超出了8800GTS/GTX默认的1200MHz/1350MHz规格,因此其性能非常之强劲,和顶端的8800GTX性能相去不远。
![]() |
320MB 8800GTS的价格要比640MB 8800GTS的价格低上千元左右,性能相近甚至有些还要更好。作为最超值的G80显卡,320MB 8800GTS一样拥有G80的统一渲染架构带来的好处,如SM4.0、128bit HDR + 16x FSAA + 16x AF等全新特性,虽然其2千元到3千元的价格离中端显卡的价格段还有些距离,然而这确实是一个以较低的价格享受到高端的性能和最高端的技术的大好机会。
320MB 8800GTS作为一个杀手级产品,用性能和价格将玩家深深折服,相信会有不少的发烧友准备行动了。

