【IT168评测室】前段时间我们评测了五舟的双路Nocona 2U服务器,接着他们又送来了一台1U的双路Nocona 服务器,更低的机架高度降低了托管的成本以及提高了单位运算能力,极适合于要求不高的入门服务器场合或者需要进行服务器群集。
这台服务器仍旧使用Intel的64位Xeon CPU Nocona,1U服务器的配置通常不会太高,这台服务器配备了2个2.8G的Nocona,使用了IntelE7320芯片组,支持PCI Express,支持PCI-X 66MHz,同时支持SATA RAID和Ultra 320 SCSI和SCSI RAID 0、1,是中小型服务器的理想选择。
![]() |
Nocona具有四项新的核心技术:
(1)Demand Based Switching(按需切换技术):通过EIST(Enhanced Intel SpeedStep Technology,增强型英特尔SpeedStep技术)实现DBS,动态调整处理器电压和内核频率,支持软件电源管理特性,使系统在获得优异的应用特性的同时降低平均功耗;EIST(增强型英特尔Speedstep技术)可让系统动态调整处理器电压和内核频率,从而降低能耗而减少产生的热量,降低能量消耗和能源成本。
(2)PCI Express技术:Intel发起的一种新型串行总线技术,做为PCI总线的下一代,已经得到了广泛的应用。PCI Express总线使输入输出达到了最高8GB/s的双向带宽。与以前的PCI/PCI-X总线相比,改进了RAS特性,缩短了延迟,提高了输入输出性能。同时,它与PCI/PCI-X总线实现软件兼容,可简化并行到串行的移植。
(3)Intel EM64T(Intel Extended Memory 64 Technology,64位英特尔内存扩展技术):可以实现64位内存地址寻址,大大提高了服务器内存的寻址空间,也为服务器的高容量内存提供了可能。在这一内存架构中,增加了8组128位XMM寄存器,将为单指令多数据流(SIMD)技术提供更多的运算空间。这些128位的寄存器将提供在矢量和标量计算模式下进行128位双精度处理的能力,为3D建模、矢量分析和虚拟现实的实现提供64位的硬件基础。通过这些新增的寄存器,可以在一个时钟周期中传输更多的信息。
(4)DDR2内存技术:Nocona支持最新的内存技术DDR2 400,与DDR333相比,它使内存带宽提高了20%,而功耗降低了40%,提高了每个系统的内存容量,也增强了内存的可扩展性。
此外,和老至强一样,Nocona也支持Hyper-Threading(超线程)技术。Hyper-Threading(超线程)技术通过在处理器上复制体系结构状态,同时共享一组处理器的执行资源,可实现线程级并行处理。因为通常的CPU的执行单元并不是任何时候都100%满负荷运转的,总有一些资源处于空闲状态,Hyper-Threading的本质就是提高CPU执行单元的利用效率,并将其转换为实际运算能力的提高。Hyper-Threading(超线程)技术增强设计用于改进多线程应用的性能,同时扩展的SIMD流指令扩展3(SSE3)能够显著改进线程同步性能,从而可为诸如媒体和游戏等应用带来出色的系统响应能力。在安排线程时,操作系统将两个单独的体系结构状态视为独立的Logical(逻辑)处理器,从而使得支持多处理器的软件无需修改,便可以在其上同时运行两个线程,如同系统含有多个逻辑处理器一样。Hyper-Threading(超线程)可以明显地增强系统的多任务处理能力。同时Nocona同时支持2个CPU SMP(对称多处理),在系统内最多可以模拟出4个处理器。若还需要更多的处理能力,则需要使用更加昂贵的Nocona MP,可以实现4路或者更多路的SMP。Hyper-Threading(超线程)意义非凡。
Nocona的显著特性还在于支持32位应用程序的同时,运行64位应用程序,因此Nocona处理器能够兼容当前市场上所有的基于16位和32位软件,同时对64位架构下开发的应用软件也完全兼容。
Nocona使用的新技术之中,EM64T是全新引入的核心技术,下面简单介绍一下。
Intel EM64T(Intel Extended Memory 64 Technology,64位英特尔内存扩展技术)为服务器和工作站平台应用提供扩充的内存寻址能力,拥有更多的内存地址空间,可带来更大的应用灵活性,理论上最大可使用16EB(16×10亿×10亿字节),足够满足当前和将来的软件应用需求,特别有利于提升音视频编辑、CAD等复杂工程软件及游戏软件的应用。而普通的32位CPU可寻址内存最大为4GB(约40亿字节)。Intel服务器CPU中目前只有800MHz前端系统总线的Nocona至强支持EM64T技术。
![]() |
EM64T CPU提供3种运行模式,同时支持旧的32位的操作系统和应用程序和64位的操作系统和应用程序。
按照Intel官方网站的说明,EM64T的特点如下:
64-bit pointers(64位指针)
64-bit wide general purpose registers(64位宽通用寄存器)
64-bit integer support (支持64位整数)
Up to 1 terabyte (TB) of platform address space (高达1TB的平台寻址空间)
遗憾的是关于最后一条有个难堪的脚注:Intel的EM64T和AMD x86-64虽然极为相像,指令集上也互相兼容,然而其实际支持的物理和虚拟内存寻址并不相同,Intel EM64T技术支持36 bit物理内存寻址(64GB)和48 bit虚拟内存寻址(256TB),而AMD x86-64则支持40 bit物理内存寻址(1TB)和48 bit虚拟内存寻址(256TB)。因而最后一条应该改为:
Up to 64 gigabyte (GB) of platform address space (高达64GB的平台寻址空间)
与Intel真正的64 bit处理器——Itanium、Itanium 2相比,EM64T并没有明显增强CPU的运算能力。Itanium、Itanium 2采用纯粹的64位计算模式,Nocona新至强采用兼容32位/64位的计算模式。安腾处理器和新至强处理器两者的区别不仅仅是“位”的比较,还是架构的区别。新至强仅仅增加了“位”数,基本架构仍保持不变;而安腾则是一种全新的EPIC架构(显式并行微体系架构)。Intel EM64T技术和AMD 64几乎是一模一样的,在2004年IDF会议上发布时叫做IA-32E,也就是此前网上纷纷传言的Yamhill技术。和AMD x86-64一样,Intel的IA-32E技术是在原有IA32构架基础上以最小的改动实现对64-bit寻址能力的支持,实际是对原有IA32处理器构架体系的增强设计,同时又兼顾了新构架对原有的IA32构架下开发的32bit甚至16bit代码的支持。
IA-32E通过删除INC/DEC两个指令实现REX prefix,提供64位模式下新增寄存器的指令编码空间,64位GPR(General-Purpose Registers,通用寄存器)以及SSE/SSE-2/SSE-3寄存器(XMM)都增加8组。另外,新增的64位平台寻址模式、中断优先权控制机制以及RIP-Relative寻址模式,这些也都与AMD x86-64完全相同。
IA-32E提供64位模式和兼容模式,64位模式支持64位的操作系统、应用程序、驱动程序、平滑虚拟寻址空间(Flat Virtual Address Space)和GPR(General-Purpose Registers,通用寄存器),兼容模式支持64位的操作系统和驱动程序,应用程序和通用寄存器会支持32位环境,提供4GB的寻址空间。兼容模式将不支持IA-32架构的虚拟8086模式(Virtual-8086 Mode)和实模式(Real Mode),许多DOS的设备驱动程序将无法作用。
以微软操作系统为例,Windows Me和以上已经移除实模式程序代码,所以不会受连累,但MS-DOS、Windows 95/98会受到影响。从上面来说,IA-32E可以兼容于AMD x86-64。毕竟目前AMD64已经获得了业界的广泛支持,这让Intel采用AMD的x86-64架构变成了必然的选择。由于英特尔在过去与AMD签署过关于x86指令集交互授权协议,所以英特尔可以采用AMD x86-64而不必交付权利金。
以往的处理器,要打破32 bit下4GB内存寻址的限制,要使用昂贵的PAE(Physical Addressing Extensions,物理内存扩展技术),现在通过EM64T技术,支持大内存就更为直接了,并且中低端CPU也可以得到广泛的应用,不再局限于以往PAE所处的高端平台。
因为EM64T,新的系统可以访问更大容量的内存,整个系统的性能也就得到很大程度的提高,这对诸如CAD/CAM,以及需要庞大的数据库运算存储的应用来说是非常有利的。
微软在2001年就推出了Windows 2000 DataCenter的64位版本,是为Intel安腾服务器推出的IA-64架构的操作系统,不能运行在个人电脑上,到了2003年,Windows Server 2003推出了四个版本,分别是标准版、Web服务器版、企业版和数据中心版;其中企业版和数据中心版都有32位和运行于安腾之上的64位两个版本,同时Windows XP也有64位的安腾工作站版,应该说微软在64位的路上是先行者(正如Intel一样)。
2003年9月,微软为AMD推出了Windows XP的64位测试版本,2004年1月,又推出了Windows Server 2003的64位测试版本,到了现在,正式版本的Windows XP Pro x64 Edition和Windows Server 2003 x64的都已经推出了,其同时能兼容Intel的EM64T和AMD的x86-64,而硬件厂商的64位驱动程序也都差不多准备就绪,虽然有不少仍是beta的测试版,仍有不少厂商提供了正式版的64位驱动,如nVIDIA和Realtek等。
64位的应用程序则相对少些,幸而目前x86的64位技术(包括EM64T和x86-64)都兼容以往的32位应用程序,在Windows XP Pro x64中微软提供了一个叫WOW64的子系统(Windows32 On Windows64),它为现有的32位应用软件提供了一个模拟环境,可以使大多数32位应用软件无须修改就平稳地运行在Windows 64位版本上,常用的32位应用软件通过WOW64子系统都运行得不错,而且性能损失很小,特别是对目前主流游戏的支持令人非常满意。不过,凡是涉及到虚拟设备的应用软件,如Alcohol、daemon等虚拟光驱软件都将被拒绝安装,如果想在64位操作系统里继续使用它们就只有等新的64位版本了。在Windows XP Pro x64 Edition和Windows Server 2003 x64中,系统默认把32位应用软件安装在“Program Files (x86)”目录,而64位应用软件则安装在“Program Files”目录。打开任务管理器,会看到进程列表中有很多带(*32)标志的程序,这些都是系统用于区分32位应用软件的标志。
此外,64bit的Linux和Sun Solaris x86等操作系统推出市场已经很久了。
主板是非常重要的部件,这台服务器使用了MSI(微星)的E7320 Master-S。微星是属于一般人所讲的一线主板厂商,它也生产服务器主板。与微星的低端桌面主板相比,微星的服务器主板做工更为严谨,用料更为规范。MSI E7320 Master-S基于Intel E7320 (Lindenhurst VS)芯片组,支持2路64位Nocona Xeon(1MB L2 Cache)、Irwindale Xeon(2MB L2)和Xeon LV(Low Voltage),提供6个内存插槽共支持双通道12GB DDR333 SDRAM或24GB DDR266 SDRAM(支持Registered、ECC,支持Intel X4 SDCC——Single Device Data Correction),通过266MB/s的Hub Interface 1.5联接到6300ESB ICH(Hance Rapids)支持2个Serial ATA 1.5Gbps和64bit 66MHz PCI-X。MSI E7320 Master-S通过板载Adapter AIC-7901 Ultra-320 单通道SCSI控制器支Host RAID 0、1功能以提供更好的数据安全性,AIC-7901通过64bit 66MHz PCI-X挂接到6300ESB ICH(Hance Rapids)上。MSI E7320 Master-S还支持Broadcom 5721 Gigabit Ethernet Controller (PCI-Express 1X) 、Broadcom 5705 Gigabit Ethernet Controller (PCI),其中5721联接到E7320 MCH,5705联接到6300ESB ICH。按照服务器集成显卡的传统,MSI E7320Master-S板载了让人敬仰的ATI Rage XL SVGA PCI显卡,附带了8MB的显存,通过32bit 33MHz的PCI链接到6300ESB ICH。MSI E7320 Master-S提供了2个64bit 66MHz PCI-X、1个4X PCI Express(使用的插槽是8X PCI Express,不过只能提供4X速度)、1个32bit 33MHz PCI插槽。
Intel E7320 MCH
![]() |
Intel E7320 MCH使用了1077脚FC-BGA封装,是专门开发用来配合64位Xeon(包括Nocona、Irwindale)的服务器平台芯片组,与Intel同期在桌面市场推行的915/925比较类似,不过由于服务器平台的稳定性需求,服务器芯片组采用的是比较谨慎的规格。
E7320 MCH支持800MHz的FSB,比起老至强的533MHz要快50%,不过比起桌面i925的1066MHz略慢。
E7320 MCH支持Registered ECC,桌面市场的i925只支持ECC,不支持Registered。作为服务器芯片组,E7320支持高达32GB的DDR266 SDRAM或者16GB DDR333和DDR2-400,而i925只支持4GB的DDR2-533。E7320支持双通道内存传输技术,传输速率上,E7320的3.2GB/s(DDR2-400)和2.67GB/s(DDR333)均比过去的7205等2.13GB/s(DDR266)的速度高上不少。E7320除支持ECC内存纠错技术之外,还支持Intel X4 Single Device Data Correction技术。E7320支持内存镜像技术,通过耗费一倍多的内存,实现类似RAID 1的内存镜像功能。
E7320 MCH使用了最新的高速串行PCI Express接口,符合PCI Express Interface标准1.0a,支持最大8X(可以配置为两个独立的4X)共4GB/s双向带宽的PCI Express,可以连接到I/O处理器、PCI-X控制器、网卡或者Infiniband技术桥接器等,通过带宽为266MB/s的Hub Interface 1.5,E7320可以连接到Intel 82801ER(就是ICH5R)或者6300ESB ICH。
Intel 6300ESB I/O Controller Hub
Intel 6300ESB ICH和桌面芯片组i865/i875使用的ICH5R比较相像,Intel 6300ESB ICH通过266MB/s的Hub Interface 1.5和MCH联接,说实话,这个带宽实在不怎么高。Intel最新的桌面芯片组南北桥带宽已经达到了4X PCI Express:DMI,也就是2GB/s的双向带宽。
Intel 6300ESB ICH支持PCI-X Rev 2.2和PCI Rev 2.2,Intel 6300ESB ICH最多支持4个33MHz PCI,2个66MHz PCI 64,4个64bit 66MHz PCI-X(2个插槽,2个集成设备)。Intel 6300ESB ICH取消了ISA/X-Bus支持,古老的工业设备需要通过ISA桥才能支持。
Intel 6300ESB ICH支持2个Ultra DMA 100接口,2个150MB/s的Serial ATA接口,并支持SATA RAID 0/1。和ICH5R不同的是,6300ESB ICH只支持4个USB 2.0接口。
Intel 6300ESB ICH也支持ACPI 1.0、APM这些标准的电源管理规范。
![]() |
这台服务器由五舟科技出品,前面板右方是笔记本光驱、软驱,由于服务器产品的光驱和软驱都很少使用,因此它们都使用了轻薄的笔记本产品。
![]() |
电源指示灯和3个硬盘指示灯。
![]() |
合理的机架结构,前方左边是光驱和软驱,右边是硬盘,1U服务器由于高度限制,通常不会配备热插拔硬盘笼,这台服务器提供了2个3.5英寸标准硬盘位置。服务器配的是FUJITSU(富士通)的10,025RPM的MAT3073NP,容量为73GB(1个盘片),采用了68针的Ultra 320接口,8MB缓存。MAT是FUJITSU面向高端应用的万转SCSI硬盘,10,025的RPM比其他厂商提供的10,000的RPM要略微高一些,或许FUJITSU想通过这个来得到一些心理优势。MAT系列最高提供300GB的型号。
这台服务器使用了Enermax(树昌)的大功率服务器机架电源。
由于高度限制,两个Nocona 2.8G并没有配备风扇,纯铜的散热篇用螺栓固定到主板上,通过两个大功率的涡轮风扇来散热,这种风道方式效率比较高。
![]() |
通过2个NMB 12V 2.1A涡轮风扇为CPU散热,2.1A就意味着25.2W的功率,可以提供巨大的风量,同时也带来巨大的噪声。
![]() |
6个DDR内存插槽,插上了Ramaxel的两个PC2700 512MB Registered ECC DDR333模组并用硅胶固定,采用了Infineon的颗粒,内存模组中央的两块小芯片是Registered组件。E7320 Master-S最高支持12GB的DDR333或24GB的DDR266。
![]() |
提供的插槽,最上方的64bit 66MHz PCI-X插槽比较瘦,中央的8X PCI Express插槽实际速度是4X。图左上方是两个Broadcom千兆网卡芯片,上面的5701基于PCIE 1X,下面的5705基于PCI。图片下方是广泛使用多年的ATI Rage XL图形芯片以及其使用的8MB SDRAM显存,显卡的接口是PCI。
![]() |
Intel 6300ESB ICH(Hance Rapids),在低端服务器上通常用来作为PCI-X控制器。并提供了两个SATA 150MB/s界面,支持SATA RAID 0、1,一些低成本的服务器没有使用昂贵的SCSI方案,而是使用了ICH的SATA RAID方案。
![]() |
ATI Rage XL
![]() |
后面板一观,MSI E7320 Master-S提供了2个PS/2键盘鼠标接口、1个串口、1个VGA接口、2个USB 2.0接口和2个千兆网卡接口。
我们在上述的硬件平台上安装了Microsoft Windows 2003 Enterprise Edition(英文、32bit),正确安装了各个硬件的驱动程序,确保服务器工作在最佳的状态。
![]() |
![]() |
![]() |
![]() |
我们所使用的评测软件如下:
SiSoftware Sandra 2005
HDTach 3.0.1.0
IOMeter 2004.07.30.win32.i386
SiSoftware Sandra 2005可以评估CPU子系统和内存子系统的理论能力,并且Sandra 2005在多线程方面得到了加强。PCMark05尽管多用于个人电脑,其相对上一个版本的PCmark增强了多任务、多线程的测试能力,可以用于测试各方面的理论性能,并可以与普通个人电脑做一下对比。HDTach 3.0.1.0可以简单评估磁盘子系统性能。IOMeter是一款可以用于单个系统或者集群系统的I/O子系统评估工具,我们仅使用了它的磁盘测试功能。
因为IT168广州评测室测试条件限制,我们没有进行WebBench和NetBench测试。同时由于时间限制,我们也没有进行SEPCCPU2000和64bit操作系统的测试。
由于我们测试的是整台服务器,因此我们测试的系统就按照服务器的配置来进行,硬盘分了2个区,第一个10GB的分区用于安装操作系统,另一个用于进行IOMeter测试。
测试时没有关闭超线程,我们认为服务器正规运作是没有人会关闭这个极为有用的特性。
![]() |
CPU Arithmetic Benchmark,得分为:Dhrystone ALU 16529 MIPS,Whetstone FPU/iSSE2 6843/11470 MFLOPS。
![]() |
CPU Multi-Media Benchmark,得分为:Integer x8 iSSE2 40445 it/s,Floating-Point x4 iSSE2 53300 it/s。
![]() |
Memory Bandwidth Benchmark,RAM Bandwidth Int Buff''d iSSE2 2889MB/s,RAM Bandwidth Float Buff''d iSSE2 2905MB/s。
![]() |
HD Tach 3.0.1.0是PC上常用的硬盘测试软件。由于系统盘就是测试的硬盘,因此图形上有一些波动,正常的图形将会是一条完美的曲线。图上,Burst Speed(突发速度)达到了171.5MB/s,连续读取速度开始为89.5MB/s,结束为50MB/s,平均读取速度为72.8MB/s,随即存取为7.7ms,CPU占用率为1%(+/- 2%)。
我们采用业界认可的IOMeter 2004.07.30.win32.i386版本来完成磁盘子系统性能的测试并使用定制的Excel宏来完成数据分析。IOMeter是一款功能非常强大的IO测试软件,它包含了负载发生器(IOMeter称其为Worker),提供一系列标准测试组件以模仿实际应用,如WebServer(网站服务器)、FileServer(文件服务器)和在OLTP(OnLine Transaction Processing,在线交易处理)服务器。这些测试组件产生不同大小的输入输出请求和读/写分布,以模仿实际应用中的行为。
我们实际测试使用的IOMeter策略如下:
Max IO:
测试读取尺寸为512Bytes,100%读取操作,随机率为0%,即为100%连续读取,用于检测磁盘子系统的最大IO能力。
Max Throughput:
测试读取尺寸为64KB,100%读取操作,随机率为0%,即为100%连续读取,用于检测磁盘子系统的最大吞吐量。
OLTP:
OLTP事务处理专门用于处理实时交易过程中的管理、审计和入册过程。类似的应用实例有复杂的航空票务系统和金融交易系统等。缘其自然,OLTP是一种具有高度随机性的读写输入输出应用,其读写比例为2:1。
最后,测试读取尺寸为8KB,67%读取操作,随即率为100%。
FielServer:
文件服务器应用在一个多用户或网络化的环境中专门用于文件的储存,恢复和管理。不同用户的访问形成了多线程,因此,其工作负载是随机性的。输入输出大小是可变的,取决于所操作的文件大小。读/写分布也是变化的。总的来说,一个频繁使用的多用户服务器应该采用较高的队列深度来模拟。
最后,测试读取尺寸从512Bytes到64KB不等,80%读取操作,随机率为100%,用于模拟文件服务器的性能。
WebServer:
网站服务器应用于处理多用户通过Internet或Intranet进行的访问。这些请求具有典型的随机性,并且在用户访问不同页面或视频应用时大量
偏向于读请求。同样,一个访问频繁网站服务器也应该采用较高的队列深度来模拟。
最后,测试读取尺寸从512Bytes到512KB不等,100%读取操作,随机率为100%,用于模拟Web服务器的性能。
测试时,队列深度从1到128。
还有一点需要注意的是我们测试的服务器总共具有4个CPU(逻辑的,非逻辑的),而给出的CPU占用率是整个系统的占用率,当系统只有一个CPU时,其CPU占用率将会比给出的数值要大。
Max IO
![]() |
![]() |
![]() |
![]() |
Queue Depth低于8时IOps随着Queue Depth提升而提升,在Queue Depth达到8之后,IOps便趋于平稳,Queue Depth为16时达到极大值43368.7。% CPU Utilization则比较高,随着Queue Depth的增加而提升,在Queue Depth达到64的时候达到了30.0016%的极大值,这个数值意味着已经超出了1个逻辑CPU的运算能力。
Max Throughput
![]() |
![]() |
![]() |
![]() |
最大输出能力为74.2494MB/s,CPU占用率都处于1%左右。
OLTP
![]() |
![]() |
![]() |
![]() |
OLTP IOps在Queue Depth为32的时候达到了276.894,之后便不再显著增加,而其CPU占用率很低。
File Server
![]() |
![]() |
![]() |
![]() |
FileServer和OLTP相像,IOps在Queue Depth为32的时候达到了280.831。
WebServer
![]() |
![]() |
![]() |
![]() |
WebServer也类似。
最后,服务器磁盘子系统的Max IO在Queue Depth为16的时候达到43368.7IOps,Max Throughput在Queue Depth为4的时候达到,为74.2494MB/s。
这台五舟SF5110 1U服务器具有不凡的性能,尽管它最多只能安装2个硬盘,它通过板载AIC-7901 PCI-X SCSI控制器提供,控制器带有Host RAID 0、1能力。这台服务器也SATA RAID 0/1功能。它配置了6个168pin DIMM插槽,最高支持12GB DDR333 Registered ECC内存。服务器中还提供了2个64bit 66Mhz PCI-X、1个4X PCI-E(使用8X PCI-E插槽)、1个32bit 33MHz的扩展能力。MSI(微星)为这台服务器提供了MSI Server Management IPMF 1.5服务器管理软件。1U服务器是最低的机架高度,五舟的1U服务器提供了2路64bit Nocona 2.8G和多达12GB R-ECC DDR333(或24GB R-ECC DDR266)的能力,受限于1U的高度,其只能内置2个SCSI硬盘,不过,用户可以升级到300GB的型号,最高提供600GB的容量。这个服务器以低廉的价格和瘦小的体积提供了不弱的性能和扩展性。
优点
1、64位技术。
2、支持大容量的内存。
缺点
1、受限于体积,不支持热插拔硬盘以及多于2个的硬盘。
2、不支持冗余电源。