服务器

数据中心计算引擎的前路:CPU篇
作者 陶然 2025年02月07日 17:55

  人们常说,企业,尤其是那些拥有巨额IT预算的大公司,他们购买的并非产品本身,而是产品路线图。毕竟,没人愿意费时费力为一款最终被证明是一次性的产品优化软件,最后还得被迫为另一款设备移植代码并重新进行调试。

  但这种情况确实时有发生。

  因此,对于那些试图让人们购买其计算引擎的芯片制造商而言,拥有未来产品路线图至关重要,就如同他们过去展现出制定路线图的能力,以及依循路线图将产品成功推向市场而不偏离轨道的能力一样重要。

  新年伊始,数据中心计算引擎一直是我们重点关注的领域。为此,我们花时间整理了一套涵盖2023年至2027年的CPU、GPU和AI加速器的综合路线图。今天,我们将聚焦于目前市场上现有的以及即将推出的主流CPU,GPU和定制AI加速器则会另行讨论。

  为使内容相对简洁,我们的CPU路线图合集(路线图集合可不就是“路线地图集”)并未纳入特殊处理器,例如AMD和英特尔为电信及服务提供商市场打造的处理器。具体来说,不包括AMD带有垂直L3缓存的Epyc X系列变体,以及英特尔使用HBM内存而非普通DDR5内存的至强变体。

  为简化信息,我们将处理器的发布日期近似到最近的季度。对于那些发布时间模糊的未来产品,我们也尽力预估其推出时间。像英伟达的“Vera”Arm服务器CPU,或是IBM即将推出的“Cirrus+”Power11和“Telum II”z17处理器,这类预计会长期供应的计算引擎,我们将其信息延伸到路线图的未来时段。另外,我们把英特尔至强产品线重新命名,将“Sapphire Rapids”称为至强4代,“Emerald Rapids”称为至强5代。

  这些图表本可以塞进许多重要特性,但我们只保留了基本信息:CPU的代号和名称、计算核心的制程工艺及代工厂、核心类型,以及该系列高级型号的核心数和线程数。后续我们可能会对内容进行扩展,加入峰值整数和浮点性能,如果能获取到高级型号的 SPEC 评级,也会补充进去。

  X86处理器目前仍占据市场主导地位,这就是AMD的Epyc CPU和英特尔的至强CPU在表格中位居前列的原因。

  AMD和英特尔的大多数主流服务器CPU将在2025年投入市场,但英特尔在2025年第一季度还有几款产品有待推出。此外,AMD有可能推出面向高性能计算(HPC)工作负载、带有垂直缓存的“Turin-X”变体,给大家带来惊喜。

  原本预计今年唯一的新款主流服务器CPU是英特尔的“Clearwater Forest”至强7代,然而英特尔现已将其发布时间推迟到2026年上半年。Clearwater Forest原本将是英特尔首款采用18A(1.8纳米RibbonFET)制造工艺的CPU。

  有传言称,这款至强7代E-core(节能核心的缩写)产品,基于名为“Darkmont”的Atom核心变体,缺少同步多线程和AVX - 512向量数学单元等功能,它将在四个芯片模块上集成多达288个核心,数量是英特尔产品线中即将被其取代的至强6代“Sierra Forest”6700E 芯片的两倍。

  不过,其核心数预计不会超过至强6代6900系列。不出所料,至强6代6900系列有一款双倍E-core的Sierra Forest变体,即至强6代6900E,预计2025年第一季度推出,在两个计算模块上集成多达288个核心。显然,至强的E-core变体并非热门产品,更偏向于小众市场。

  高端的“Granite Rapids”P-core版至强6代,即2024年9月在首批Sierra Forest芯片之前发布的至强6代 6900P,单个插槽内配备128个P-core。随后还会有较低规格的至强6代6700P,最高可达86个核心,甚至还有我们目前了解较少的6500P和6300P,预计也将在今年第一季度推出。

  都灵处理器的Zen 5(常规核心)和Zen 5c(缓存较少的精简核心)变体将助力AMD在2025年的市场竞争。预计数据中心要到2026年才会迎来“Venice”Zen 6和Zen 6c CPU,我们认为它们可能会在明年年初开始量产。可以合理预期,Zen 6和Zen 6c核心的每时钟周期指令数(IPC)将大幅提升,而且我们推测AMD会采用2纳米制程工艺,将核心数量翻倍,并可能适度提升时钟频率。

  从这份CPU路线图来看,到明年,服务器CPU拥有数百个核心将不足为奇。2026年,英特尔在使用18A工艺生产“Diamond Rapids”至强7代P-core处理器时,随着晶体管尺寸缩小,核心尺寸也会变小,我们很期待英特尔会如何应对。我们认为英特尔需要在核心数量上与AMD Venice Epyc 9006处理器持平,这意味着核心数要翻倍至256个。

  服务器CPU领域的一大变数是英伟达未来的“Vera”CV100处理器(预计 2026 年推出)会有怎样的表现。英伟达在2023年第二季度推出的“Grace”CG100处理器,率先采用了Arm公司的“Demeter”Neoverse V2核心进行芯片设计。

  我们认为,英伟达在Vera处理器上很可能会采用最前沿的Arm CPU核心,这或许意味着跳过“Poseidon”V3核心,直接采用Arm的“Adonis”V4 核心。这只是我们的猜测,仅供娱乐。

  无论如何,我们认为英伟达在Vera处理器上,相较于核心数量,更关注NVLink端口数量和高带宽。在最新的Grace-Blackwell超级芯片中,英伟达已将两个“Blackwell”GB200 GPU加速器与单个Grace芯片搭配,未来在“Rubin”GPU和Vera CPU的搭配上,这个比例甚至可能达到1:4。要实现这一点,或许只需将核心数量翻倍即可。

  只是为了增添趣味,同时展示IBM的产品领域与其他公司有何不同,我们将Power和z处理器也纳入了Arm阵营相关内容之中。我们预计,IBM将在今年年底前推出“Cirrus+”Power11和“Telum II”z17处理器,以提升Power Systems和System z大型机产品线的性能。

  稍后我们会详细介绍Power11芯片,与已在市场上应用近四年的Power10芯片相比,它主要侧重于提升内存带宽和容量。z17处理器有诸多改进之处,其中包括集成DPU以加速大型机的I/O操作,我们在2024年8月就对此进行过报道。这两款芯片均由IBM的处理器代工合作伙伴三星制造,每个插槽上有16个核心,应用于每个节点配备四个插槽、单个系统镜像中有四个节点,且主内存高达数十TB的机器中。

  大型机领域确实与众不同。

  言归正传,回到Arm阵营的竞争话题。安谋科技(Ampere Computing)在2024年7月发布了其最新路线图,我们预计该公司会保持相当稳定的产品节奏。安谋科技认为,他们能够每年将核心数量翻倍,到2027年实现单个插槽内集成512个核心。从以往经验来看,安谋科技应会在2025年逐步提高其256核心服务器CPU的产量,并于今年下半年开始批量出货。同时,他们也在展望2026年底推出512核心的“Aurora” AmpereOne芯片,并在2027年逐步扩大产量。

  亚马逊云科技(Amazon Web Services)尚未透露太多关于其Graviton系列Arm服务器CPU的规划。坦率地说,在2024年接近尾声时,我们曾期待能看到一些升级举措,比如像几年前推出Graviton3E那样,推出性能更优的深度筛选版Graviton4E。我们预计亚马逊云科技要到2025年底才会提及Graviton5,并且推测他们可能会在2027年初谈及Graviton6。

  亚马逊云科技在核心数量的提升上本可以更加激进,但我们认为,其提升幅度不会超过我们在路线图中展示的Arm Neoverse核心的发展,以及台积电芯片制程工艺的推进速度。这在很大程度上取决于亚马逊云科技想要多快地将其计算集群从X86平台迁移出去。其推进速度越快,核心数量提升得就越高,当然,也要考虑到避免在处理器软件层面管理过多非统一内存访问(NUMA)域的需求。

  在这份CPU路线图中,我们为谷歌的Axion、微软的Cobalt、阿里巴巴的倚天、华为的鲲鹏以及飞腾的S5000C-M Arm处理器预留了位置。

  目前我们没有这些系列服务器CPU的路线图,更不清楚图中这些处理器的实际规格。相关细节信息不多,这并非偶然。微软、谷歌和阿里巴巴并不打算将其Arm服务器芯片出售给其他公司,任何路线图可能仅提供给使用其云服务中Arm实例的大型客户。华为和飞腾的芯片处于中国网络防火墙内部,关于它们的升级计划,外界知之甚少。

  还有其他一些公司,如Tenstorrent、Ventana、Esperanto、Meta Platforms、SiPearl和富士通,它们的产品也有可能被纳入这份CPU路线图。

  原文链接:https://www.nextplatform.com/2025/01/30/the-road-ahead-for-datacenter-compute-engines-the-cpus/

打开APP阅读全文
{{data.thematic.text}}

相关文章

加载中...

分享到

请使用浏览器的分享功能
分享到微信等