联系我们

4000 555 018
(7×24)
正睿服务器  >  新闻中心  >  业界资讯
新闻中心

Intel 第五代可扩展处理器 | 无缝兼容、高效利用

间隙填充
正睿科技  发布时间:2024-01-22 18:01:02  浏览数:264

无缝兼容、高效利用

2023年初,英特尔发布了第四代至强可扩展处理器"Sapphire Rapids"(SPR)。仅仅11个月后,新一代产品"Emerald Rapids"(EMR)紧随而来。尽管发布节奏快速,但市场反应平稳,因为这两代Rapids处理器均基于Eagle Stream(EGS)平台,主板无需更换,只需更新固件,即可使原本适应第四代至强可扩展处理器的服务器轻松升级至第五代,实现无缝兼容与高效利用。
 
简而言之,英特尔不是第一次运用单一平台服务于两代CPU产品,例如22nm制程的至强E5 v3与后续14nm制程的E5 v4,尽管两者基于不同工艺节点,但得益于平台兼容性,服务器升级时可在保持TDP稳定在145/160W的情况下,将核心数量上限从18个提升至22个(E7系列甚至达到24个核心)。

而在转向至强可扩展(Xeon Scalable)处理器系列后,尤其是在14nm工艺阶段,处理器核心数的增长遇到了相对停滞期。从第一代至第三代至强可扩展处理器,即便是率先推出的针对高端市场的四至八路版本(代号Cooper Lake-SP),单个晶片上的核心数上限基本停留在28个,这在某种程度上可以形容为在核心扩展方面的进展显得较为保守。

英特尔遵循其“四年五个制程节点”战略,第五代至强可扩展处理器与前一代同样采用了首个关键节点??Intel 7制程技术。在一次于英特尔公司Jones Farm会议中心举办的活动中,我们深入了解了这款最新一代至强可扩展处理器的技术细节。令人惊喜的是,CEO帕特?基辛格亲自出席,为这款即将发布的CPU新品助阵,足见其对公司新产品的重视程度。

鉴于帕特?基辛格的高调参与,显然第五代至强可扩展处理器“Emerald Rapids”并非简单的迭代更新,而是有着实质性的技术突破。相较于第四代“Sapphire Rapids”,EMR在XCC(eXtreme Core Count,极致核心数)版本上尤为突出,展现了英特尔在Intel 7制程优化上的显著成果,意味着在核心数量、性能及能效比等方面有着更为显著的进步。

第四代英特尔至强可扩展处理器(XCC版)率先运用Chiplet技术,整合4块对等Die,借助10个EMIB实现高速互连,最终提供了最高60核和112.5MB L3 Cache的规格,单核对应1.875MB L3。值得注意的是,60核配置仅在顶级8S配置的至强铂金8490H中实现,大多数主流型号则止步于56核。

少即是多

到了第五代英特尔至强可扩展处理器(XCC版),在Die布局上进行了显著优化。EMR-XCC将Die数量减少一半,仅使用两个对称镜像Die,并通过精简至3个EMIB进行连接,从而简化封装流程,降低复杂度。虽然Die数量减少,但性能和效能得到进一步提升。


 
看图说话,第五代英特尔至强可扩展处理器(EMR-XCC版)就像一个棋盘,每个Die上的核心和缓存单元与DDR5内存控制器巧妙排布成7×5的网格图案。两边预留位置给了DDR5控制器,所以一个Die最多能塞进33个核心。这样一来,两个Die加起来本可以做到66核心,但实际为了保证质量,第五代产品选择启用了64个核心,比起上一代翻了一倍多,但也更加考虑良品率的实际问题。

现在市面上能看到的第五代至强可扩展处理器,有3种是64核心的款式,这个数字恰好与上一代至强扩展处理器以及至强CPU Max系列(特别是配备了HBM版本的高端款)提供的最高60核、56核处在同一水平线。

再来说说L3缓存(也就是最后一级高速缓存LLC),第五代至强可扩展处理器在这部分可是下了狠功夫。它的L3缓存容量直接从上一代的每个核心1.875MB飙升到5MB,整个处理器的最大LLC总量更是达到了惊人的320MB。这相当于单核心和总体缓存容量都差不多涨了快三倍,实实在在展现了Intel 7工艺在提升缓存性能上的卓越贡献。

内存升级:频率与带宽提升

第五代英特尔至强可扩展处理器对内存子系统进行全面升级,旨在应对因核心数量增加带来的内存带宽需求压力。内存规格方面,DDR5内存最高支持频率从上一代的4800MHz跃升至5600MHz,增长率超过16%,略高于核心数增幅;同时,最低频率也从4000MHz提升到了4400MHz,提高了大约10%。

尽管在现有的主板布局和向下兼容第四代至强可扩展处理器的要求下,第五代产品无法直接增加内存通道数量,但英特尔巧妙地引入了CXL(Compute Express Link)技术来增强内存性能。第五代至强可扩展处理器除了支持CXL 1.1规范的Type 1和Type 2设备外,还新增了Type 3内存支持:

双层内存配置模式注重容量扩展,第一层利用内存控制器管理的8个DDR内存通道,第二层则通过2个CXL Type 3设备额外提供4个CXL内存通道,适用于需要大量内存资源的应用场景,比如提升Redis等内存数据库的事务处理能力(TPS)。

单层内存配置则是将两层合并,形成12通道DDR + CXL交错传输机制,既提升了内存容量,又增大了内存带宽。


 
需要注意的是,基于PCIe 5.0的4个CXL内存通道虽然增加了可用带宽,但由于物理特性,它们的带宽与真实的4个DDR内存通道相比仍有一定差距,更像是对现有配置的一种补充和优化。

I/O与互连强化,节能性能齐飞

第五代英特尔至强可扩展处理器坚守80个PCIe 5.0通道配置,确保主板兼容性不变。然而,XCC版本的Die设计似乎减少了PCIe控制器占用的硅片面积,使之更接近MCC版本,这也意味着类似于第四代拥有112个PCIe 5.0通道的至强W处理器可能暂时缺席新一代产品线。


 
在CPU间的互连方面,第五代至强可扩展处理器引入了UPI 2.0技术,速率从上一代的16GT/s提升至20GT/s,增速达到25%。不过,第五代产品仅支持双路(2S)互连,放弃了四路(4S)及八路(后缀为H的SKU)配置的支持,同时,带HBM内存的至强Max系列尚未得到更新,尽管其高内存带宽对于大型语言模型(LLM)推理场景极具价值。

据此推测,第五代英特尔至强可扩展处理器将与第四代共同在市场上并存,各自满足不同的应用需求。

节能优化与核心缓存扩容

尽管核心数和LLC容量都有所增加,第五代至强可扩展处理器依然严格控制在350W(瓦)的TDP范围内,仅有一款液冷通用产品(8593Q)的TDP略有上升。据英特尔资料显示,新产品在较低利用率(如30%至40%)下进行了能耗优化,有利于用户降低供电和冷却成本。

 
值得注意的是,第五代至强可扩展处理器最大的亮点??LLC容量的大幅提升,仅限于XCC版本。而中等核数(MCC)版本由于沿用单晶片设计,其升级主要集中于核心数、频率的小幅提升以及DDR5内存频率的些许调整(以400MHz为增量单位)。

另外,在低端核心数市场,还推出了所谓的EE LCC(Edge Enhanced Low Core Count)SKU,专注于边缘增强特性。第四代至强可扩展处理器已经悄然推出了EE LCC和EE MCC SKU,这些型号通常以N或NE作为后缀,AMX支持有限,但标配DSA(数据流加速器)和特定的vRAN加速设备。

外围I/O配置与加速器支持

两款至强可扩展处理器在XCC和MCC版本上的外围I/O配置规律大致相同,例如:XCC版本通常配备4个UPI,而MCC版本不超过3个UPI。


 
回顾第四代英特尔至强可扩展处理器,它集成了四种外挂加速器,包括DSA(数据流加速器)、QAT(QuickAssist技术)、DLB(动态负载均衡器)以及IAA(存内分析加速器),这些加速器如同集成在CPU内的PCIe加速卡。官方公开的每个SKU至少会启用一个DSA设备,而通用型SKU(以+号结尾)则集成了DSA、QAT、DLB和IAA各一个。除最低端型号3508U外,所有SKU均支持Intel On Demand技术以启用更多加速器,其中XCC版本每种加速器均可扩展至4个,而MCC版本则仅有QAT和DLB可增至2个,DSA和IAA最多各配一个。


 
在深入探讨具体SKU之前,再次强调命名规则的基本原则:SKU的第二位数字5代表第五代英特尔至强可扩展处理器,而第一位数字代表处理器等级:

Platinum(铂金): 8
Gold(金牌): 6 和 5
Silver(银牌): 4
Bronze(铜牌): 3

鉴于第五代至强可扩展处理器最多支持双路配置,因此不存在后缀为H的4S/8S版本,也没有基于HBM的Xeon Max衍生版本。目前披露的32个SKU被细分为8类,主要通过后缀标识区分。

值得一提的是,其中只有四位数字并以Y和/或+结尾的SKU属于通用型,占据了总量近六成的比例,进一步细分为主流性能和标准性能两类。

总结而言,第五代英特尔至强可扩展处理器在I/O性能、互连速度、能效优化等方面实现了全面提升,同时也通过灵活配置的加速器和多样化的SKU组合,满足不同应用场景的需求。接下来我们将详尽解析各个SKU的具体规格和特点,以便读者更好地了解第五代至强可扩展处理器的全面实力。

2S性能通用

在双路性能通用组别中,前一代的领军产品是(Platinum) 8480+。按照型号逻辑,新一代与其对应的可能是8580,两者在发布初期的价格设定保持一致。与此同时,同组内还有诸如8562Y+、6542Y、6544Y和6526Y等型号也有类似的定价策略。

相较于8480+,新款8580在核心数量上增加了4个,其末级缓存(LLC)容量几乎翻了三倍,并且支持的DDR5内存频率提升了800MHz,尽管CPU运行频率大致相当,但这些变化在XCC配置中尤其具有标志性意义。此外,8570和8568Y+在运行频率上还展现出了略微的优势。然而,值得注意的是,8580并未带有“+”后缀,这意味着它只开启了1个DSA设备,而非全方位超越前辈。真正承担起全面超越任务的是64核的8592+型号,其LLC容量甚至超过了8480+的三倍。

至于从8562Y+以下的型号,则进入了中等核数(MCC)区间。这些型号的核心数和LLC容量与前代相比基本保持在同一水平线上,但主要性能提升体现在DDR5内存频率的提升上。例如,6548Y+、6542Y、6526Y和5515+等型号通过略微提高热设计功率(TDP),换取了更高的CPU运行频率,从而提升了整体性能表现。

2S主流通用

在2S主流应用类别中,8558以其48核心占据旗舰地位,但LLC容量降至260MB,DDR5频率非顶级。值得关注的是,32核的(Gold) 6530 LLCA容量达160MB,堪比64核6430的三倍。本组其他型号如6538Y+、6530和4510定位为前任产品的“平替”,并新增了一款8核(Silver) 4509Y。这些处理器在保证适中价位的同时,通过调整核心数、缓存大小及内存频率,力求性价比与性能兼具。

液冷通用


 
液冷通用(-Q)类别中,8593Q凭借出众的性能和385W TDP成为旗舰,依托液冷散热方案。6558Q在参数及定价上瞄准取代6458Q,定位清晰。

单路通用(-U)


 
在单路通用(-U)类别中,8558U虽提升了该组别的性能上限,但相比8558标准版在CPU频率、内存频率及TDP方面有所下调。

5512U在与5412U的对比中,实现了核心数、LLC容量及DDR5内存频率的全面提升,而TDP保持不变,带来更优性能表现。

(Bronze) 3508U各项关键参数和初始定价均体现出其有意作为3408U的有效替代,目标在于为用户提供同等价位下的性能升级体验。

5G/网络优化(-N)


 
在网络优化(-N)系列中,8571N型号展现出了显著提升,其LLC容量较同核心数的前代产品翻了不止三倍,并且搭载了满配的IAA,同时实现了运行频率的明显提升,而热设计功耗(TDP)却没有随之增加。

另外,6538N与前代6438N在初始定价上保持一致,但6538N的运行频率更高,体现了性能上的进化。

云优化 IaaS(-P)/ SaaS(-V)


 
针对SaaS(-V)环境的8592V处理器在基频上较8592+稍有提升,但牺牲了一个UPI,同时DDR5内存频率和热设计功耗(TDP)略低于后者。

而对于IaaS(-P)环境优化的8558P型号,其与前代8458P在初始定价保持一致的基础上,提升了核心数和运行频率,最关键的是其LLC容量增加了三倍以上,呈现出极高的性价比吸引力。

此外,第五代英特尔至强可扩展处理器阵容中取消了专门针对媒体应用(-M)的SKU选项。

存储与超融合(HCI)优化(-S)


 
6554S与上一代6454S售价相同,但新品具备更高的睿频、三倍LLC容量,且完整支持QAT、DSA、DLB,TDP保持不变,性能显著提升。

长使用寿命(IoT)通用(-T)


 
目前第五代英特尔至强可扩展处理器仅推出了4510T一款产品,专为边缘计算场景优化设计。但从已有信息判断,该系列中有相当一部分SKU具备长期稳定的特点,适合长期部署的应用。

  • 正睿合作伙伴
  • 社区
首页 | 注册 | 网站地图 | 通告 | 联系我们
CopyRight(C)2004-2022 Chongqing Zhengrui Technology Co.,Ltd. All rights reserved.
重庆正睿科技有限公司(C)版权所有 未经书面授权 不得转载、复制或建立镜像
渝ICP备11002339号-1  渝公网安备 50010702500475号