联系我们

4000 555 018
(7×24)
正睿服务器  >  新闻中心  >  技术文章
新闻中心

高扩展+高可靠性 Nehalem-EX挑战RISC

间隙填充
正睿科技  发布时间:2010-03-18 17:00:00  浏览数:2615
 英特尔面向高端多路市场的8核心Nehalem-EX平台将在本月末发布,多核多线程、高扩展性、高级RAS特性让Nehalem-EX具备了挑战RISC服务器的能力。联合新安腾,英特尔阵营或将引发高端多路市场格局的改变。

    英特尔即将在本月底发布其Nehalem家族中的高端多路成员Nehalem-EX,并计划借此在2010年开始吸引Sun SPARC等传统RISC用户向x86平台迁移。当然,让英特尔具备如此想法的原因是Nehalem-EX具备了可以挑战RISC系统的实力。而在今年2月初,英特尔发布了新的Tukwilla安腾9300系统,这让我们不禁质疑,英特尔希望借Nehalem-EX对RISC发起冲击,那么,这是否也会波及英特尔同样寄以厚望Tukwilla安腾,这两者的位置又是如何划定的呢?答案实际很简单,任何一家厂商都不会希望自家的产品出现“同门相残”的情况,Nehalem-EX和Tukwilla安腾,英特尔是将这两者定义为“辅助”的关系而不是“竞争”。

    早在去年的5月份,英特尔服务器平台营销总经理Boyd Davis曾经这样解释过:在过去的十年中RISC处理器一直在衰退,而至强处理器的市场则以一个健康的速率在增长着,很多用户都在计划从RISC到英特尔平台的迁移。对于Nehalem-EX,英特尔的期望能够利用其触及尽可能高的服务器市场,和安腾家族互相辅助。两者之间还是有差别的,安腾采用HP-UX等Unix操作系统,具有独特的特性,面向小型机市场;而对于更加广泛的Linux和Windows操作系统平台,Nehalem-EX将具有统治地位。Nehalem-EX和安腾,英特尔将利用这样的组合来和IBM、Sun等为代表的RISC阵营展开竞争。

    随着x86处理器核心和线程数量的不断激增,x86服务器价格相对低廉,性能和扩展能力都在不断增强,在应用上也日趋灵活广泛,在过去的几年中不断蚕食着传统的高端RISC市场。据IDC的报告,从2000年到2008年,RISC市场基本都出现了下滑,如下图,2008年RISC处理器出货量甚至不足2000年的一半。而在最近的Gartner服务器市场调研报告中,2009年第四季度全球RISC和安腾芯片的Unix服务器出货量稍有增长,但销售额下降了20%。再从传统的几大RISC巨头来看,IBM的地位虽然无法撼动,但销售额下滑11.1%;Sun由于被Oracle收购,已经失去了往日的光芒,下滑接近30%;而富士通则大幅下滑了55.4%。(详情请点击:Gartner: 09年Q4 Unix服务器市场下滑)


高可靠性+可扩展性 Nehalem-EX挑战RISC
RISC处理器在近些年都出现了下滑的趋势

    RISC市场的整体低迷也给了英特尔更多的机会。但安腾在近些年并不尽如人意,惠普Unix服务器在2009年Q4下滑接近20%,今年2月初英特尔发布Tukwilla新安腾系统,旨在能够和IBM新发布的Power7系统在高端市场一决胜负。而x86架构的Nehalem-EX,英特尔将其作为了新安腾的补充,是挑战RISC市场的一大利器。IDC全球研究副总裁兼总经理Vernon Turner曾这样评价Nehalem-EX:“Nehalem-EX所具备的平台属性让它有能力进一步加速RISC市场的下滑。”x86竞争RISC,这在过去看来是天方夜谭,而英特尔也从未将这个口号喊得如此响亮过,那么,Nehalem-EX究竟有哪些挑战RISC的本钱,才能获得如此高度的评价,并让英特尔拥有如此的自信呢?

    QuickPath架构让Nehalem-EX具有优秀的弹性

    相对x86,目前采用RISC架构的小型机们在扩展性上具有明显的优势。以往的x86 SMP系统以四路系统居多,并且由于传统的前端总线架构的限制,在内存带宽、I/O带宽上的瓶颈限制了向更多处理器的扩充,并且主板布线复杂,四路以上服务器主板布线更加困难,使很多OEM对于8路及以上服务器产品望而却步。RISC服务器主要面向复杂的关键型任务,扩展性要好得多,如IBM P575每个节点可以支持32个Power6内核(8路)、最新的Power 780每节点支持64个Power7内核(8路);Sun SPARC M8000最高可以支持16个SPARC64 VI/VII处理器;而富士通SPARC Enterprise M9000可以扩展到64路。

    RISC小型机的扩展性是以往的x86处理器难以望其项背的,而Nehalem-EX的出现打破了这种局面,这要归功于先进的QuickPath架构。与同门的Nehalem-EP相比,Nehalem-EX具有4条速率高达6.4GT/s(每秒传输6.4G次,双向传输速度为25.6GB/s)的QPI总线,从而Nehalem-EX具有更为优秀的可扩充性,可以在没有节点控制器的前提下构建8路系统,结合第三方控制器,可以扩充到16路甚至32路。Nehalem-EX最高具有8个核心,通过超线程技术支持16个线程,可以轻易组建8路128线程的多路多线程SMP系统。

高可靠性+可扩展性 Nehalem-EX挑战RISC
Nehalem-EX的高可扩充性

高可靠性+可扩展性 Nehalem-EX挑战RISC
Nehalme-EX相对上一代Xeon 7400平台的提升

    可以看到,在扩展性上,Nehalem-EX相比之前的x86平台有了质的飞跃,相比RISC系统也是不遑多让。带宽也是让x86保守RISC诟病的一个短板,Nehalem-EX在这方面有了新的进步??QPI总线速率为6.4GT/s,集成四通道内存控制器,采用DDR3-1066规格内存,内存带宽是之前的至强7400平台的9倍!Nehalem-EX主要是面向的是大型虚拟化整合、ERP、数据库类的应用,在数据库性能上,相对至强的7400平台提升了2.5倍,换句话说,虽然在带宽等因素上Nehalem-EX相比高端的RISC小型机还是有一些差距,但在一定程度上,Nehalem-EX打造的多核多线程SMP系统已经具备了和RISC竞争的能力。

    RAS特性媲美RISC小型机

    我们知道,传统的RISC小型机主要面向关键业务(Mission Critical)领域,比如电信、银行等社会基础设施行业,需要保证24小时365天不间断的运行,所以需要具备高度的RAS(Reliability, Availability Serviceability,可靠性、可用性与可维护性)特性。这样说起来比较抽象,具体来说,可靠性要求计算机能够持续运转,从来不停机。可用性要求重要资源都有备份,能够检测到潜在要发生的问题,并且能够转移其上正在运行的任务到其它资源,以减少停机时间,保持生产的持续运转,并具有实时在线维护和延迟性维护功能。服务性要求能够实时在线诊断,精确定位出根本问题所在,做到准确无误的快速修复。

    以往x86服务器并不具备RISC小型机的这些RAS特性,故而在关键任务领域也无从去挑战RISC小型机的地位,而Nehalem-EX的出现将让x86服务器的境况大为改观。在Nehalem-EX中引入了移植自安腾处理器的RAS特性,据英特尔介绍,Nehalem-EX拥有x86系统里最高级别的RAS,和RISC小型机相比,在RAS方面已经差距不大。其中最为重要的就是自动检验架构(MCA,Machine Check Architecture)恢复功能。


高可靠性+可扩展性 Nehalem-EX挑战RISC
Nehalem-EX引入的MCA高级RAS特性

    MCA恢复功能是安腾平台上的特性,在不需要系统停机的情况下监测和纠正CPU、内存和互联架构中的错误。这对虚拟化环境而言非常重要,使得一台运行多个虚拟机的物理服务器不需要关机来查找错误,而只需要关闭或迁移其中部分虚拟机,保证整个系统的正常运行。MCA恢复是一个系统级别的RAS特性,不仅包括CPU、内存和I/O,还需要操作系统的支持,目前VMware ESX和Windows Server 2008 R2、Novell SUSE Linux和Red Hat Enterprise Linux等系统都已经可以支持这一特性。

    当然,Nehalem-EX所具备的RAS特性并不仅仅是MCA恢复,而是包含三大部分:数据保护、增加可用性、最小化宕机时间,总共具备20余条,下面来具体看一下:

    1、保护数据

高可靠性+可扩展性 Nehalem-EX挑战RISC
Nehalem-EX所具备的RAS特性:数据保护

    数据的重要性毋庸置疑,比如电信、银行等应用环境中,数据一点出现问题后会造成很严重的后果。而这些关键应用中的计算机在数据保护上要做到三个方面:方面一,诊断哪些数据出现了错误;方面二,当真正发现这个数据出错误要利用一些CRC、ECC的校验看能不能纠正;方面三,如果不能纠正要把这些坏的数据隔离开,保证它不影响别的数据。而Nehalem-EX所具备的RAS特性已经可以实现数据保护功能。如上图,幻灯片的右侧列出的是需要实现的目标,如降低关键级别的错误、通过系统检测数据错误、限制错误产生的影响。左侧列出的是实现这些目标的RAS特性,包含ECC检测、QPI CRC检测等。

    2、增加可用性

    增加可用性的目的是一旦数据通信方面真的出现了问题,有可能是信号线电子故障,也有可能是通讯线路断了,需要考虑如何用可用性保证还可以继续使用。

高可靠性+可扩展性 Nehalem-EX挑战RISC
Nehalem-EX所具备的RAS特性:增加可用性

    具体的要求是恢复失效的数据链接、从失效的CPU&内存中迁移负载、从无法修正的数据错误中恢复、预测失效发生。具体的RAS特性就包含了需要操作系统支持的MCA恢复。

    3、最小化宕机时间

    如果Nehalem-EX服务器真的出现故障,某些部件出现故障总要维护,如何降低在维护时候的宕机时间显得异常关键。目前Nehalem-EX已经可以做到像大型机和小型机一样做到分区管理,可以实现维护分区系统替换、主动替换失效组件。

高可靠性+可扩展性 Nehalem-EX挑战RISC
Nehalem-EX所具备的RAS特性:最小化宕机时间

    和传统的RISC小型机相比,即将发布的Nehalem-EX虽然没有具备全面的RAS特性,但是已经相差不多,可以说在RAS上已经具备了媲美RISC小型机的能力,除了优良的扩展性,RAS又为Nehalem-EX挑战RISC增加了一个重要筹码。现今距离Nehalem-EX正式发布不足半个月,Nehalem-EX和新安腾的英特尔阵营虽然可能短期内还不能撼动IBM的霸主地位,但也带来了一个改变高端多路市场的新契机。

  • 正睿合作伙伴
  • 社区
首页 | 注册 | 网站地图 | 通告 | 联系我们
CopyRight(C)2004-2022 Chongqing Zhengrui Technology Co.,Ltd. All rights reserved.
重庆正睿科技有限公司(C)版权所有 未经书面授权 不得转载、复制或建立镜像
渝ICP备11002339号-1  渝公网安备 50010702500475号