这三个测试是Intel推荐的项目之一,因此笔者也使用其进行了测试:
MMM - Matrix-Matrix Multiplicaion Benchmark | |||
处理器 | 双路Intel Nehalem-EP Xeon X5570 |
双路Intel Westmere-EP Xeon X5670 |
双路Intel Westmere-EP Xeon X5680 |
单位 | GFLOPS | GFLOPS | GFLOPS |
Threads 1 | |||
5000 step | 7.821975 | 7.842319 | 8.877563 |
10000 step | 7.890761 | 7.840417 | 8.883291 |
15000 step | 7.888751 | 7.845479 | 8.881528 |
Threads 2 | |||
5000 step | 15.59136 | 15.62796 | 17.5891 |
10000 step | 15.7544 | 15.66469 | 17.73566 |
15000 step | 15.7445 | 15.64657 | 17.67208 |
Threads 4 | |||
5000 step | 30.69218 | 29.99696 | 34.85343 |
10000 step | 31.02227 | 29.75883 | 34.90105 |
15000 step | 31.04954 | 30.55926 | 34.92557 |
Threads 8 | |||
5000 step | 36.2252 | 49.03697 | 45.99856 |
10000 step | 38.21083 | 50.30305 | 45.99856 |
15000 step | 40.71236 | 56.00031 | 47.74417 |
Threads 16 | |||
5000 step | 59.38371 | 64.04222 | 66.10022 |
10000 step | 61.44583 | 62.42291 | 72.38159 |
15000 step | 61.83442 | 64.3761 | 73.2495 |
Threads 24 | |||
5000 step | 54.82514 | 84.13599 | 89.09254 |
10000 step | 54.82514 | 88.58685 | 96.85071 |
15000 step | 59.18915 | 90.12297 | 99.22003 |
MMM是一个类似矩阵乘法基准测试软件,得到的结果单位是GFLOPS,也就是说它是一个浮点测试。我们可以看到MMM测试采用的线程数量要和CPU的核心数量吻合,超出的话将会导致性能降低。Nehalem-EP X5570在16个线程下得到的峰值是61.83GFLOPS,而Westmere-EP X5670在24个线程下得到的峰值是90.12GFLOPS,极为符合核心数量多出50%的参数。它和Linpack一样,都能充分地利用CPU运算核心的能力,因此它实际上建议关闭超线程来测试。我们以后会单独列出这个测试。
SunGard Adaptiv Analytics Benchmark v4.0
SunGard Adaptiv Analytics Benchmark v4.0 | |||
处理器 | 双路Intel Nehalem-EP Xeon X5570 |
双路Intel Westmere-EP Xeon X5670 |
双路Intel Westmere-EP Xeon X5680 |
Threads | 16 | 24 | 24 |
Time (lower is better) |
138.076s | 110.331s | 94.911s |
这个测试程序是SunGard风险分析管理套件的一个部分,X5670的性能表现比X5570要高25%,X5680则又比X5670高16.2%。
black_scholes | |||
处理器 | 双路Intel Nehalem-EP Xeon X5570 |
双路Intel Westmere-EP Xeon X5670 |
双路Intel Westmere-EP Xeon X5680 |
Threads | 16 | 24 | 24 |
Time (lower is better) |
9.17s | 6.16s | 5.51s |
black_scholes是对布莱克-肖尔斯期权定价模型进行计算的一个程序,布莱克-肖尔斯期权定价模型是由1997诺贝尔经济学奖的两个获得者创立和发展的模型。测试结果上,X5670比X5570快48.9%(可见其对多核心的支持比较好),X5680比X5570快11.8%。
我们利用新添置的Aitek AWE2101数字功率计和配套的软件测试了整个服务器平台在几种不同的状态下的功耗,AWE2101是一个高精度的数字功耗测试仪:
5位数字精度
输出到计算机上
测试方法上,也和以往的略有不同,这次使用了常用的烤机Prime95软件,它并不代表着实际工作中Westmere的情况,而只能代表着集中极限情况:
Prime95是一个大质数寻找、验证软件,它能很充分地利用处理器的各种运算单元。它具有三种预设的测试方式:Small FFTs(CPU压力测试,不使用内存)、In-place large FFTs(使用一些内存)、Blend(使用较多的内存),我们对这三种方式分别作了测试。在Blend模式上,使用内存和不使用内存的功率表现是不同的,这也可以部分地看出平台内存功耗占用:
在闲置但是未进入睡眠/待机的情况下,六核Westmere-EP和四核Nehalem-EP具有非常接近的功耗,这表现了Westmere-EP的Power Gating技术表现不错。
Nehalem-EP X5570:0.896V
Westmere-EP X5670:0.912V
Westmere-EP X5680:0.944V
在Small FFT测试(对CPU压力最大,不测试内存)下,不同的处理器立刻显示出差距来,其中X5680达到了不可思议的540W,归根到底是因为多出来两个核心以及比其他处理器更高的核心电压。X5670则功耗和X5570很相近。
这个结果也揭示了X5680和X5670的一个很明显的不同:它们TDP分别为130W和95W,TDP是热设计功耗,并不意味着实际功耗。不过它通常会具有更高的运行功耗(因为通常工作电压会更高)。总的来说,Westmere-EP的功耗控制很不错,其中我们建议使用X5670这款性能、功耗都适中的处理器。
【IT168评测中心】抛去参数截然不同的X5680不谈,Intel 32nm Westmere-EP X5670和频率一致的45nm Nehalem-EP X5570相比在不同的测试当中具有着约25%~50%的性能提升,而功耗只是略微增加(每个处理器约10W左右),这个表现比起Nehalem-EP相对Penryn Xeon的提升(一到两倍)确实显得不那么显眼。
32nm 六核心:Intel Westmere-EP晶圆图
X5680是最高端的型号,而X5670是95W TDP中最高端的型号
不过这个性能提升对于很多应用来说也非常足够了。更多的核心除了带来更好的性能之外,它还提供了更多的选择,例如你可以选择用四核心的Westmere-EP型号,那么在性能比Nehalem-EP高一点(四核心Westmere-EP也配置了12MB L3缓存)的情况下,功耗将会更低。促使一些人群选择四核心Westmere-EP可能还因为一个因素:核心竞争L3/内存控制器/QPI,它导致了一些应用的性能提升幅度低下。我们期待不远的将来可以对这些型号进行测试。
内存支持方面也是Westmere-EP的一个明显增强的地方,它具有以下四点进步:
1、Westmere-EP现在支持低电压DDR3,电压值从原来的1.65V降低到1.50V乃至1.35V
2、Westmere-EP现在支持每个内存通道具有两个DIMM运行在1333MHz,而Nehalem-EP只支持一条,插更多内存会让内存降速
3、Westmere-EP对内存规格的支持总体上提升了,所有型号最低都支持DDR3-1066,而Nehalem-EP最低的支持到DDR3-800
4、Westmere-EP现在支持单条16GB的内存条,总内存容量增加了一倍,达到了288GB
相信对不少人具有不错的吸引力。笔者为了进行SPEC CPU 2006测试特地借来的48GB 1.35V DDR3-1333内存符合了其中的多项要素,测试也正在进行中,稍过一段时间大家讲可以看到Westmere-EP的SPEC CPU性能表现以及1.35V低电压DDR3的功耗表现。
AES NI的效果,数据来源:Intel
此外,AES新指令集的效果不得不提,它确实非常明显,我们进行的EVEREST CPU AES基准测试具有17倍的性能提升。此外,虚拟化方面也明显感到进步不少(1GB大页面、12%降低的虚拟机切换时间),总的来说,Westmere-EP对不少的人来说都很有吸引力,它将会是Nehalem-EP的一个很成功的继任者。
其他厂商的情况如何?
在Westmere-EP通过1GB大页面等的支持来弥补大页面TLB表过少的缺陷的同时,AMD也在弥补它们的弱项:整数流水线过弱。整数操作是大部分日常应用的基础,在对四路六核心Istanbul的测试中我们发现它的单CPU同频整数性能和四核心Nehalem-EP差不多(AMD六核Istanbul 曙光四路服务器评测),而六核Westmere-EP的出现将会继续拉开这个距离。AMD提升整数性能目前的做法有两个:一是在Magny-Cours这样的芯片中增加一倍的核心数量达到十二核并顺便提升了浮点性能,二是干脆在AMD Bulldozer这样的新架构中将整数管线翻倍(双线程还是双核?AMD推土机处理器简析)。
Nehalem Microarchitecture
归根到底,唯有处理器微架构上的设计才是基本,Intel Nehalem处理器具有着优美的微架构(除了大页面TLB有点少之外)和经过千锤百炼的执行管线,以及可以将其性能充分发挥出来的超线程技术,这些才是Intel处理器的核心竞争力。Westmere-EP在强劲的Nehalem微架构的基础上,轻松地发展工艺、增加核心并改良缺陷,提升性能并降低功耗,它代表了目前最强有力的x86处理器(除了稍迟推出的Nehalem-EX之外)。下一个阶段,Lucifer将会带大家观看真正的高端对决:Nehalem-EX VS POWER7,以及Intel的下一代微架构Sy Bridge,敬请期待。(完)