正睿服务器  >  新闻中心  >  评测室
新闻中心

超线程影响如何?至强7500数据库测试

间隙填充
正睿科技  发布时间:2010-06-26 10:42:29  浏览数:4719
    前段时间我们测试了Nehalem-EX(至强7500系列和6500系列)处理器的数据库性能表现,从结果来看,应该是受到了网卡的限制。Nehalem-EX是一个最高8核的基于Nehalem架构的面向多路服务器的处理器,其下一代Westmere-EX也已经浮出水面,最高将会达到10核(也就是20个线程)。不过Westmere-EX看来今年内是无法到达我们手中了。


四路Nehalem-EX刀片服务器:DELL PowerEdge M910

  虽然我们猜测测试中的问题在于网络接口,可是我们也没机会验证,因为样机DELL PowerEdge M910是一个基于四路Nehalem-EX的、全高的DELL刀片服务器,无法使用我们手中的多块网卡,它只能使用它自有的模块。下面我们先来看看我们对Nehalem-EX/PE M910进行的关闭超线程进行的数据库性能测试。

  测试环境和测试方法一如既往……


网络实验室控制台

网络实验室机房

Cisco Catalyst 4506千兆交换机,120个千兆铜口

部分Dell PowerEdge SC430服务器
   测试平台:

测试平台、测试环境
测试分组
类别
四路Intel Nehalem-EX
Xeon E7540
处理器子系统
处理器 四路Intel Xeon E7540
处理器架构 Intel 45nm Nehalem-EX
处理器代号 Beckton
(Nehalem-EX)
处理器封装 Socket 1567 LGA
处理器规格 六核
处理器指令集 MMX,SSE,SSE2,SSE3,SSSE3,
SSE4.1,SSE4.2,EM64T,VT
主频 2.0GHz
Turbo Boost主频
(多核)
2.00GHz(+0MHz)
Turbo Boost
主频
(单/双核)
2.26GHz(+266MHz)
处理器外部总线 4x QPI
3200MHz
6.40GT/s
单向12.8GB/s(每QPI)
双向25.6GB/s(每QPI)
L1 D-Cache 6x 32KB
8路集合关联
L1 I-Cache 6x 32KB
4路集合关联
L2 Cache 6x 256KB
8路集合关联
L3 Cache 18MB
24路集合关联
主板
主板型号 DELL PE M910
芯片组 Intel Boxboro
IOH:Intel 7500(Boxboro)
ICH:Intel 82801JR(ICH10R)
芯片特性 2x QPI
36 PCI Express Gen2 Lanes
VT-d Gen 2
内存控制器 每CPU集成两个SMI
主板实现一个SMI
每SMI两个SMB
四通道R-ECC DDR3 1066
内存 4GB R-ECC DDR3 1066 SDRAM x16
网络子系统
网卡 Broadcom BCM5709S Dual Port GbE x2
8x RSS Queue
MSI
软件环境
操作系统 Microsoft
Windows Server 2008 R2 Datacenter Edition

   我们在BIOS中关闭了超线程技术,在DELL M910服务器中,这个选项叫Logical Processor。

测试环境与测试平台
DELL PowerEdge M910刀片

 测试环境与测试平台
使用的DELL PowerEdge M1000e刀片机架


Nehalem-EX Xeon E7540处理器,搭配的芯片组叫做Boxboro,也叫7500系列芯片组


Nehalem-EX:Xeon X7540,不是最高端型号,只具有6个核心


Click Here

  解读:4P24C48T指的是4处理器(Processors)、24核心(Cores)、48线程(Threads)。依此类推。 


三角形结点的就是关闭超线程的M910

  结果比之前开启超线程的都要高,达到了13万Tps,此时使用任务管理器看CPU负载已经达到了100%,这应该确实是M910的真实性能了。当然,CPU占用显示为100%并不一定就意味着机器已经达到了极限,它只能作为一个参考。


双Broadcom BCM5709S双口千兆网卡,支持8个RSS队列

  问题可能出现在两个方面:网卡和系统SMP处理上。有可能目前的BCM5709S网卡驱动无法很好地利用多核,导致关闭超线程下性能还更高一些。也有可能是硬件+系统软件的对超线程的支持有些问题,Windows Server 2008 R2的内核以及网络堆栈在这方面是没有问题的,问题可能出现在早期的主板BIOS上。在多个软件的测试中笔者碰到了只能利用到32个逻辑处理器的情况(打开超线程下M910会具有48个逻辑处理器),这可能是一个问题。

  笔者对Nehalem-EX平台寄予了厚望,这是因为它具有新的内部拓扑结构:一个环形总线将所有核心/L3缓存块以及外部IO连接了起来。然而这个结构对目前的Nehalem-EX来说未能完全体现出性能上的优势来,因为它们的频率比较低一些,预计其下一代10核心、频率也更高的Westmere-EX处理器才会是真正展现实力的时候。


DELL PowerEdge M910

  通过测试,笔者发现关闭超线程下得到的成绩还高一些,达到了13万TPS,笔者也希望能将Nehalem-EX真正的性能展现出来。不日Intel官方的Nehalem-EX样机将会到达我们评测中心,预计这个配置更高、更完全的机器将会有带给我们更接近真实的表现,敬请期待。

  • 正睿合作伙伴
  • 社区
首页 | 注册 | 网站地图 | 通告 | 联系我们
CopyRight(C)2004-2022 Chongqing Zhengrui Technology Co.,Ltd. All rights reserved.
重庆正睿科技有限公司(C)版权所有 未经书面授权 不得转载、复制或建立镜像
渝ICP备11002339号-1  渝公网安备 50010702500475号