天河二号性能揭秘之CPU篇
来源:中国电子政务网 更新时间:2013-12-12
2013年在超级计算领域最激动人心的消息就要算是“天河2号”登顶并蝉联Top500冠军了,这也是中国超算继2010年11月“天河1A”之后第二次获得此项桂冠,标志着中国超级计算机的水平再一次跃上了新的高峰。鎼滅储

天河二号性能揭秘之CPU篇
▲2013年11月 TOP500数据

  根据世界超级计算机TOP500组织公布的资料显示,天河二号的峰值速度(Rpeak)每秒54,902.4TFLOPS(万亿次浮点运算)、存储总容量12400万亿字节。打个形象的近似比喻,天河二号运算1小时,相当于13亿人同时用计算器计算一千年,其存储总容量相当于可存储每册10万字的图书600亿册。

  天河二号超级计算机落户于国家超级计算广州中心,系统共有16,000个运算节点,其中每个节点配置了两颗Ivy Bridge-EP平台Intel Xeon E5-2692V2 CPU,运算加速器使用了3片英特尔公司最新基于MIC架构的Intel Xeon Phi 31S1P协处理器产品。 节点间通过带宽为160Gbps的THExpress-2高速网络进行互联。

  小编注意到,在11月份的TOP500榜单中,共有13套系统配备了英特尔至强融核协处理器,而采用至强处理器和至强融核协处理器的计算加速架构现在有一种全新的叫法“微异构架构”,究其原因,这种架构属于具有多种类型计算力的硬件架构,但通用编程模型却可以予以支持,可以简化开发和优化过程。这一优势是其它异构架构所无法实现的。自天河二号发布后,“微异构架构”也正在逐步成为被高性能计算行业普遍认可的加速模式。

  在网络设计上,天河二号采用了Arch互连机制,也就是TH Expresss-2.Arch互连体系与两个Ivy Bridge-EP节点被安置在同一块电路板上。计算节点与至强Phi协处理器共享了机架空间--左侧空间归计算节点、右侧则容纳五块至强Phi协处理器,且二者都可以单独抽出。除此之外,天河二号还在高速互连、新型层次式加速存储架构、容错设计与故障管理、综合化能效控制、高密度高精度结构工艺等方面取得了一系列创新和突破。

  说了这么多,各位对天河二号也有了一个简单了解,接下来进入今天的主题--天河二号CPU全面解析。

  前面已经提到,天河二号采用的CPU型号为Intel Xeon E5-2692V2 CPU,想必各位都清楚这是Intel最新发布的Ivy Bridge-EP产品家族中的一员。Ivy Bridge-EP可以说为服务器领域引来了一片春天。因为新的V2版Xeon E5-2600V2系列将核心数由原来Sandy Bridge-EP最高8核的提高至拥有8核、10核和12核多种规格,所以V2版Xeon E5成为了组建服务器的好选择。其制程工艺采用的是英特尔最为领先的22纳米制程技术,与前一代产品相比,能效提高多达45%,最多可集成12个内核,能够快速运行多种计算密集型工作负载,最高可将性能提升50%。

天河二号性能揭秘之CPU篇

  根据Intel公开的E5-2600V2系列处理器产品资料,Intel将型号分为四种类型,分别是基本型、标准型、高级型和行业优化型,其性能也都有较大幅度的提升和改善。用户对于性能级产品的需求就跟其定位一样,始终属于大多数人的选择,尤其是高性能用户对性能级产品有需求的人往往更在乎性能。用户在选购处理器产品时往往会考虑整体预算、性价比、核心、主频等等。

  而在行业优化型中的E5-2692V2正是天河二号中使用的CPU,这款CPU主频为2.2Ghz,核数高达12个。在天河二号发布后由媒体爆出的E5-2692V2吊足了我们的胃口,“等待”有的时候就意味着期盼的加深和神秘的笼罩,经过多方辗转,小编终于借到E5-2692V2 CPU以做测试。

天河二号性能揭秘之CPU篇
▲Intel E5-2692V2 CPU

  大家一定跟小编一样很期待看到E5-2692V2的性能表现,在实际的综合应用中又会带来哪些不一样的全新体验?带着这些疑问,小编为大家献上Intel E5-2692V2 CPU全球首发评测文章,给所有关注天河二号的朋友解解馋。

  为了评估IvyBridge平台所带来的性能变革,小编特别选了Intel  SandyBridge  E5-2670 CPU作为今天的对比评测对象,同时也选择了另一款Ivybridge处理器E5-2680V2作为同平台对比测试(理论浮点计算能力略高于E5-2692V2)。

天河二号性能揭秘之CPU篇
▲Intel E5-2670 CPU        Intel E5-2680V2 CPU

  在正式测试之前,小编先带大家一起看看这三款CPU的型号规格:

天河二号性能揭秘之CPU篇
▲点击查看大图

  通过参数可以看出,这三款处理器在功耗上是一样的,这也是小编为什么选择这三款处理器做对比测试的重要原因。

  大家都知道,CPU-Z 是非常普遍的一款CPU检测软件,是检测CPU使用程度最高的一款软件。它支持的CPU种类相当全面,软件的启动速度及检测速度都很快。另外,它还能检测主板内存的相关信息,其中就有我们常用的内存双通道检测功能。因此小编先用CPU-Z软件对这三款CPU进行了检测。

天河二号性能揭秘之CPU篇
▲E5-2692V2 检测 

天河二号性能揭秘之CPU篇
▲E5-2670检测

天河二号性能揭秘之CPU篇
▲E5-2680V2检测

  接下来就一起进入今天的评测吧。

  本次所要测试的硬件平台是从某厂商借用的两台NF5280M3机器,该机型对上述三款处理器都可以支持。本次评测部分将会分为基准测试、应用类性能测试两大部分。测试的三个配置除了CPU之外其余硬件均保持一致。主要测试E5-2692V2、E5-2670、E5-2680V2的性能对比,重点验证IvyBridge平台带来的性能变革。

  在测试状态下,两个平台均会以主板的Auto状态中进行成绩测定,节能选项和睿频加速功能将默认开启。

天河二号性能揭秘之CPU篇

  一、基准测试数据对比

  在基准性能测试环节中,我们使用Linpack以及Stream来测试平台的计算性能。

  Linpack测试结果:

天河二号性能揭秘之CPU篇

  通过Linpack测试数据可以看出,双路E5-2692V2 CPU平台的优势非常明显,实测性能达到445.980GFlops,E5-2670实测性能却只有345.513 GFlops,在Linapck性能上提升了29%.

  同时从测试结果看,虽然E5-2680V2在理论浮点计算能力(Rpeak)要高于E5-2692V2,但是E5-2692V2的实际效率高出了7%,E5-2692V2的实际Linpack结果也要略高于E5-2680V2.

  Stream测试结果(内存频率1600Mhz):

天河二号性能揭秘之CPU篇

  通过Stream测试数据可以看出,E5-2692V2 CPU在内存Copy、Scale、Add、Triad性能上比E5-2670均高出5%-9%。

  虽然从参数上看,E5-2680V2和E5-2692V2,在内存通道、支持的内存频率方面都是一样的,但是在Stream测试结果来看,E5-2692V2在内存Copy、Add、Triad都要高于E5-2680V2。

  二、HPC应用数据对比

  1、流体力学典型应用软件FLUNT测试对比

  测试算例:

  本次对比测试采用Flunt软件应用卡车车体外流测试算例,三维网格数为1400万,使用DES湍流模型,基于压力的NS方程求解器(pbns),稳定迭代100步。软件为Flunt 14.0版本。

  测试数据:

天河二号性能揭秘之CPU篇
▲表1:truck14m测试的时间数据

天河二号性能揭秘之CPU篇
▲图1:truck 14m算例完成时间对比

  由表1及图1所示可看出:

  在单节点下,E5-2692V2性能比E5-2670提高16.6%;E5-2692V2性能比E5-2680V2提高5.3%.

  在双节点下,E5-2692V2性能比E5-2670提高31.9%;E5-2692V2性能比E5-2680V2提升21.5%.

  2、气象学典型应用软件WRF测试

  测试算例:

  本次测试采用气象学典型应用WRF测试算例,预报时效48小时,四层区域嵌套,每三小时输出WRFOUT文件。软件版本采用WRFV3.4.1

  测试数据:

天河二号性能揭秘之CPU篇
▲表2:WRF算例完成时间和加速比

天河二号性能揭秘之CPU篇
▲图2:WRF算例性能提升对比

  由表2及图2所示可看出:

  在单节点下,E5-2692V2性能比E5-2670提高28.1%;E5-2692V2性能比E5-2680V2提升2.3%.

  在两节点下,E5-2692V2性能比E5-2670提高30.5%.E5-2692V2性能比E5-2680V2提高6.7%.

  三、测试小结

  通过对Ivy Bridge-EP E5-2692V2、Intel E5-2680V2以及Sandy Bridge-EP E5-2670在基准测试、行业应用软件测试等多种性能比较测试,可以看出E5-2692V2均有非常良好的表现。

  小编也从相关厂商了解到,由于E5-2692V2是针对与高性能计算专用的处理器,所以针对高性能计算应用做了很多内部优化,或许这也正是天河二号选择这款CPU的原因吧。