64机群计算机成都高原气象所案例
来源:计算机世界 更新时间:2012-04-15
 

改枪换炮 现代预报

目前,数值天气预报水平的高低已经成为了衡量世界各国气象事业现代化程度的重要标志,而气象预报也已从传统的理论方法,发展到了今天以大气科学理论为基础、综合运用科技手段,通

过高性能计算机平台完成的现代气象数值预报。
 
因而,中国的气象数值预报创新技术的研究是改变我国气象预测水平提升的根本途径。在长期的气象服务工作中,成都高原气象所准确的预报,优质的服务为国防、重大社会活动、重点工程项目(如:西昌基地的卫星发射、卫星的回收、三峡工程大江截流等)提供气象保障服务,成为国家重点的气象单位。面对气象现代化的需要,成都高原气象所开始了数值预报的积极探索。
 
为了满足气象数据处理中要求的超级运算能力、高存储,根据气象所的需求,曙光为其提供了一套低投入、高效率的气象专用高性能计算机机群系统,并以优异的性价比完全满足气象科学计算的要求。在国家大型气象预报及监测系统运用中,IA机群的并行运算取得了不斐的成绩。
 
值得一提的是,此次,气象所引进了业界先进的64位运算模式的曙光TC1700A气象专用计算机,同时具有兼容32位技术、内置内存控制器、超传输总线三大技术优势,正是顺应了成都高原气象所气象研究向现代化的转变,成为其气象预报现代化布置的强大后台。
 
64位气象后台
 
需求特点:
 
曙光64位气象专用高性能计算机具有可自由伸缩、高度可管理、高可用、高性能价格比等诸多优点,涵括在中尺度数值天气预报领域处于领先地位的NCAR   MM5气象模式。
 
伴随计算机技术的飞速发展,MM5所使用的计算平台发生了显著的变化,从仅可用于CRAY等巨型机过渡到大量使用于工作站,甚至已开始用于高档微机,并从单个CPU发展到多个CPU分布式和共享式内存并行计算。由于MM5中尺度数值模式可考虑高分辨的地形和陆面使用状况等重要的局地迫动因子,并可使用复杂的物理参数化方案,来研究和预测高分辨的局地中尺度天气现象,其相对于大模式的灵活性、细致性,使其应用范围迅速扩大,如各种中尺度天气系统的研究;实时预报;中尺度集成预报;区域气候预报;航空航海的气象保障;利用MM5来模拟产生军事训练和分析的协同环境;在空气质量和大气化学研究中的应用等等。
 
曙光气象专用高性能计算机完全实现了软硬件一体化,气象专用软件是基于曙光气象专用高性能计算机上开发完成的,同时安装了系统软硬件运行状态监控系统,使用户对机器的软硬件系统的工作状况和工作环境一目了然。  
 
设计方案中的拓扑图:

方案简述及特点:

在成都高原所气象方案中,TC4000L机群系统包括4个计算节点、1个计算兼服务节点、一套信息数据网、一套系统管理网及其他机群辅助构件。

从上图可以看到,在主机柜中的4个计算节点和1个服务节点通过两套网络连接,一套千兆网络。一套百兆以太网,其中一套百兆网是系统管理网,用来控制和管理所有的节点,一套百兆网是系统数据网,用来传输数据信息。管理网和数据网分离大大提高了网络可用性,同时保障了数据的传输带宽。同时各节点通过分频器和串口连接线组成视频切换网和硬件监控网。这就是TC400L所特有的网络--管理网、数据网。

在信息数据网中,节点全部通过各自机柜的3COM 17700千兆以太交换机连接,充分保障各节点的数据传输带宽,3COM 17700千兆以太交换机作为信息数据交换机,提供12个固定的10/100/1000M BaseT端口。
在管理网中,节点全部通过各自机柜的100M交换机连接,此网络用来控制和管理所有的节点,同时保证数据的传输。 流通的信息数据和管理网分开,使各自的数据交流不受影响。

所有节点全部采用曙光最新的具有极高性价比的企业级机架式服务器

                                               R220A

支持双路AMD Opteron 64位处理器;有6个DIMM插槽,最大支持12GB   内存;
集成双通道Ultra320 SCSI控制器;
有6个热插拔SCSI硬盘槽位;
主板集成两个10/100/1000M以太网卡,支持网卡冗余和自动负载平衡;
主板集成显示控制芯片,内建8MB独立显存;
支持冗余风扇,可选曙光特有的硬
技术特色


在高端,曙光公司曾先后推出曙光1000系列超级服务器(获国家科技进步一等奖)、曙光2000/3000系列超级服务器(获中国科学院科技进步特等奖),具有研制大规模机群服务器的丰富经验;在低端,曙光公司先后推出20余种IA架构的PC服务器产品,在软硬件设计、系统监控管理等方面有自主知识产权的成功产品,并且目前拥有从亿元到6999元入门级的全系列64位服务器产品,实现了"全线出击,以高带低",由于兼容32位计算的开放态度,最大程度上保护了用户的投资,并且集成内存控制器技术、增强病毒控制技术、超传输总线技术多种优势。

曙光气象专用高性能计算机集大规模超级服务器机群技术和低端服务器软硬件设计技术于一体,形成了一批具有自主知识产权、技术先进、具有极强市场竞争力的软硬件配套产品,使之成为符合中国用户使用习惯、具有中国特色的气象专用高性能计算机机群高性能计算机产品和应用解决方案。

1、友好的用户界面

曙光公司针对MM5数值天气预报模式,专门设计了用户图形操作界面。这款专用高性能计算机界面友好,易操作,易使用,实用性强,用户操作傻瓜化。系统每天可以自动定时定点进行业务系统预报,从数据导入到绘出气象图形的整个流程自动完成,不需要人工干预;用户可以随时监控整个系统的运行,大大节约了用户操作的时间。对于用户而言,几乎不需要任何计算机系统知识的培训,就可以快速掌握整个预报系统。

2、一机多用实用性强

这款专用高性能计算机,既可以作为业务预报系统,又可以作为气象研究和测试的平台,一机多用,用户可以根据自己的需要进行调试运行。系统提供可以保存数据的功能,使得用户可以对以往一个月内不满意的预报进行重新计算和分析,最大限度地满足了用户的需求调试系统。同时提供调试系统到业务系统的导入功能,使得用户自己刚刚研发出的产品马上可以转换为业务预报系统。

3、高速完成预报任务

曙光气象专用高性能计算机根据用户的不同需求,定制了三款不同配置的产品。分别具有不同的计算能力和数据传输能力 ,可满足各方面的需要。曙光气象专用高性能计算机具有超强的计算能力,完全能在期望的时间内完成任务,提供满足需要的气象数值产品。

4、软硬件一体化

这套服务器完全基于曙光服务器上开发的,软硬件的磨合很好,不会出现任何不适应的状况。

5、系统监控、管理技术

曙光气象专用高性能计算机系统利用简单直观的管理工具来管理整个机群,极大地提高了工作效率。曙光气象专用高性能计算机的监控工具可以监控到整个机群的软硬件运行状态,如:整个系统工作环境,各节点CPU和内存的使用率,网络流量,各节点主板温度、CPU温度,机箱风扇转速、CPU风扇转速,主板电压、CPU电压等等,使系统管理员对各节点的情况一目了然。监控工具同时提供了报警功能,当出现故障点时(如温度异常、风扇停止转动等),可以及时提醒系统管理员进行处理,避免或减少系统故障和由其引起的用户损失。系统规模越大,系统管理和监控的效率越高。
MM5的作业流程监控系统显示流程的运行情况,模块的输出信息,和处理的时间进度,整个流程尽在用户的掌控之中。

6、单一系统映象

简单地说,单一系统映象技术就是让一个服务器聚集无论对用户,还是对系统管理员使用起来像一台整体的计算机,而不是作为多台独立的计算机的管理技术。即系统中所有分布的资源被组织成一个整体统一管理和使用,用户可以不去关心单个节点机的存在。从用户的角度看,一个聚集系统就如同一个具有巨大配置的单一计算机系统。单一系统映象技术由几方面的内容构成,主要包括单一登录点(Single Entry Point)、单一控制点(Single Control Point)、单一用户管理(Single Users Management)、单一文件系统(Single File System)、单一权限控制(Single Access Control)、单一用户界面(Single User Interface)、单一进程空间(Single Process Space)等。单一系统映象技术是曙光气象专用高性能计算机机群系统的关键技术之一。

7、系统支持动态扩展

曙光气象专用高性能计算机的机群式架构决定了其具有优异的动态扩展性。根据用户应用需要,可以选择扩展能力很强的通用节点,节点总数可扩展到99个。尤其需要指出的是,气象专用高性能计算机的动态伸缩性非常强。用户如果需要减少节点数目,可以随时指定节点与整个系统隔离;用户如果需要扩展节点,只需稍微变更配置文件即可完成;对于LINUX通用节点,用户甚至可以使用气象专用高性能计算机提供的节点自动安装功能,气象专用高性能计算机会为用户自动安装(包括操作系统)和配置应用节点。

曙光公司正在开发提供即插即用的操作界面,此工作完成以后,用户将可以不通过显示设备即可为服务器配置网络,保证整个已经配好应用的机群服务器在用户现场即插即用。届时,曙光气象专用高性能计算机将全面具备"节点自动安装、系统自由伸缩、机群即插即用"的动态扩展能力。

巧破气象天机

这是我国气象事业应用中的第一台基于OPTERON芯片的64位机群计算机,将对提高我国的天气预报水平,促进国内气象预报方法实现由半经验半理论的统计方法向现代气象数值预报迅速转变具有重要的借鉴意义。同时,此次曙光TC1700A用于气象研究也表明了,随着曙光1700A、曙光4000A等一系列高性能计算机的相继问世和投入使用,国产超级计算机已经开始担当起国内各个行业信息化建设和服务的重任。
曙光公司一直致力于服务气象行业,并且在气象行业积累了丰富的行业经验,2002年曙光公司推出了专门面向气象研究的气象专用计算机在填补国家空白的同时,当年此类机型就应用于西藏和贵州省的气象服务,去年又进入了山西气象局等气象系统,开辟了一条科研和市场同步走的先河。作为引领IT潮流的曙光64位服务器,他采用了国际领先的AMD OPTERON处理器,国内运行次数最高的每秒运算10万亿次的超级服务器曙光4000A也采用了同种系统结构。作为我国高性能计算领域的领头雁,曙光公司在"整合计算,细分应用"的指导思想下,已经在我国的气象、石油等关系到国计民生的重点行业中积累了丰富的行业应用经验,而随着浮点运算达到10万亿次的曙光4000A即将落户上海超级计算中心,这无疑又将极大的带动我国高性能计算应用的发展。