气象专用计算机系统解决方案
来源:中国电子政务网 更新时间:2012-04-15
项目背景:

   曙光气象专用高性能计算机系统是曙光信息产业(北京)有限公司推出的并行计算机系统,具有操作非常简单、实用性强、全自动运行、高度可管理、高性能价格比等诸多优点。曙光气象专用高性能计算机系统安装了目前在国内数值天气预报领域处于领先地位的NCAR MM5气象模式。

   随着计算机技术的飞速发展,MM5所使用的计算平台发生了显著的变化,从仅可用于CRAY等巨型机过渡到大量使用于通用计算机,并从单个CPU发展到多个CPU分布式和共享式内存并行计算。计算效率的迅速提高,使得中尺度模式走出了少数研究中心,得到了越来越广泛的应用,并从单纯研究手段逐渐成为了实时业务预报的工具。

   MM5中尺度数值模式可考虑高分辨的地形和陆面使用状况等重要的局地迫动因子,并可使用复杂的物理参数化方案,来研究和预测高分辨的局地中尺度天气现象,其相对于大模式的灵活性、细致性,使其应用范围迅速扩大,如各种中尺度天气系统的研究;实时预报;中尺度集成预报;区域气候预报;航空航海的气象保障;利用MM5来模拟产生军事训练和分析的协同环境;在空气质量和大气化学研究中的应用等等。

   曙光气象专用高性能计算机系统完全实现了软硬件一体化,气象专用软件是基于曙光气象专用高性能计算机系统上开发完成的,经过了气象行业权威专家的测试,完全可以用于局部地区的实时气象预报和科学研究需要。曙光气象专用高性能计算机安装了系统软硬件运行状态监控系统,使用户对机器的运行情况一目了然,无需专业培训,使用起来亦可得心应手。

   市场定位:

   曙光气象专用高性能计算机系统是一款功能强大、市场竞争力颇强的计算机系统。对于一般经济条件有限的气象单位进行中尺度模拟的业务和试验,确是一种切实可行的选择。

   MM5中尺度预报模式特别适用于省、市、地区级的气象部门开展当地有限区域的天气预报业务和相关的气象研究。

   曙光气象专用高性能计算机系统既可以解决普通业务人员对数值预报所需的超大规模计算能力和平台的缺乏;也可以满足资深气象技术人员对预报模式和预报算法的进行深入研究的需要。

   技术路线:

   曙光公司依托国家智能计算机研究开发中心(NCIC)和国家高性能计算机工程中心(NCHFC)两大国家级研究中心的强大技术实力,多年来致力于振兴民族高性能计算机产业。曙光气象专用高性能计算机系统的技术思想主要来源于曙光公司成熟产品,包括每秒4000亿次运算能力的曙光3000超级服务器(被评为2001年中国十大科技进展),TC1700集群式超级计算机,以及其他曙光服务器功能性实用产品。气象专用高性能计算机系统的问世标志着曙光公司在提升国产高性能计算机的应用水平、产品化能力,适应市场、满足市场需求等方面又取得了长足的进步。

   在应用方面,曙光公司致力于为用户提供简单实用的功能性产品,即:为用户解决实际应用问题。一方面,将用户从繁琐的重复性的手工操作中解放出来,极大地提升工作效率;另一方面,将用户的实际应用需求融入到产品设计之中,将用户所需的整体应用解决方案转化为一款实用的功能性产品。

   技术特色:

   曙光气象专用高性能计算机系统集曙光公司研制大规模超级服务器机群技术和服务器软硬件设计技术于一体,开发了一批具有自主知识产权、技术先进、具有极强市场竞争力的软硬件配套产品,使之成为一款符合中国用户使用习惯、具有中国特色的气象专用高性能计算机产品。

   1.操作简便、全自动运行

   曙光公司针对数值天气预报应用而设计,易操作、易使用、实用性强。曙光气象计算机专门设计了"傻瓜化"用户操作,系统每天可以自动定时定点进行业务系统预报,从数据下载导入、系统资源分配、数值计算、数值分析到绘出气象图形的整个流程全自动完成,不需要人工干预。这套系统大大减少用户每天枯燥的重复劳动,避免经常出现的人为操作错误;也节约了用户操作的时间,极大地提高了用户工作效率。在系统自动运行期间,用户可以随时地通过图形界面监控整个系统的运行。

   对于用户而言,几乎不需要任何计算机系统知识的培训,就可以快速掌握整个预报系统。

   2.贴近用户应用的流程和界面

   曙光公司针对MM5数值天气预报模式,专门设计了用户图形操作界面。图形界面完全按用户的实际操作流程来设计,界面简洁、使用方便。

   这套MM5的作业流程监控系统可以显示流程的运行情况,模块的输出信息,和处理的时间进度,整个流程尽在用户的掌控之中。

   3.计算能力强、高速完成实时预报任务

   曙光气象专用高性能计算机系统具有超强的计算能力,完全能在期望的时间内完成任务,提供满足需要的气象数值产品。权威测试数据表明,曙光气象专用高性能计算机系统的极好的计算能力,完全可以满足区域范围气象预报的实时性要求。

   曙光气象专用高性能计算机系统根据用户的不同需求,定制了不同配置的产品,具有不同的计算能力和数据传输能力,可满足各方面的需要。

   4.一机多用、实用性强

   这款专用高性能计算机系统,既可以作为业务预报系统,又可以作为气象研究和测试的平台,一机多用。用户可以根据自己的需要进行调试运行,系统也提供可以保存数据的功能,使得用户可以对以往一个月内不满意的预报进行重新计算和分析,最大限度地满足了用户的需求调试系统。同时提供调试系统到业务系统的导入功能,使得用户自己刚刚研发出的产品马上可以转换为业务预报系统。

   5.软硬件一体化

   曙光高性能计算机是目前国内性能最高的商品化的通用并行计算机系统。这套气象专用计算系统是完全基于曙光并行计算机开发的,软硬件的紧密结合,可以充分发挥整个系统的最高性能。

   一般而言,系统的整体性能并不单独由硬件配置或运算效率来决定,而是取决于整个系统中存在的"性能瓶颈"因素。曙光气象专用高性能计算机系统在曙光高性能计算机平台上进行了周密测试,针对所发现的系统硬件性能瓶颈和软件并行效率进行了大量的系统优化工作,有效提升了系统的整体性能和运行的稳定性。

   6.系统监控和管理

   曙光气象专用高性能计算机系统利用简单直观的管理工具来管理整个机群,极大地提高了工作效率。曙光气象专用高性能计算机系统的监控工具可以监控到整个机群的软硬件运行状态,如:整个系统工作环境,各节点CPU和内存的使用率,网络流量,各节点温度,风扇转速,直流电压等等,使系统管理员对各节点的情况一目了然。监控工具同时提供了报警功能,当出现故障点时(如温度异常、风扇停止转动等),可以及时提醒系统管理员进行处理,避免或减少系统故障和由其引起的用户损失。

   系统规模越大,系统管理和监控的效率越高。

   7.系统扩展性好

   曙光气象专用高性能计算机系统的机群式架构决定了其具有优异的动态扩展性。根据用户应用需要,系统选择了扩展能力很强的通用节点,节点总数可扩展到64个以上。尤其需要指出的是,气象专用计算机系统的动态伸缩性非常强。用户如果需要减少节点数目,可以随时指定节点与整个系统隔离;用户如果需要扩展节点,只需稍微变更配置文件即可完成;用户甚至可以使用气象专用计算机系统提供的节点自动安装功能,气象专用计算机系统会为用户自动安装(包括操作系统)和配置应用节点。

   随用户需求的提升,用户可以在原有设备基础上,增加少许投入,在不影响现在应用运行的基础上实现系统硬件平台的升级。既有效保证用户现有投资,又免去用户升级时常遇到的现有应用移植之烦恼。

   系统组成:

   1、机柜系统和电源系统

   2、计算机节点(根据应用规模进行设计)

   3、MM5气象预报系统

   @友好的人机交互界面,简单化的操作。

   @通过业务运行界面预报员可以直接完成预报。

   @提供调试系统界面,用户可以根据需要进行参数调整,进行气象科学研究使用。

   @自动化运行,不需要人工干预每天定时定点进行预报。

   @提供运行监控界面,随时监控整个预报系统的运行状况。

   @提供日志查询界面,可以随时查询出错信息。

   @提供升级服务,将调试系统根据需要导入到业务系统中进行业务预报。

   @提供云图显示界面,用户可选择区域范围进行云图观测预报。

   @提供远程监控界面,用户可以通过远程监控完成其业务功能。

   4、存储系统

   根据应用规模提供合适容量的磁盘阵列。200GB~1TB容量可选。

   4通道Ultra3 SCSI,每通道160MB/s的传输速度。

   支持RAID 0,1,3,5,0+1模式。

   5、输入/输出系统(可选视频切换节点)

   6、网络系统

   根据应用规模提供合适数据交换网络。

   支持100Mb Ethernet、1000Mb TX Ethernet、1000Mb FC Ethernet、专用Myrinet网络。

   7、DCMS机群管理软件(Dawning Cluster Management System)

   基于机群操作系统的曙光机群管理软件,实现系统单一管理点。

   为系统管理员完成常用的系统管理任务提供图形化界面和接口,如用户管理、访问限制、系统配置、系统控制、基于TCP/IP的网络管理功能(如TCP/IP的配置、Hosts表管理、NFS配置、NIS配置)等。

   通过管理界面,向整台气象专用高性能计算机系统或部分选中节点并行发送系统管理指令。

   通过管理界面可以轻松完成DNS的自动配置。

   可选择的附加功能系统

   1、硬件监控系统(可选)

   独立的CPU和控制电路板采集节点大部分硬件信息和工作状态。

   满足工业标准的I2C总线构成硬件管理专用网络,实时传递系统硬件的状态信息。

   专用的转换卡和信息采集卡进行采集数据收集和汇总。

   DCMM系统监控软件(Dawning Cluster Monitor Management System)可监控机柜系统环境、每节点硬件配置情况、每节点直流电压、各部件温度、风扇转速等硬件状态、系统CPU、内存、网络使用情况等。

   使用柱状图或数据报表输出系统硬件信息和软硬件实时运行状态。可指定节点,也可以图形方式对各节点的单项数据进行对比。

   可以设置报警域值,系统异常时,进行报警,避免或减少系统故障的损失。

   可以通过Modem远程拨号(Windows系统)或Telnet远程登录(LINUX系统)进行监控和管理。

   2、高性能图形工作站(可选)

   高效完成气象图形的观测、分析、显示、输出等工作。

   3、专用绘图仪等(可选)

   高效完成气象图形的绘制、输出等工作。