中国教育科研网格ChinaGrid计划,是教育部在"十五"211工程公共服务体系中设立的重大专项,目标是在2010年通过网格连结211工程的100所重点高校,实现100所高校在中国教育科研网格上各类资源的互联互通和共享,成为中国乃至世界上最大、最先进、最实用的教育科研网格。日前,曙光公司为重庆大学成功部署了教育网格节点,搭建了教育科研网格体系中的西南节点,为教育科研网格的西南布局打开了良好的开端。并且,曙光公司与重庆大学结成战略合作关系,联合共建高性能计算机实验室,将产品应用与产业人才培养紧密结合。
立足实际,战略合作
网格计算是伴随着互联网而迅速发展起来的,专门针对复杂科学计算的新型计算模式。通俗的说,这种计算模式就是通过网络连接地理上分布的各类高性能计算机、数据库和存储设备等闲散资源,对其进行统一调配,让其为同一目标而工作。要实现对网络闲散资源的统一调配,必须实现分布式资源、网格软件平台和网格应用这三个层面的部署。
分布式资源是整个网格计算的基本载体,由分布在网络上的各类资源组成,包括各种硬件设备和软件资源。它们可以是异构的,也可以运行在不同的操作系统下,网络是对他们进行统一调配、互通的桥梁。网络软件平台处于分布式资源和网格应用之间。一方面,该平台起到综合集成网格中各种资源的作用,提供用户对资源的透明使用;另一方面,网格软件平台还提供了一些支持各种类型应用的常用工具,让基于网格的应用开发变得更加容易。网格应用也就是在网格软件平台上所能提供的各种功能和服务。目前,网格应用领域主要有四类:分布式超级计算、分布式仪器系统、数据密集型计算和远程沉浸。此外,网格的信息集成也是一个重要的应用领域。
一个成功的网格系统可整合用户系统内的各类软、硬件资源,为用户提供优异的计算平台,提高用户的资源利用率。同时,用户还可通过网格系统实现与网络中其他用户的资源互配。这样的系统平台,对科研项目繁复,信息化资源配置零散的高校教育系统来说尤其有益。
重庆大学为解决自身科研项目对高性能计算的需求,和奠定其在中国教育网格系统西南节点的枢纽地位,联合国内服务器厂商中的领军企业曙光公司,结成战略合作关系,共建高性能计算联合实验室。曙光公司采用曙光4000A高性能计算机机群系统,同时配有高性能的存储系统和软件操作系统,为重庆大学成功搭建了性能优异的网格系统。
高端产品,优势网格
曙光公司为重庆大学构建的网格计算平台整体峰值计算能力达到每秒5500亿次,其中包括机群服务器、SMP计算机、外存储系统、视频服务器,和外存储系统等硬件设备。为了避免单点故障,I/O节点采用双机高可用架构,同时系统还配备了丰富的网格系统软件和各种应用软件。
作为拥有众多理工学科的综合性大学,重庆大学不可避免的要利用网格系统做大量的图象处理、流体力学计算、生物信息运算等大规模科学计算。这也对网格系统的计算能力提出了极高的要求。曙光公司在整个网格系统中的28个计算节点,和2个兼任管理节点和登录节点功能的存储节点中,配备了具有极高稳定性和超强处理能力的2U曙光天阔机架式服务器A620r-E。各节点拥有两个AMD64 Opteron处理器,其先进的架构体系和Hyper-Transport技术具有访问内存带宽高、延迟低、能力强的优势,在多处理器系统上体现了近乎线性的性能加速比。网格平台中的高性能节点机奠定了整个系统高可用性的基础。