计算资源管理技术变革
来源:e-works. 更新时间:2012-12-28

 
--泛云科技联合创始人兼副总经理龚炜在2012中国制造业产品创新数字化国际峰会的发言

 
2012年11月22日至23日,以“数字化技术驱动产品创新”为主题的“2012(第八届)中国制造业产品创新数字化国际峰会”在深圳宝利来国际大酒店隆重召开。在22日下午的“虚拟仿真在产品创新中的应用”分论坛上,泛云科技联合创始人兼副总经理龚炜发表了《计算资源管理技术变革》的主题演讲,以下文字整理自他在会上的发言。
130010001070677517_new.jpg (493×364)
  
泛云科技联合创始人兼副总经理 龚炜
1 先进制造业信息中心
    CAE研发工程师经常抱怨计算资源不够用、许可证不够多、电脑CPU不够快、内存不够大,就像戴着镣铐在跳舞。于是,企业的管理者引进各种各样高性能计算集群建设方案,但是高性能计算集群项目投入运营之后,很快大家会发现计算资源的动态优化配置、后期数据安全、资源与流程的耦合等问题接踵而至,如果不能有效解决这些问题,那么高性能计算集群将会给企业带来一连串的噩梦。
    很多企业计算集群关停并转,研发人员抱怨计算集群的服务能力差劲,其实所有问题的根源就在于最初建立高性能计算集群时的目标设定存在问题。大多数高性能计算集群仍然停留在专家系统层面,没有进入企业IT部门的主要业务领域,整个IT部门和研发部门的交流沟通脱节。对于企业来说高性能计算集群不应该只是专家系统,而是先进制造业信息中心的一个重要组成部分。
    先进制造业信息中心分为数据中心和计算中心两部分。数据中心的业务以数据处理为核心,以数据库为载体,主要覆盖企业办公协同、流程管理等业务。现阶段数据中心的业务比较成熟的,大多已然形成稳定可靠的企业级数据中心。
点击图片查看大图

    现代信息中心业务范畴
    计算中心承载着CAD、CAE等研发设计资源,以计算能力为核心。其载体也就是应用软件非常多样化,并且数据格式难以统一,主要覆盖研发过程中非常重要的三维建模、数值仿真等业务。计算中心与数据中心相比存在非常大的业务差异性,管理手段的成熟度也存在巨大差距。计算中心如果能够有效的承担管理计算业务资源的职责并与数据中心紧密协作,就可以成功的构建企业信息化体系的双核引擎,共同驱动企业研发创新。
2 计算中心的三大核心能力
    经过对制造业常用设计研发软件的分析归纳,可以总结出未来计算中心必须具备三大核心能力——高性能计算、高清图形交互、高效能存储。130010001243697413_new.jpg (527×385)

    未来计算中心
    高性能计算是计算中心建设的重点课题,大多数企业的计算中心建设第一期任务都是建立包括服务器集群、高速网络、作业调度软件、应用软件组在内的一系列的基础性的计算资源。但是往往忽视了高性能计算能力的管理架构和服务门户的设计,从而导致高性能计算平台在易用性、可扩展性、易维护性等方面存在严重问题,直接影响了计算中心的服务表现,并制约了他的可持续化发展。
    高清的图形处理能力是计算中心建立的一个新课题,图形处理设备现在长期在企业中处于分散的状态,并直接导致了研发数据碎片化生存,难以保障研发数据的安全监管以及版本控制问题。新一代的计算中心应该集中监管高清图形设备,同时允许用户通过安全认证机制远程的访问交互类的应用软件,用户可以获得高清、流畅的本地化体验。高清图形处理能力的集中化管理技术体现了IT部门对研发业务安全规则的积极相应,也是计算中心基础架构发展的必然趋势。
    海量数据存储能力是计算中心建设过程中不可避免的一个课题,计算资源的集中化必然导致我们数据的集中化存储,而存储系统的性能、容量、架构将直接影响计算中心的服务表现。研发数据的生命周期直接受制于研发项目周期,因此在原生的存储系统中传统的时间戳或者配额制等存储管理机制必然无法适应计算中心的数据管理需求,发展一个高性能、多层次、智能化的海量数据存储能力以及相关的接口技术可以将计算中心的资源作为数据生产服务组件,整合融入整体研发流程管理体系。

3 SimCloud仿真云计算平台
    只有具备高性能计算、高清图形交互、高效能存储这三大能力的计算中心才是企业真正需要真正好用的计算中心。泛云科技自主研发的SimCloud仿真云计算平台就是为新一代的计算中心而设计的一个系统级的管理软件。
    SimCloud仿真云计算平台架构
    SimCloud仿真云计算平台门户是计算中心的服务表现层,它的功能实现主要依靠了Cloud.Framework这个中间件。Cloud.Framework整合了相关的集群计算、虚拟应用、存储控制、服务流程、统计分析、安全监管等子模块。整个中间件采用统一用户身份认证,并且为第三方用户认证提供了接口。在这个架构中通过中间件这一层预留了API接口,为后期接入一些企业大的流程管理引擎做了充分的基础准备。
130010001439588618_new.jpg (430×371)

    SimCloud仿真云计算平台架构
    SimCloud集群计算模块架构
    SimCloud集群计算模块并非像其它作业调度软件一样使用同一种调度工具来驱动不同的调度系统,它针对Windows和Linux操作系统的不同特性分别选用了不同的集群管理工具,并且可以兼容绝大多数主流的作业调度软件。SimCloud在集群管理的上层重点研发了企业级的计算资源管理高级调度以及管理策略,这些策略主要是基于软件的许可证管理。
130010001622619086_new.jpg (549×400)

    SimCloud集群计算模块架构
    SimCloud虚拟应用模块的架构
    SimCloud创新的定义了一整套虚拟应用的控制接口,在这个接口的定义下可以实现Citrix XenDesktop、惠普的RGS和VNC等桌面虚拟化技术。通过评测发现XenDesktop 的HDX 3D技术结合NVIDIA的GPU技术比较符合制造业三维高清交互的应用需求,所以我们的研发重心主要集中这个技术的接口实现上。
130010001778117980_new.jpg (557×407)

    SimCloud虚拟应用模块架构
    SimCloud Ver3.0的最新发展动态:
    ●支持Windows/Linux混合架构HPC集群
    ●多集群、互信友群等场景下的统一作业调度/监控
    ●扩展软件许可证管理机制
    ●兼容支持动漫渲染应用
    ●发展管理员角色配置机制
    ●优化虚拟应用预约管理机制
4 计算资源管理软件市场的发展
    回顾计算资源管理软件市场的发展,我们可以梳理出一条非常清晰的脉络:
    1)在计算资源管理1.0阶段,出现了一批高性能计算调度软件,如LSF、PBS、Maui等,主要是为专家学者进行服务;
    2)在计算资源管理2.0阶段,市场要求高性能计算普及化,于是出现了Platform Application Center,PBS Portal等产品,SimCloud V1也是在这一阶段进入这个市场的;
    3)随着用户对数据安全、应用集成等多方面的要求提升,计算资源管理3.0时代到来了,SimCloud仿真云计算平台V2/V3就是融合了高性能计算、虚拟应用管理以及用户自服务流程的新一代计算资源管理软件;
    当然,创新还在继续,未来是怎样呢?或者说SimCloud将向哪个方向发展呢?我可以给大家透露一下,那就是将SimCloud耦合接入企业研发大流程,形成一个更加完善的计算资源服务组件。
    泛云科技自创立以来,得到了许多大型企业和科研机构的帮助与扶持,SimCloud产品的创新是与他们分不开的,因此我们需要特别致谢上海汽车集团技术中心,国家核电上海核工程研究设计院,国核电力规划设计研究院,中船重工第七〇一研究所,中国电子第十二研究所,浙江水利河口研究院,中石化上海石油化工研究院,微软云计算平台开发部,中科院软件所并行计算实验室,希望我们的共同努力可以让计算资源管理软件市场茁壮成长,同时也欢迎更多的企业单位加入我们的合作。
    本文根据泛云科技联合创始人兼副总经理龚炜在“2012中国制造业产品创新数字化国际峰会”上的发言录音整理,已经本人确认!