本文分析了当前科研单位信息化建设中存在的问题和困难,提出了云计算在科研信息化建设中的应用模式,介绍了云计算数据中心的服务和优势特点,并阐述了云环境下科研单位应当注意和协调的几个问题。
一、科研信息化建设存在的问题
1、信息化建设经费需求加大
随着科研单位信息化建设的不断深入,特别是集成化较高的科研信息平台推广之后,对科研单位的硬件设备和技术力量提出了更高的要求,需要花费大量的人力、物力。并且随着IT产业的快速发展和日新月异,软硬件更新换代速度加快,在未来信息化建设过程中甚至有可能产生硬件系统刚建成,使用不久就面临淘汰的尴尬局面,使得科研信息化建设的经费需求越来越大。
2、数字化资源利用率不高
目前,科研单位的专网建设工作已基本完成,不少单位的网络带宽达到干兆,但由于各单位之间的专网未进行充分互联,信息资源共建共享程度相对较低,使得科研成果、学术资源在数字化后也得不到充分的交流使用,“信息孤岛”问题未能有效解决。
3、服务系统计算能力不均衡
由于各单位的数据处理都在本地完成,但各种服务器的配置却不一定完全满足要求,就造成了服务系统计算能力的不均衡。数据处理量较大的服务系统容易出现计算瓶颈,为解决计算瓶颈的问题需要不断升级硬件设备,从而产生新的建设费用,而数据处理量较小的服务系统硬件资源却大量闲置。
4、信息安全保密问题日益突出
由于硬件建设资金不到位造成的“一机多用”,非职责权限范围内的检索、浏览、发布等行为,为信息安全保密工作带来了新的难题。单位职工利用瓦联网查询资料,虽然提高了工作效率,有时却不能正确处理互联网和科研专网之间的信息交换,从而造成失泄密事件。
二、云计算在科研信息化建设中的应用模式
云计算(Cloud Computing)是网格计算(Grid Computing)、分布式计算(Distributed Computing)、并行计算(Parallel Comput—in异)、效用计算(Utility Computing)、网络存储(Network StorageTechnologies)、虚拟化(Virtualization)、负载均衡(Load Balance)等传统计算机技术和网络技术发展融合的产物,是针对企事业单位或个人用户对数据处理能力的要求不断提高的趋势而出现的。目前学术界对云计算的定义还没有达到共识,但基本上都理解为利用计算服务器集群构建大规模的数据中心,并通过_耳:联网或其它大型网络将计算资源以按需分配的方式提供给用户。云计算的应用包含这样一种思想,把服务器的计算力量整合起来,再重新分配给用户使用。
1、科研单位开展云计算具备的基础条件
经过了多年的信息化建设,我国科研单位已经建立起各自的科研专网和相配套的信息中心,积累了丰富的科研信息化建设和管理的经验。在一些大型科研单位,一方面由于应用需求大,另一方面拥有充足的人力、物力资源,其信息中心的规模更是基本达到数据中心级别。为实现资源的有效共享和充分利用,科研单位应在专网广泛联接的基础上,整合下属各科研实体的计算资源,依托信息中心实现云计算,构建集数据资源存储、计算资源分配、数据安全保障于一体的云计算数据中心。
2、云计算数据中心的外部网络环境和内部体系架构
云计算数据中心将作为科研单位广域网的基础节点之一。
科研单位将下属科研实体的信息中心统一整合至云计算数据中心,下属科研实体将不再设置二级信息中心,只保留少量存储服务器。
图1科研广域网中的云计算数据中心
云计算数据中心的底层是数茸庞大的服务器,各种服务器使用当前主流的操作系统,通过网络和各类控制器将服务器连接起来组成底层机群系统,成为云计算数据中心的物理硬件核心部分。计算虚拟化、负载均衡器平衡底层服务器的计算能力,为科研人员动态调配计算资源;存储虚拟化、云分布式文件系统为科研人员提供跨服务器级的文件存储服务,当某一服务器的存储系统满载,数据将自动向其它服务器的存储系统迁移,达到存储资源的高利用性。应用层通过各种应用系统为科研人员服务,当科研人员访问云计算数据中心时,可以选择自己需要的应用系统登录,数据中心底层的计算和存储细节都是科研人员无法看到的。
图2云计算数据中心内部体系框架图
3、云计算数据中心的服务内容
(1)虚拟存储服务
在云计算虚拟存储系统中,为了实现对存储资源的高利用,虚拟存储系统的文件数据分块及副本备份策略管理层往往将文件切割为若干个数据块,这些数据块存储在云存储系统的不同位置上,相关的存储信息会存入该文件的叶子节点。当科研人员在云计算数据中心的应用平台上读取一个文件时,读取任务首先搜索到该文件的叶子节点,叶子节点存储着该文件数据块的具体存储位置和存储方式,类似于目录。根据叶子节点的存储信息,存储任务会与存储数据块的各个服务器连接,将数据块重组为文件返回给用户读取。
(2)虚拟计算服务
当科研人员在云计算数据中心的应用平台上提交计算请求时,系统首先获得计算任务,计算任务在叶子节点上读取数据块存储信息,连接数据块的存储服务器,在不重组文件的基础上,就在数据库存储服务器上启动计算工作,各个数据块存储服务器将计算结果汇总至应用平台的服务器,生成最后的结果呈现给用户。
图3文件读写和计算任务的流程图
(3)数据安全服务
文件数据分块及副本备份策略管理层在将文件分割为数据块后,会在不同的存储服务器上保存数据块,并将每个数据块的副本做跨服务器级的备份,当一台服务器损坏时,系统会自动访问其它服务器上的数据块或副本数据块,以保证数据的安全性。
图4云计算的数据安全保障:文件数据分块及副本备份策略
(4)基于用户权限的分层隔离服务
当云计算数据中心向科研人员提供虚拟存储和虚拟计算服务时,面对着各种不同级别的用户,有科研人员个人级、有科研项目级、有科研单位级的用户。不同级别的用户访问的权限不同,不能出现数据存储和计算的交叉。云计算采用单向指针分层用户隔离法,将用户能够访问的“层”和用户权限对映起来,上层节点的用户可以获得下层节点的指针,而下层节点的用户不允许反向访问上层节点,同层节点未经授权也不能相互访问,这样有效保证了不同权限的用户之间的数据隔离。
所有的用户访问节点都是文件夹性质,它不会具体存储文件的数据块,只存储下一级节点的单向指针,用户在进行文件访问时都从自己权限所在节点开始,顺着单向指针直到叶子节点才能获得文件的存储信息。
图5云计算的单向指针分层用户隔离法
三、云计算在科研信息化建设中的优势作用
1、云计算降低了科研信息化建设中巨大的硬件成本
对于科研单位来说,无论是科研生产还是日常办公都需要一笔巨大的开支来购置硬件设备。现代信息技术的快速发展致使硬件设备更新换代周期越来越短,科研单位信息平台建设对硬件系统的计算能力要求越来越高,就需要不断补充新的硬件设备,硬件没备采购成了没有尽头的无底洞。不仅如此,随着硬件设备的增多,从事硬件系统管理维护的职工数量也需要相应增加,给各单位的人员编制带来一定压力。云计算的优点在于解放了硬件配置对计算能力的限制,科研实体可以使用云计算数据中心分配的存储和计算资源,本单位不必采购高配置的硬件设备,以后也不需要关注设备的更新换代,对硬件设备的投入将大大降低。
2、云计算提高了IT基础设施共享水平
据了解,不少科研单位在信息化建设中由于未能制定有效的统一规划和长远目标,造成了重复建设严重、资源独立分散以及信息系统平台难以无缝对接等问题的产生。这些问题造成了科研单位之间、下属实体之间的信息不能有效共享,严重影响了业务工作基于网络开展,信息化建设的作用没有得到有效体现。而云计算对基础设施进行了统一的配置管理,把运算器、存储器、信息系统平台等资源整合在一起,形成一个统一的资源池,并根据负载需要来分配资源,实现负载均衡,资源通过网络可以方便的为科研人员提供服务。这种集中管理、平衡资源的方式将有效消除IT资源独立分散造成的资源紧张、资源闲置、资源浪费,使IT基础设施得到充分利用。
3、云计算为科研单位提供了安全的数据存储服务
计算机病毒和木马是科研工作中的阴影,个人电脑、服务器等设备中存储的数据常常都有损坏、消失或被窃取的威胁。在科研单位中,由于更新数据、拷贝外来资料等工作,机房往往成为公认的病毒集散地,导致病毒、木马在内部网络广泛传播,极易感染科研人员个人计算机,对重要数据造成损失。云计算数据中心提供的虚拟存储服务,使科研人员不再需要将重要数据存储在本地,凭借身份认证方式可以随时进入数据中心存取重要数据,这样既不用担心自己的存储设备损坏导致数据消失,也不用担心病毒木马入侵将数据破坏或窃取,数据安全工作将由云计算的文件数据分块及副本备份策略来保障,科研人员可以更加专注于科研工作。而基于用户权限的分层隔离服务可以避免科研数据被没有权限的用户访问到,增加了数据的安全保障。
4、云计算改善了应用软件的使用方式
科研机构的个人电脑和服务器都必须安装大量的应用软件才能满足工作需要,这样就造成了硬件设备的使用负担,导致系统使用效率的低下,少数应用软件还互相不兼容,给科研人员带来困扰。更有甚者,随着应用软件更新速度的加快,软件对硬件的要求不断增高,原有的计算机也不得不面临被淘汰的命运,这样的应用软件使用方式越来越不适应科研生产的需要。云计算能够为用户提供在线使用应用软件的功能,也可以将部分应用软件安装在云端,不再需要费时费力的为所有计算机安装所有需要使用的软件,减轻了终端计算机的压力。而软件版本的更新和授权问题也可以统统交给云计算数据中心来提供技术支持。
5、云计算促进了学术资源的共建共享
随着信息化建设的深入,科研单位的学术资源数量日益庞大,增长速度快,形式多样化。各种异构数据库为资源的共建共享带来不便。而当前科研单位的学术资源共建共享工作由于缺乏统一的政策文件、流程规范、牵头机构来抓总,使自主学术资源共建共享工作的开展得不到有效保障,共建共享常常成为空洞的口号。云计算数据中心作为科研单位的海量资源集散地和专业数据处理中心,可以根据单位要求开展资源整合工作,将异构数据库与一站式的检索界面结合起来,通过对自主学术资源、引进资源进行全面整合,为科研人员提供统一的服务平台,实现一站式服务。
四、云计算环境下应当注意的几个问题
1、数据安全问题
对科研人员而言,在享受云计算带来了的便利的同时,也不可避免对云计算环境的数据安全问题产生怀疑,即云计算数据中心的技术条件能否保证我的重要数据完好保存、数据中心的工作人员会否将我的涉密数据窃取泄露的问题。为解决科研人员对数据安全问题的疑惑,数据中心一方面需要从技术上保障数据安全,有专业的技术人员对数据进行统一管理、全面监控;另一方面需要制定完善相关规章制度,明确涉密数据的管理责任;此外,要对访问数据中心的用户进行强身份认证,保证该用户不能访问权限之外的信息。
2、资源共建共享的标准问题
在资源共建共享的工作中,各科研实体应与数据中心共同研究通过协议,认真探讨资源建设的版权、资源共享的权限等问题,虽然云计算可以提供基于用户权限的分层隔离服务,但哪类资源可以无条件共享,哪类资源需要对哪类用户设置相应的访问权限,都需要资源提供方制定可行的标准和方案。
3、计费模式的问题
云计算数据中心将购置庞大的服务器集群来提供给用户使用,存储资源和计算资源又采用按需分配的方式,需要花费大量经费和精力来建设维护,基础架构成本高,因此要考虑收费问题。由于各科研实体对资源的需求肯定存在一定差异,数据中心可以根据各科研实体对存储资源和计算资源的使用情况,结合科研实体能够提供的共享资源数据量,在综合考虑的情况下制定出合理的收费标准。
五、结论
云计算在当前还是一个新兴的、革命性的概念。它能使用户从个人计算机或小型服务器系统的存储和计算局限中解放出来,使人们从传统的以个人桌面系统为中心的应用模式走向以网络虚拟存储计算服务为中心的应用模式。在这种模式里,用户可以像使用水电气一样使用IT资源,也可以像在银行存取钱一样存取自己的数据。这种模式可以使性能比较差的计算机或服务器发挥出最大化的功能,科研单位建设云计算的数据中心来开展存储计算服务工作,将提升科研信息化建设的速度和水平。