网格:更多的资源共享
来源:网络传播 更新时间:2012-04-15

  如同所有事物的成长过程都要经过不断的进化一样,互联网也在前进的道路上一步步修正自己的不足。就功能方面来说,第一代互联网的典型应用是收发电子邮件、发布文字新闻及言论、传输文件等。第二代互联网在保有第一代功能的基础上使用了超文本和多媒体技术,前者可以将分布在网上的文件采用链接的方式联系在一起,而后者则使人们能够欣赏到内容丰富的图片、音乐、影像等内容。

第一、二代互联网有着严重的弱点:一是有限的地址空间。由于他们使用的都是IPv4协议,因此其32位的地址空间只有大约40亿个,目前已经显示出了"供应"不足的趋势。而且由于缺乏早期的合理规化,已有地址的分配上出现了"贫富差距"明显的现象,信息宏沟越来越大。二是网上信息过于庞杂,缺乏规范和整理,给网民的信息使用带来极大不便。举个简单的例子,我们都到图书馆去借阅过书籍。因为每本书都事先根据一定的规则贴上了检索号,而且由专门的管理人员将其整齐地码放在书架上,所以我们可以在一排排书籍中迅速找到自己需要的那一本。但是现在的互联网却如同完全无人打理的图书馆一样。我们如果需要借书,就只能在一堆堆书里一本本的去"排查"了。这样所造成的结果就是时间的极大浪费。

  新一代互联网的发展必然要以克服这两个缺点为目标。为了更好地管理网上的资源,网格技术应运而生。

  什么是网格

  最早对"网格"一词进行描述的是全球网格研究的领军人物、美国Globus项目的领导人伊安·福斯特(Ian Foster)。他在1998年出版的《网格:21世纪信息技术基础设施的蓝图》一书中写到"网格是构筑在互联网上的一组新兴技术,它将高速互联网、高性能计算机、大型数据库、传感器、远程设备等容为一体,为科技人员和普通老百姓提供更多的资源、功能和交互性。互联网主要为人们提供电子邮件、网页浏览等通信功能,而网格功能则更多更强,让人们透明的使用计算、存储等其他资源。"在这一描述的基础上,2002年7月,他又在《什么是网格?判断是否网格的三个标准》一文中补充到,网格必须满足三个标准:在非集中控制的环境中协同使用资源;使用标准的、开放的和通用的协议和接口;提供非平凡的服务。

  应该说,伊安·福斯特(Ian Foster)只是把他头脑中所认为的网格概念描述了出来,而目前业界对网格的定义仍存在着极大争议。但是,不管我们如何去定义网格,这一技术的最终目的都是不会改变的,即利用互联网,把分散于世界各地的电脑组合成一个协同运作的"电脑巨人",突破以往互联网提供的计算机硬件及网页连通的有限功能,实现计算资源、存储资源、数据资源、信息资源、软件资源、专家资源等所有资源的全面连通与共享。

  对于网格与宽带网络的区别,清华大学李三立院士做出过这样的比较:"将先进计算基础设施(即网格)与 http://www.yesky.com/key/122/15122.html 信息高速公路(宽带网络)相比较,可以说,信息高速公路是信息传输和获取的信息基础设施;而先进计算基础设施则是信息处理的信息基础设施。虽然,http://www.yesky.com/key/2297/82297.html 国内外都有不断把信息高速公路扩充频带宽度、改进路由器性能的计划;但是,国外科学家认为:真正的下一代信息基础设施是先进计算基础设施。它将使以计算机为主体的信息处理发生根本性的变化。"

  网格的体系结构

  通过网格,我们可以将整个互联网联接成一台巨型计算机,但是这台计算机由哪些部分构成,这些部分之间是如何协调从而实现运转的呢? 要想消除这些疑问,我们就有必要了解网格的体系结构。

  网格的体系结构给出了网格的基本组成与功能,描述了网格各组成部分的关系以及他们集成的方式或方法,刻画了支持网格有效运转的机制。网格体系结构有五种形式:五层沙漏结构、组件结构、计算池结构、CPU结构、神经网络结构及开放网格体系结构(OGSA)。而目前为止最为重要的是五层沙漏结构和开放式网格服务体系结构。

  我们在前文中提到,伊安·福斯特(Ian Foster)认为网格必须满足三个标准:在非集中控制的环境中协同使用资源;使用标准的、开放的和通用的协议和接口;提供非平凡的服务。五层沙漏结构即是面向协议的网格体系,而OGSA(Open Grid Services Architecture)则是面向服务。

  五层沙漏结构

  这一结构是基于美国国家实验室的网格研发项目Globus提出来的,它强调协议在网格的资源共享和操作中的地位,通过协议可以使得虚拟组织的用户与资源之间进行协商,达成资源共享的目的。该结构的五层由下到上依次为构造层、连接层、资源层、汇聚层和应用层。(见图1)

  构造层(Fabric):这一层是指可以用来共享的各种网格资源,包含的内容极为广泛,既包括计算机、传感器等硬件,也包括数据库存储资源等软件。这一层所提供的功能越丰富,上层所能构造的应用功能就越复杂。

  连接层(Connectivity):对网格中网络事务的核心通信协议和安全协议的定义在这一层完成。通信协议用于各种资源的认证,安全协议用于识别用户和资源,为建立用户和资源之间的信任关系提供技术支持。因此连接层是为整个网络系统即全局服务的一层。

  资源层(Resource):该层只关心单个的资源,定义了在单独资源上提供共享操作的协议,以便于其实现调用构造层的功能访问和控制本地资源。这一层包含信息协议和管理协议两个协议。

  汇聚层(Collective):将资源层提供的所有资源聚集在一起,供虚拟组织的应用程序共享。这也是一个对所有资源进行宏观调控的一层,不负责单个资源的管理,而是对全局的状态和跨域的交互行为进行控制。

  应用层(Application):用户利用下层提供的资源实现某些特定功能。

  这五层中的每一层均建立在它下面任意一层所提供的能力和行为之上。其中资源与连接层协议是最核心的部分,它连通上下四层,起到的是不同语言功能的转换和互通的作用。

  开放式网格服务体系结构(OGSA)

  2005年6月,全球网格论坛(Global Grid Forum,GGF )工作小组制定了OGSA(Open Grid Services Architecture)即开放式网格服务体系结构。它将网格关键技术和Web Service服务机制集成起来,面向网格服务而创建一种分布系统框架。它的出现标志着网格的使用范围从以科学计算研究为主扩展到了商业计算领域。

  在服务体系结构中,所有的服务都是用Globus Toolkit(网格技术的一种)建立的,这就解决了网格体系中两个重要的问题:标准服务接口的定义和协议的识别。简单来说,就是通过几次转换,实现了不同计算机语言的互融,消除了交流障碍。其结构体系如下图所示:

  物理和逻辑资源层:物理资源是指构成网格能力的资源,主要包括一些硬件设施,如处理器、存储器、服务器。逻辑资源位于物理资源之上,它们一同通过虚拟化和聚合物理层的资源来提供额外的功能。

  Web服务层:OGSA的一个重要原则就是将所有的网络资源都建模成为服务。OGSI(Open Grid Services Infrastructure开放网格服务基础结构)对网格服务做出了规范定义,并将其建立在标准Web服务技术之上,扩展了Web服务的定义,提供了动态的、有状态的和可管理的Web服务能力。

  基于OGSA架构的网格服务层:可分为四个部分:网格核心服务、网格程序执行服务、网格数据服务、特定领域的服务。

  网格应用程序层:随着时代的进步,基于网格架构的新的服务将会不断出现,基于网格架构的服务的新网格应用程序也会涌现出来。

  在这样的架构层次上,OGSA以如下的方式进行着工作:首先由服务提供者向虚拟组织注册,虚拟组织负责维护这些注册表。用户就在虚拟组织提供的表中查找服务提供者,在得到服务句柄后找到满足要求的服务提供者;用户根据自己的需要向服务商发送实例请求,服务商据此创建服务实例;服务实例以"用户"身份执行,得到返回结果后,存放在特定的位置,用户可以从那里取走结果。

  现阶段网格技术的应用

  网格的服务功能目前主要包括分布式超级计算、分布式仪器系统、数据密集型计算、信息集成和远程沉浸等。目前来看,这些不同的功能被逐渐使用在电子政务、科学研究、信息处理及娱乐等方面。

  电子政务:这里所说的电子政务并不是我们现阶段所理解由政府网站发布政府公告、利用网络传递信息那么简单,而是指利用网格及其它相关技术,对政府工作的运行方式进行有效改造。电子政务主要由四部分组成:政府间的电子政务(Government to Government,即G2G),如电子公文流转、电子司法档案共享、财政管理等;政府与企业间的电子政务(Government to Business,即G2B),包括电子采购与招标、电子证照办理、信息资源服务等;政府与居民间的电子政务(Government to Critizens,即G2C),如社会保险网络服务、交通管理服务、居民电子税务等;提高政府内部效率和有效性(InternalEfficiencynd Effectiveness,即IEE),指政府利用住处技术实现内部电子化管理,如电子化人事管理、档案管理,后勤事务管理等。

  科学研究:随着科学技术的发展,进行科学研究所要运行的数据分析、计算变得日益复杂,仅仅依靠有限的科研资源已经无法完成,网格的分布式超级计算,数据密集型计算等功能得以发挥巨大作用,异地资源的共享使得复杂的科研过程得以以最快的速度进行。较有代表性的应用如我国目前的新药研发网格、航空制造网格。

  新药研发的核心之一是从大量的化合物样品库中发现有药理活性的化合物,利用网格技术,通过对加入研发应用的计算机资源的合理配置与使用,可以缩短这一发现时间。目前,运用药物研发的网格应用软件已经推出。

  航空制造网格是通过利用网格技术使得大量的软件资源整合共享,降低研究成本,同时支持同一型号机型的异地设计制造。

  信息处理:这一部分最具代表性的应用是电子商务。在网格技术产生前,电子商务就是指利用互联网进行商务活动的一种方式。而现在,电子商务的发展已经进入了一个新的阶段。企业再也没有必要为了去进行复杂的成本核算而花费巨资去购买只供一时之需的昂贵的IT设备。他们只需要利用网格技术的强大信息处理功能就可以将企业的各种应用系统加以集成,创建一个单一的系统,并最终实现跨企业、行业的虚拟共享,和不同的组织交换数据,最终改变其曾经的"信息孤岛"的地位。

  娱乐:网格在此方面的应用与网格的远程沉浸功能密切相关。远程沉浸是一种特殊的网络化虚拟现实环境,可以是对历史或现实环境的逼真再现,还可以是对计算结果及数据库的可视化,甚至可以就是一个完全虚拟的空间。在这种环境中,人不必亲临其地就可以有一种身临其境的感觉。比如我国敦煌莫高窟的壁画就曾于1998年初数字化为远程沉浸环境,既保护了真品,又使得人们可以体会到与接触真品一样的心理享受。

  目前,我国的许多网络游戏开发商也投入巨资进行网格研发,以便于为游戏玩家创造更逼真的游戏环境,实现可以容纳更多人同时参与的更大型的网络游戏。

  作为网络的第三次热潮,网格技术虽然还没有展现最大的魅力,但是其将要创造的辉煌未来却是我们无法否认的。