区域性电子政务信息资源目录体系实现研究
来源:中国电子政务网 更新时间:2014-07-27

 一、导言
    政府信息资源是一切产生于政府内部或虽然产生于政府外部但对政府活动有影响的信息资源的统称。由于政府总以某种方式与人们的工作和生活的每一方面直接或间接相联系,因此,政府信息资源的总量常常多得惊人,甚至达到无法计数的地步。据统计,目前各级政府部门大约集聚了全社会信息资源总量的80%。这些信息资源常常比一般的信息资源更有价值,其质量和可信度也较高,并且直接关系到国民经济与社会发展的状况和水平。如何加强管理、综合开发和有效利用这些资源已经成为各级政府工作的当务之急,也是一个值得研究和探讨的新领域。
    二、研究现状
    ⒈国外政府信息资源定位服务由于元数据能够处理各种形式的信息,包括数字化及非数字化的信息,特别是能较好地解决网络信息的发现、控制和管理问题,因此,目前在国际上已广泛应用在包括政府信息、博物馆藏品、档案等各种类型的信息中。目前政府信息的元数据格式主要有两种:政府信息指引服务(Government I Locater Service,GILS)及都柏林核心元 数据集(Dublin Core,DC)。其中依照GIL 发展指引服务的国家较多,包括美国、 加拿大、日本、俄罗斯等;以Dublin 为构建系统标准的有澳大利亚。在系统 规格方面,主要遵循Z39.50(信息检索 应用服务定义和协议规范,1996年被 ISO正式确定为信息检索的国际标准) 的信息检索标准,可跨资料库、跨机构 组织,甚至跨国界,以单一检索界面检 索所需的政府信息资源,使政府信息资 源的共享朝着全球一体化的方向发展。 美国等发达国家从20世纪70-80年 代就开始研究和出台了一系列管理政策,对政府信息资源进行管理。为了整合政府的公共信息资源,为公众提供单一窗口的政府信息导航、检索与定位服务,1994年12月,美国商务部将政府信息定位服务GILS计划作为联邦政府信息处理标准(FIPS 192)颁发,公布正式建立GILS政府信息定位服务。此公告要求所有政府机构必须实行GILS检索系统的使用。美国将GILS作为政府信息基础设施的核心组成部分进行建设。
    ⒉我国政务信息资源目录体系建设
为充分发挥信息资源开发利用在信息化建设中的重要作用,《中共中央办公厅国务院办公厅关于加强信息资源开发利用工作的若干意见》(中办发[2004Core34号)、《国家信息化领导小组关于我国电子政务建设指导意见》(中办发[200217号)两个文件中都明确提出了建设政务信息资源目录体系的任务。为贯彻文件精神,加快政务信息资源开发利用建设,解决政府部门间信息资源的查询和共享,促进跨行业、跨部门、跨地区的互连互通,国务院信息化工作办公室组织相关部门编写了政务信息资源目录体系标准。国家电子政务标准化总体组于2004年11月组建了政务信息资源目录体系与交换体系标准编写组,积极开展该标准编写工作,并广泛、认真地征求专家、部委、地方各方面的意见和建议,对该标准予以反复修改,最终形成了政务信息资源目录体系与交换体系》标准征求意见稿。国家标准委2005年8月正式批准成立了政务信息资源目录体系与交换体系标准工作组,并于9月底召开了该工作组会议,通过了该标准的征求意见稿。
《政务信息资源目录体系与交换体系》中将政务信息资源目录体系定为:采集、存储、使用和管理政务信资源目录内容,通过元数据信息的定
和发现,实现政务信息资源共享的统。从实践意义上看,建设政务信息源目录体系,就是要对部门间政务信资源进行梳理和整合,进行分级、分点、分布式的组织和管理。它体现了种政务资源的内在关联,是信息资源享和服务的一套工具;是方便信息资检索、定位和共享的应用服务体系。
    三、关键技术研究
    ⒈元数据抽取技术
  政务信息资源目录体系中元数据式,将遵循国家《政务信息资源目录系》标准中的核心元数据标准。元数抽取技术是指从Web页面等格式化态的政务信息资源中,依照某一元数标准,自动生产元数据的技术。元数抽取基于采集系统和存储系统实现,原理如图1所示。数据目录的统一逻辑视图2
    
    ⑴采集系统
    采集系统针对一个专题,分以下步进行数据采集:
    ——利用搜索引擎,对设定的专进行泛搜索,确定探索的范围;
    ——利用网络蜘蛛,在确定的探索范围内进行泛探索,探寻可能有价值站点
    ——对有价值的信息源进行监视,定时捕获更新的内容;
    ——数据清洗,对捕获的内容进行清洗,只保留关注的有价值的信息。

       ⑵存储系统
    存储系统把捕获的Web页面分解为元数据,并对其分类保存。在这里,存储的概念不仅是把数据放到数据库或者保存到硬盘上,更重要的是根据一定的目录体系标准,把数据分解为元数据,然后进行存储。
    ⒉元数据管理技术
    政务信息资源目录体系中元数据的管理包括元数据的命名、发布和访问,并为用户提供统一的访问接口。目录体系中的所有元数据构成元数据目录。在元数据目录中,采用统一的结构来描述元数据,并提供访问API(Applicat Programming Interface,应用程序接口),通过API可以插入、更新、删除、查询目录中的数据。它为元数据目录提供统一的逻辑视图,实际的元数据目录可以是多个异构的、分布式的副本的目录。
    《政务信息资源目录体系》标准中对于元数据的命名规则、编码方式以及目录接口API等技术要求都有明确描述,在实现中只要严格遵循这些描述即可。
    ⒊目录服务技术
    在现实应用中,目录服务被赋予两种范围的含义。其一是较为含混的:任何一个提供分布的用户命名管理的系统 服务都被冠以目录服务的名称。例如Email系统中的用户帐号管理系统,NTDomain管理系统等。另一个较为严格:目录服务被定义成基于X.500系列建议的基于分布网络信息处理的、有层次结构的目标管理体系。例如,Novell公司的Novell目录服务(NDS),基于LDAP(Lightweight Directory ACC轻量级目录访问协议)的Internet目录访问服务,等等。目前,人们基本采用后者的定义来判断一种服务是否为目录服务。
    目录服务提供元数据目录的统一逻辑视图,实现单一系统映像。在实际应用中,元数据目录可以采用分布式存储,每个管理域可以设置一个元数据目录。政务信息资源目录体系的所有服务都使用元数据目录中存储的信息,并通过目录服务协议访问元数据。应用程序的其它服务在使用元数据信息时,通过元目录服务协议访问元数据。各服务之间需要通过软件进行相互协同。异构形式的网络应用,如Email、数据库服务、
Internet/Intranet访问等,采用同构的目录服务。多种应用共享一套资源信息,避免了管理上的重复操作和多系统间的不协调,提高了应用系统的身份验证安全等级,降低了管理的复杂度,也方便了用户的使用(参见图2)。

信息资源目录体系框架图3
    基于LDAP实现的政务信息资源目录体系,可顺利地访问所有授权的网络资源。具有能在单台服务器或全球多服务器网络上管理所有网络资源的强大功能,是一种跨平台、跨地域的目录服务,且在不同的服务器上只需登录一次,就可享受到政务信息资源目录体系的服务。
    四、系统设计实现
     ⒈体系框架
    政务信息资源目录体系框架由信息库系统、标准规范、技术支撑平台、管理机制和服务模式构成。目录体系建设和使用过程中存在三类角色:信息提供者、信息使用者和目录信息管理者,信息提供者确保编目信息的正确性和实时性,信息管理者负责目录信息的管理、安全、服务(参见图3)。目录中心平台系统图4
  

    ⒉系统架构
    目录体系分为国家目录中心、省级目录中心、地市目录中心和县级目录中心四级。目录中心是独立或托管的平台系统(参见图4)。在国家目录中心建立一个统一的全国各目录中心网络地址表,各级目录中心能够获得全国各地的目录中心网络地址,实现各级目录中心跨地区的目录中心访问。各目录中心为同级各部门建立固定的目录区域。各部门需要进行一次确定身份的登录注册。每个部门负责维护目录中心的各自的部门资源服务目录及资源目录。
⒊技术架构
    政务信息资源目录体系从技术架构角度划分为四个系统:编目系统、目录报送系统、目录管理系统和目录服务系统,如图5所示。技术架构系统图5
    ⑴编目系统
    基于核心元数据标准开发的元数据生成工具,从不同形态的政务信息资源中,抽取出元数据,生成目录。其主要功能如下:
    ——元数据生成:针对已有目录,采用转换方式生成元数据;针对网页、数据库、电子文件,采用自动抽取的方式生成元数据;针对其他资源,也可利用手工方式进行元数据录入。
    ——资源编码:使用资源编码的前段码并赋予后段码,生成资源ID。
    ——资源分类:对政务资源进行分类,以自动为主,以手工为辅。
    ⑵目录报送系统
    政务信息资源目录体系利用电子政务专网实现元数据报送。数据报送系统的功能主要将各部门前置机的元数据报送到所对应的目录服务中心。
    ⑶目录管理系统
    目录管理系统包括数据互访平台、元数据管理平台和系统管理平台。通过各平台实现对目录数据服务的集中管理。它们各自的主要功能如下:
    ——数据互访平台:构筑一个抽象层的数据服务平台,构筑逻辑上集中,物理上分散的虚拟数据库,并按照标准来对外提供目录数据发布和目录数据注册服务。
    ——元数据管理平台:用于管理元数据的注册、更新、删除,并担负元数据有效性检查的工作。
    ——系统管理平台:提供了数据库系统和接口组件服务器的配置,数据的备份、迁移、认证,用户管理等功能,是提高系统运行可靠性和提高系统可维护性的关键。
    ⑷目录服务系统
    发布系统通过发布与查询服务器将元数据按照多种分类方式发布到政务目录中心网站,供使用者进行浏览、查询。发布方式依据资源分类标准,在Web页面展现数据,并以多种查询方式向用户提供目录服务。
    五、结束语
    政务信息资源目录体系建设是一项长期、细致、复杂的工作,同时是信息时代一项崭新的课题,其涉及的范围广、部门多。因此在其具体建设实施时必须遵循国家制定的相关标准和规范,将不同种类信息资源进行统一描述,并根据应用需求建立各种目录分类方法,为存放分散、种类繁多的政务信息资源提供检索和导航服务。政务信息资源目录体系的逐渐完善,必将促进对政务信息资源的进一步开发和利用。