电子政务四大基础数据库融合设计研究
来源:学术研究杂志 更新时间:2018-11-07

1 引言

2002年7月,国家信息化领导小组办公室制定了《我国电子政务一期工程建设方案》,该方案确定了“十五”期间重点建设的四大基础性、战略性资源数据库,首次明确建设人口、法人单位、自然资源和空间地理、宏观经济四大基础信息数据库,以加强政务资源的整合、共享与交换,提高电子政务建设水平,避免重复建设。近年来,随着电子政务建设与应用的全面展开,各省、市、地区都陆续开展了四大基础数据库建设工作,相关成果已经广泛服务于政府、部门和社会公众,取得了较好的社会、经济效益。

四大数据库是一个有机联系的整体,全面表达了从自然到社会的整个人类活动,是各级政府部门在管理社会事务和经济发展过程中产生的最基础的政务信息资源。但是,由于当前四大基础数据库的建设是由不同的牵头单位单独建设,受进度、技术、环境、体制等因素影响,现有四大基础数据库的服务还仅限于四大基础数据库本身的领域,暂时未能实现库之间的融合集成,无法进行库与库之间的数据挖掘,信息应用深度和广度有限,无法满足政府领导多角度的决策需求和各业务部门复杂应用需求,主要表现在:

1.1 服务模式还相对单一,服务能力相对薄弱

目前,人口库、法人库、宏观库的主要服务模式主要包括传统的数据分发模式和应用系统查询模式,这两种模式信息均存在一定的局限性:数据分发服务模式需要向用户提供实体数据,存在数据版本过多、无法更新联动、信息整合困难、安全保密隐患等诸多数据问题,容易造成信息孤岛;应用系统查询模式能够满足用户的一些程式化的应用需求,使用方式较为单一,用户无法根据业务需求进行扩充,无法满足自定义扩展的应用需求。

1.2 资源提供比较单一、信息综合集成度较差

由于四大基础数据库是由不同单位单独承建,其现有的服务基本处于单向应用阶段,未能实现数据库之间的信息综合查询,信息综合集成度差:比如无法获取法人所对应的自然人的健康、教育等相关信息,也无法通过某个人的信息获取其关联的社会、经济的相关信息等等。

1.3 信息挖掘不够深入,空间特性应用不足

目前对四大基础数据库信息的使用还仅仅是从自身的维度上开展工作,对信息的挖掘深度不够,未能实现对信息之间特别是与地理信息的信息挖掘和分析:比如无法实现专题信息的空间定位,无法实现专题信息的空间分析和决策分析。因此,迫切需要开展四大基础数据库融合工作,实现人口数据、法人数据、地理空间数据和宏观经济数据的集成分析和协同服务,扩大政务基础信息应用的广度和深度,满足政府领导多角度的决策需求和行业部门综合信息应用需求。

针对上述需求,本文提出了基础信息资源融合的思路,并在此基础上,以四大基础数据库为例,设计了四大基础数据库融合模型,并从融合的应用模式、服务方式、访问控制等方面开展深入研究。

2 基础信息资源融合思路

世界上75%到80%的信息都与地理信息有关,地理信息作为所有信息的空间定位基础,是信息整合的关键。为此,基础信息资源的数据融合可以以地理信息为基础和纽带,建立一个包含所有基础信息资源的“数据中心”,以实现各类信息的关联和集成。

2.1 数据存储模式

基础资源信息融合需要实现各类基础数据的集中管理和分析,可以采取物理集中和逻辑集中两种存储模式。其中,物理集中是将全部数据集中放在一起,其优点是数据访问方便、访问效率高,缺点是对数据库压力大,涉及各部门的利益,现有业务整合困难;逻辑集中通过相关的元数据、目录,实现一个全局的逻辑视图,建立一个虚拟的“数据中心”,通过统一的一个平台实现分布式数据的互联互通,其优点是对原有业务影响小,不影响各部门的原有业务,缺点是对各节点的标准化程度高,系统的访问效率收到网络传输能力的限制。根据现有基础信息资源的管理现状,宜采用“物理分布、逻辑集中”的构建模式。

2.2 数据存储内容

数据存储内容方面,“数据中心”应存储各类基础数据资源的元数据、目录以及数据之间的映射关系,通过这些信息,将物理分散的数据逻辑集中在一起,以构建基础信息资源的目录体系,并基于一个统一的全局视图对外提供。

2.3 现有数据改造

按照“物理分布、逻辑集中”的构建模式,需要开展各基础信息库的标准化改造工作。各基础信息库应按照统一的标准,扩展、开发形成一系列WebService接口,包括数据获取、数据同步、权限控制等,以支撑模型的构建。

此外,为支撑模型的应用需求,实现基础资源的管理、关联、集成和同步,需要构建一套数据融合工具集,实现从数据关联、数据配置、数据扩充、数据同步、服务分配等一系列可视化的管理和分配[5]。按照上述理论,制定基础信息资源的融合模型如图1所示:

在上图中,通过提供一套数据融合工具集,基于地理信息的空间定位基础,建立一个虚拟的“数据中心”,通过数据的元数据、目录及数据之间的映射关系,基于SOA的服务模式,集成各类信息资源的服务,实现各类基础信息资源的融合和协同服务。

3 四大基础数据库融合设计

人口、法人、宏观经济、地理作为政务信息中最基础、最重要的信息资源,其信息之间的融合是基础信息资源融合的核心,本部分以前面构建的融合模型为基础,结合人口库、法人库、宏观经济库的建设特点和应用现状,开展四大基础数据库的融合设计和构建。

3.1融合模型建立

首先,四大基础数据库融合需要建立一个融合库(数据中心),存储用于支撑融合的相关数据,融合库中需要存储以下信息资源:

1)元数据和目录数据

存储人口、法人、宏观经济的相关元数据和目录数据,以便实现统一管理和服务。

2)基础库的“主键”数据和映射关系

融合库应当存储人口库、法人库、宏观经济库中的“主键”数据,如包含居民身份证的人口基本数据项、包含组织机构代码的法人基本项,为实现信息的关联奠定基础;此外,应当存储不同库相关数据之间的映射关系,如地理库与人口库行政区划编码的关系,地理库与法人库地名地址的关系等。

3)其他数据

针对融合应用需求,融合库中还需要存储一系列预先设计好的统计信息,如统计信息,人口离散化信息等。其次,为了实现数据融合,需要四大基础数据库牵头部门在现有四大基础数据库的基础上,按照统一标准、统一控制的要求,扩展、开发形成一系列WebService接口,实现基础数据到融合数据的提取、统计和同步。结合人口库、法人库、宏观经济库和地理库的特点,四大基础数据库关联关系构建思路如图2所示:

在上图中,人口库提供了包括自然特征、家庭特征,地理特征、社会特征和经济特征相关信息,通过其地理特征(行政区划编码),可以实现与地理库的关联,通过经济特征(组织机构代码),可以实现与法人库的集成,此外,通过人口数据的离散化操作,可以获取人口数据的空间分布规律;法人库中包括了基本信息、注册登记信息、组织机构代码信息和税务信息,通过地理特征(行政区划编码),可以实现法人数据的空间化,通过人口身份信息,可以获得人口的基本信息;宏观经济库作为各类宏观信息的统计汇总,一方面由人口、法人的统计信息汇总而来,另一方面,可以通过行政区划编码实现与地理空间的挂接。最终,通过以地理库的地理信息数据为依托,以各基础数据库的相关关键属性为纽带,实现四大基础数据库之间的数据交叉融合和集成应用。

3.2 应用模式设计

应用模式方面,四大基础数据库融合不是对原有四大基础数据库角色和功能的取代和替换,而是通过融合,对四大基础数据库各自服务能力进行补充和完善,同时,实现四大基础数据库信息之间的协同服务分析,丰富、扩展四大基础数据库应用的广度和深度,使得信息的利用最大化。四大基础数据库的应用模式如图3所示:

一方面,四大基础数据库各自原有的服务模式不变,包括四大基础数据库的库体结构不变、功能模块不变以及应用场景不变,各基础数据库依然沿用以前的方式对外提供服务;同时,根据四大基础数据库融合的需求,通过对四大基础库进行更新和改造,反过来还能提升四大基础数据库本身的服务水平。

另一方面,通过开展四大基础数据库融合工作,基于“一张图”信息资源整合模式,通过数据标准化、地理匹配、关联映射等操作,实现各类信息的地理化,基于融合服务引擎对外提供一套四大基础数据库融合服务,能够极大地提升四大基础数据库应用的广度和深度,满足政府领导、行业部门对政务综合信息服务的应用需求。

3.3 服务方式设计

四大基础数据库融合的最终应用群体为政府领导和相关行业部门。为了满足用户多层次、多角度的应用需求,四大基础数据库融合提供门户网站和应用接口两种服务方式。

1)门户网站服务模式

各级用户可使用浏览器通过网络直接访问四大基础数据库融合的门户网站,通过网络在线的方式在线应用各种服务和功能。用户通过门户网站,能够方便了解四大基础数据库融合的各类成果和服务,能够查看各类融合专题图,能够实现四大基础数据库信息的综合查询及基于地理空间的四大基础数据库综合信息辅助分析,满足用户对四大基础数据库综合信息的浏览、查询和辅助分析需求。

2)应用接口服务模式

应用接口服务模式提供一系列符合规范的WebService接口,包括信息查询、统计图表展示和目录等接口。用户可基于这些接口,根据需求进行灵活开发,实现综合信息查询、空间辅助分析等个性化功能。

3.4访问控制设计

由于四大基础数据库的数据具有保密特性,因此,应该建立一套完整的信息安全体系,保证数据的安全性。

根据四大基础数据库融合的融合模型,用户的服务响应涉及融合层和基础层两层的响应,为此,四大基础数据库融合采取融合层和基础数据层两级访问控制模型,以确保数据的安全性:其中,融合层的控制侧重于对服务的控制,通过对用户身份进行认证,实现服务层次的转发和拒绝;基础数据层的控制侧重于对数据的控制,实现数据表、数据字段和数据内容的访问控制;两级控制应以基础层的控制为主,融合层的控制为辅。四大基础数据库融合的访问控制模型如图4所示:

在上图中,通过两级访问控制模型,用户访问经过两层过滤和分级控制,最终获取有权限的数据:首先,在融合层,通过对用户的身份进行认证,判断其是否具有访问某服务的权限,如果没有则直接拒绝,如果有的话则将服务请求分配到指定的基础数据层;然后,在基础层,通过对用户的身份验证,确定用户能访问的表、字段和内容,并将合适的数据返回给融合层,统一对外提供给用户,确保特定用户能访问特定的信息。

4 结束语

政务信息化建设的最终目的不是以行业为单位完成内部信息整合,而是全部政务信息的融合和应用,最终提高政务信息资源的利用率,最大限度地实现资源共享和业务协同。本文紧密结合政务信息资源综合应用的需求,在顾及四大基础数据库原有服务模式的基础上,提出了四大基础数据库信息融合的思路和模型,开展了数据融合模型、应用模式、服务方式等关键技术的研究。这种思路可以不局限于当前的四大基础数据库,而且可以扩展到整个政务信息资源的大融合。后续将在上述逻辑设计的基础上跟踪开展政务信息融合的研究与原型实现,为真正实现政务信息融合提供支持。

参考文献:略