决策支持技术在电子政务中的应用
来源:现代图书情报技术杂志 更新时间:2014-07-27

——以大社保领域为例
 

作者简介:

  【作者简介】金莹 邓三鸿 李勇 南京大学信息管理系(南京210093)

  【提要】不同的电子政务系统需要特定的决策支持系统,本文以大社保领域为例,介绍了电子政务系统引入决策支持技术的必要性,详细讨论了社会保障决策支持系统的内容和目标,同时还阐述了决策支持技术在大社保领域的应用研究中需要解决的关键性问题。本文从实际应用的角度出发,给出了一个较为完整的社会保障的决策支持系统的解决方案。

  【关 键 词】决策支持/社会保障/数据仓库/电子政务

  1 引言

  关于决策支持在电子政务中的应用,有关学者针对某些政府部门建立了相关的模型,在部分发达地区也已有了一些应用尝试,但这些尝试和模型大多是从政府部门所有管理和服务进行考虑的,带有一定普遍性,实际各政府部门可能由于涉及的数据源不同、政务目标不同,其决策方法和过程也不尽系统,为此,我们需要针对具体的政府业务或部门来考虑其辅助决策过程。

  现在所指的社会保障体系主要是“大社保”:包括了五保合一(医疗保险、养老保险、工伤保险、生育保险、失业保险)、劳动业务(包括劳动机关、规划工资、职业鉴定培训等)、人力资源(即劳动力市场、下岗再就业等),涉及劳动、地税、财政、统计、医疗等十多个社会保障相关部门。大社保领域的政府职能涉及面广,能体现政府工作的基本特征,本文将以大社保领域为例子,研究决策支持技术在电子政务中的应用方法。

  2 大社保领域应用决策支持技术的意义

  2.1大社保领域决策支持系统特殊性

  大社保领域决策支持系统是架构在数据仓库技术上的应用系统,它的建设和大社保业务系统相比有以下特殊性:

  (1)决策支持系统必须针对特定大社保系统的具体需求而设计定制,由具有专业经验的人员共同开发和实施。决策支持系统是对社会保障系统经营过程的记载,完整的决策支持系统应包括与大社保系统运作有关的所有因素,而且,随着大社保系统的发展,需求会产生变化,决策支持也必须随之更新,因此,在决策支持系统实施过程中,根据大社保系统的需求,整理出一系列主题,然后根据其重要程度分多个项目实施。

  (2)决策支持系统和数据仓库是面向主题的。一个大型的决策支持系统往往不是一次性建造而成的,对大社保系统项目来说,范围较大,问题较多,需要通过应用的逐步演进来实现。因而,应该从小范围的需求着手,每次针对业务最需要解决的一两个主题,即建立面向主题的决策支持系统。但是,在决策支持系统建设初期,应该做一个整体的规划,建立支持全局的框架结构,采用积木式构造方法开发决策支持系统。

  (3)决策支持系统必须具有灵活性。提供灵活的结构,能适应不断变化的政策和用户需求,能适应各种不同的用户群体的要求。

  2.2应用支持模型对我国社会保障工作的意义

  利用基于知识系统的工程理论、方法和技术,研究贯穿大社保系统决策过程的信息组织、整合、知识发现和决策支持,开展对大社保系统知识资源进行全方位收集、处理、分析和决策的决策支持模型将会对我国社会保障工作产生如下意义:

  (1)准确了解我国社会保障工作信息资源的现状。通过掌握我国社会保障工作信息资源的状况,为社会保障系统更好地管理自己的知识资源,进一步提升社会保障部门的知识含量打下良好的基础;

  (2)有效管理社会保障系统信息资源。通过对社会保障系统产生的信息收集、处理、分析和知识管理、知识发现,将使社会保障系统的信息资源由不可用变成可用,由低可用状态变成高可用状态,从而提高社会保障系统信息资源管理水平,最终提高整个社会保障部门的管理水平;

  (3)精确控制社会保障部门的决策过程。通过决策支持模型,将静态的社会保障知识与动态的社会保障决策结合起来,从而可以精确控制社会保障部门的决策过程,保证决策的科学性、合理性和有效性;

  (4)逐步提升社会保障系统的知识含量。通过社会保障知识资源的管理,积累大量社会保障知识,为社会保障工作人员提供学习知识、自我提升的条件。通过社会保障知识资源的管理,强化社会保障部门的信息意识,从而逐步提高社会保障部门的知识含量。

  因此,在社保领域引入决策支持技术将从社会保障系统信息资源管理角度出发,提升社会保障系统决策水平,并将信息资源管理上升到知识资源管理的高度,从而把社会保障部门建成知识型组织。

  3 决策支持技术在大社保领域的研究内容与目标

  决策支持技术在大社保领域应用是一项涉及信息技术、网络技术、决策支持技术以及知识管理、信息管理、经济学、决策学等多学科、多领域的综合性课题。本文的研究思路是立足于通过运用知识管理和知识发现的相关理论和方法将社会保障信息资源转变为知识资源,为电子政务中社会保障系统提供决策咨询、支持和参考。

  3.1大社保领域应用决策支持技术研究内容

  (1)社会保障数据资源采集

  即研究如何采集社会保障数据资源,构筑社会保障数据资源的采集模型,使社会保障数据资源便于组织、处理及知识发现。首先,我们需要分析社会保障数据的分布、分类和特征;其次针对社会保障数据资源的属性,明确获取这些数据的方法和途径;最后构建社会保障数据资源采集模型。社会保障数据资源采集模型主要解决两个问题:第一,采集的目标,即社会保障数据资源采集模型应该采集哪些类型的数据。社会保障系统拥有海量的数据资源,对这些海量的数据资源进行采集、整理和存储应该遵循为社会保障决策服务的准则;第二,采集方式,即使用何种手段采集数据。主要研究对不同数据源的采集方法,如文献资源、数据库资源、网络资源等。

  (2)社会保障数据资源的组织与处理

  所采集来的社会保障数据资源并不能直接被运用到社会保障决策中,必须进行整合。整合的手段是组织与处理,其目的是把杂乱的数据分门别类,使之便于从中发现有助于行政决策的知识。因此,该部分的研究主要是解决对社会保障数据的分类(数据类型分类和数据内容分类)、标识(特征标识和内容标识)以及结构化的组织社会保障数据资源,使之便于检索、统计、分析和知识发现。另一方面,研究具有实用价值的、满足社会保障系统需求的,构架合理的、适应电子政务中社会保障系统决策要求的社会保障知识仓库。该研究内容的关键问题有两个:第一,研究适应于社会保障数据资源的自动化处理技术;第二,社会保障数据的组织模式。该研究应借助信息组织理论、运用信息管理的方法,根据社会保障数据资源的特点,探讨适应于社会保障数据组织的模式。

  (3)社会保障业务数据指标体系

  对大社保系统的各项管理经营业务中产生的数据,分别在各个子系统里进行统计分析,然后对各个业务系统设置各项数量、质量方面的指标,对其进行统计分析、指标监控、相关因素分析等。同时将各个系统中的重要指标,以及一些新增的相关指标对应的统计分析的结果以各种图表的方式展现出来,以辅助社会保障部门的决策。

  (4)社会保障决策的知识发现研究

  从社会保障信息中获取决策知识最有效的手段是通过知识挖掘。知识挖掘可以有多种方法。方法之一就是对信息进行精简、提取。利用逻辑方法抽取“有用”的、能改变决策者对某一问题看法的内容,然后按照一定的规则,如知识工程中的知识表示方法,对抽取出来的内容加以描述,形成知识单元集合。方法之二就是知识发现(KDD),即利用成熟先进的计算机技术和工具来帮助挖掘数据中蕴藏的财富,并加以提炼,使之成为有用的知识。

  (5)社会保障决策支持模型研究

  静态、孤立的知识并不能指导决策,必须用相关的方法寻求知识间的内在联系及未来动向而形成动态知识系统,即,将最合适的社会保障知识提供给最恰当的社会保障决策者,方便其做出最合理的决策。该研究内容为:借助知识管理、数据仓库、系统工程、情报分析等技术,构筑社会保障决策支持模型。利用该模型将社会保障知识挖掘得到的知识进行处理,形成针对特定决策的知识,为社会保障决策提供支持方案。通过社会保障决策支持模型,社会保障部门在决策时可以了解决策所需要的知识或者知识的来源、决策的可选方案和最佳的决策执行者等。

  以上各个研究内容相辅相成,构成一个系统的整体。

  3.2大社保领域应用决策支持技术研究目标

  决策支持系统作为一种新兴的信息技术,能够提供各种管理决策信息以及量化解决方案,从而减轻了管理者从事低层次信息处理和分析的负担,使得他们专注于最需要决策智慧和经验的工作,因此提高了决策的质量和效率。大社保领域引入决策技术的目的就是要构建实现基于数据仓库的决策支持系统。

  (1)基于数据仓库的决策支持系统技术架构

  基于数据仓库的决策支持系统是以数据仓库技术为基础,以联机分析处理和数据挖掘工具为手段进行实施的一整套决策解决方案。

  一般决策所需的数据总是与一些维数(每一维代表对数据的一个特定的观察视角,如地区、时间等)和不同级别(如部门、单位、地区和国家)的统计和分析有关。以多维数据为核心的多维数据分析是决策的主要内容,数据仓库的多维特征满足决策系统对数据的分析要求,并且克服了传统数据库的数据组织性差、利用率低的缺点。

  基于数据仓库的决策支持系统包括实施数据仓库的几大部件:负责采集、清洗和转换不同来源数据的数据转换服务部件、负责存储和处理明细数据的关系数据引擎以及负责存储和处理汇总数据的多维数据引擎。数据仓库解决方案具有投资少、见效快、易使用、易管理、可扩展的特点,可以提供社会保障系统所需要的数据统计和分析。

  基于数据仓库的决策支持系统可以为用户提供更高层次的知识挖掘、旋转和钻取,数据结果采用报表、图表等直观的方式展示,为决策分析提供科学的支持,实现企业知识管理的最高境界。

  (2)系统总体描述

  基于数据仓库的决策支持系统首先从多个数据来源(不同类型、不同格式,如EXCEL、FoxPro、SQL Server或者ORACLE)的数据进行获取、过滤、转换、加载,最后根据国家电子政务标准要求,以统一的格式和表达方式存储在数据仓库中。数据一经收集,应长期保存,以支持对历史数据的访问。数据仓库提供给用户一个统一的数据接口,使得所有查询和展示更为简洁容易。同时,再对数据仓库中的数据进行统计、分析、建立模型等步骤,将数据转换为智能决策和管理的知识,并保证了业务系统不会受到影响。

  (3)基于数据仓库的决策支持系统逻辑框架

  基于数据仓库的决策支持系统共包含7大部分:数据源管理、数据抽取、数据存储、统计分析、数据挖掘、数据展示、系统管理。系统的逻辑框架如图1:

  

  图1 基于数据仓库的决策支持系统的逻辑框架

  数据源管理:社会保障系统中各业务系统的不统一造成业务数据的类型、格式不统一。要进行智能决策,不仅需要全面整理系统内部数据,包括历史数据,而且需要收集一些外界情报数据,以及由统计局等相关部门发布的相关信息和数据。决策支持系统将这些外部数据和系统内部数据结合起来,提供更正确、可靠、全面的智能决策服务。

  数据抽取:决策支持系统为众多数据格式提供了直接、透明的接口,可以直接访问多种平台和多种操作系统下几乎所有形式的数据,可以从杂乱的数据文件、复杂的层次结构文件中抽取数据。

  决策支持系统提供多种灵活的数据处理工具,用于向系统输入新的数据。比如数据分类、取子集、取交集、连接及排序等。用户可以将采自不同数据库的数据抽取合并在一起。

  数据存储:智能决策所用到的数据量非常大,通常达到GB级、TB级,甚至更高。决策支持系统中的大量数据并不是以关系型的数据结构存储在数据仓库中,因为数据仓库的数据存储和管理,不能用传统的RDBMS(关系型数据库管理系统)来完成和实现。

  统计分析:决策支持系统统计分析功能包括:方差分析及一般线性模型(包括滑动平均模型、线性回归模型、混合模型等)、多变量分析(主成分分析、因子分析和典型相关等)、判别分析、聚类分析等过程,可适应各种不同模型和不同特点数据的需要。例如回归分析方面除通用的回归方法外,还有Logistic回归、非线性回归等。可处理的数据有实型数据、有序数据和属性数据,并能产生各种有用的统计量和诊断信息。

  数据挖掘:决策支持系统预计采用多种数据挖掘工具,如多种形式的分类与聚类工具,对数据集进行聚类、建立决策树,是近来数据处理和进行决策支持的常用方法。经过剪枝运算后,系统最后得到的决策树即是一个实用的分类决策树。同样利用关联规则可以发现各业务系统数据中隐含的有趣模式,这些隐含知识是有利于业务决策的。

  数据展示:决策支持系统将分析得到的结果,以各种直观的图形及曲线呈现。数据分析使数据对分析人员具有了意义,而直观的呈现又帮助分析人员将信息传递给其他人员。格式化或表格化报告、频率图、日程表以及字符串等基本的数据呈现可以随时生成,以用于现场决策。

  系统管理:对多维的数据仓库进行管理,按照社会保障的决策需求的变化对其进行修改和维护,为整个决策支持系统服务。

  4 决策支持技术在大社保领域的应用研究需要解决的关键问题

  由于社会保障管理系统的复杂性,社会保障信息资源的获取、组织与处理,以及基于这些信息的决策支持系统构建都面临一些急需解决的关键问题。

  (1)社会保障信息资源的分析与研究。主要研究社会保障知识资源的分布和构成,分析各类知识资源的作用与特点等。由于社会保障政策会随着社会、经济、文化等多方面发展而时常发生转移,社会保障部门所需的决策信息也在不断发生变化,这就需要我们准确掌握社会保障信息资源的特点,把握社会保障信息的动态性,科学有效地管理社会保障信息与知识资源。

  (2)社会保障信息资源获取方法研究。主要研究如何自动、高效、及时、全面和准确地收集社会保障所需决策信息和知识。社会保障知识资源获取方法研究将涉及到知识的抓取、知识集成及其元数据表达等较为前沿的研究课题。

  (3)社会保障信息资源的处理研究。针对不同社会保障知识资源,探索并实现适用的自动抓取技术,主题析出技术、信息聚类分类技术、自动浓缩技术、情报辨伪技术。通过社会保障知识资源的处理研究,为电子政务中社会保障决策的制定提供准确、全面的知识保障。

  (4)社会保障决策支持模型研究。主要研究如何通过社会保障知识仓库,开展社会保障知服务,并进行科学有效的社会保障决策。换而言之,就是如伺将静态的知识与动态的决策结合在一起,增强决策的科学能力。

  5 社会保障决策支持系统的解决方案

  社会保障决策支持系统的解决方案是:通过对社会保障信息资源的充分调研,分析资源类型,构筑信息资源的采集模型,研究社会保障信息的组织与处理方法,进行社会保障决策的知识发现研究,最后构建社会保障决策支持模型。具体内容如下:

  (1)分析社会保障信息资源。分析现有的社会保障知识资源的现状,社会保障知识的类型、特征等。为采集信息做准备。

  (2)建立数据采集模型。根据社会保障信息资源特征,研究社会保障知识资源的构成、分布、属性,针对不同类型的信息资源研究出相应的开发方法和技术。

  (3)社会保障外部信息资源调研。采用政府调研和网络调查相结合的方式进行信息收集。政府调研注重社会保障工作中的政策分析和信息流分析;网上调研采取主题搜索的方法;通过大型数据库、电子出版物、大众传媒载体调查分析出有助于社会保障决策的信息。

  (4)社会保障信息组织处理。设计社会保障信息的组织结构,将成熟的信息自动处理技术运用到社会保障信息处理中,研制出适合于社会保障信息资源管理的信息处理技术。

  (5)决策知识发现。研究从社会保障信息中发现有助于行政决策的知识,从认知科学的角度,探讨隐性知识与显性知识相互转化的规律,优化隐性知识收集的手段,提高显性知识传播的效率;利用人工智能理论,建立适用于社会保障知识资源的专用的识别、处理、传播的技术;构造对知识资源配置进行评价的数学模型,促进社会保障知识资源的合理配置。

  (6)构建社会保障决策辅助模型。以问题聚类和问题关联为线索,搜寻社会保障知识间的关联、知识与问题的关联,给出有助于决策的有关知识框架。

  6 结束语

  虽然我国开展社会保障体系起步较晚,但发展迅速,已经取得初步的成效。为了更好地对社会保障基金进行动态监控和分析,必须引入科学的决策支持技术,在大社保领域建立科学的基于数据仓库的大社保决策支持系统。该系统的建立将有利于社保业务数据库信息抽取、挖掘和整理,实现各类信息的统计分析、规范社保业务、提高工作效率以及保障社保基金的安全。

  【参考文献】

  [1]Efrem G.Mallach.决策支持与数据仓库系统.北京:电子工业出版社,2001

  [2]Jiawei Han.数据挖掘概念与技术.北京:机械工业出版社,2001

  [3]Paul Gray,Hugh J.Watson著,陈朔鹰等译.数据仓库中的决策支持.北京:北京理工大学出版社,2001

  [4]曹加恒,舒风笛,张凯等.基于多媒体数据库的数据挖掘系统原型.武汉大学学报(自然科学版).2000,46(5):567-570

  [5]陈靖,李增智,王云岚等.面向电子政务的决策支持系统设计与实现.空军工程大学学报(自然科学版),2003(2):62-66

  [6]韩家炜,孟小峰,王静等.Web挖掘研究.计算机研究与发展,2001,38(4):405-414

  [7]刘同明.数据挖掘技术及其应用.北京:国防工业出版社,2001

  [8]苏新宁,杨建林,邓三鸿等.数据挖掘理论与技术.北京:科学技术文献出版社,2003

  [9]王珊.数据仓库技术与联机分析处理.北京:科学出版社,1999

  [10]熊肖华,姚建初.基于模糊集的数据挖掘研究与应用.计算机工程与应用,2002,1:203-205

  [11]杨炳儒.知识工程与知识发现.北京:冶金工业出版社,2000