国家“十二五”规划纲要提出,要加快建设宽带、融合、安全、泛在的下一代国家信息基础设施,推动信息化和工业化深度融合,推进经济社会各领域信息化。
经济社会各领域信息化的应用系统,是经济社会各领域信息化建设的主体,是信息化和工业化融合的具体体现,应予以充分的重视。
我们总结前三个五年经济社会各领域信息化的应用系统建设经验,最重要的一点,就是要在“十二五”期间,加强应用系统、尤其是大型应用系统的总体设计。
1、应用系统总体设计的意义
经济社会各领域信息化建设中,普遍存在的“信息孤岛”、“信息烟囱”是怎样形成的?这是大家都共同认识到的——各部门按自身业务需要建立应用系统,数据自采自用,缺乏统一规划和标准,才形成的“信息孤岛”;上级部门(国家部委、大型企业集团)向下推广应用系统,缺乏统一规划和标准,才形成许多纵强横弱的“信息烟囱”。“信息孤岛”和“信息烟囱”是“孪生姊妹”,纵强横弱讲的就是上面推广下来的系统在本地用,大多是孤岛,其危害是人所共知的——因为信息资源不能共享,就不支持跨部门、跨地区的业务协同,信息化综合效益得不到发挥。
钱学森著《论系统工程》对总体设计的意义是这样论述的:
在制造一部复杂的机器设备时,如果它的一个个局部构件彼此不协调,相互连不起来,那么,即使这些构件的设计和制造从局部看是很先进的,但这部机器的总体性能还是不合格的。因此必须有个“总设计师”来“抓总”,协调设计工作。
总体设计部由熟悉系统各方面专业知识的技术人员组成,并由知识面比较宽广的专家负责领导。总体设计部设计的是系统的“总体”,是系统的“总体方案”,是实现整个系统的“技术途径”。总体设计部一般不承担具体部件的设计,却是整个系统研制工作中必不可少的技术抓总单位。
经济社会各领域信息化应用系统的总体设计,就是要提出应用系统的总体方案,用以指导、控制和协调新建应用系统的集成化开发和已建应用系统的整合,是避免分散开发、各自为战、浪费资源和重复投资等问题的根本保障。
以市级“金财工程”为例,应用系统总体设计要解决“三平台”和“三整合”的总体方案问题(图1)。其中,下面的物理平台建设都有一定的基础(有的相当先进),但由于网络资源的多样性,还需要针对财政业务的实际需要,进行整合优化;上面的应用平台的问题较多,即存在一些“信息孤岛”需要整合;问题最大的是中间的数据平台,由于分散开发或引进应用软件,造成冗余、低质量、甚至矛盾的数据堆积,必须通过统一数据标准、建立数据中心来解决。可见,总体方案所涉及的复杂的系统工程问题,只有搞好总体设计才能解决。
图1 市级“金财工程”总体设计方案要解决“三平台”、“三整合”问题
2、应用系统总体设计的理论指导
产生“信息孤岛”的认识根源是什么?经过多年的研究,得出了大家认同的结论:人们总是以为通过“接口”能解决分散应用系统的自动互联问题;而N个分散的、数据标准不统一的应用模块,要实现自动化互联互通,至少需要N×(N-1)≈N2个数据接口。目前,很多电子政务和企业信息化的应用系统开发情况表明,存在十几个孤立应用系统是很平常的。一项典型调查发现,一家企业15年来共开发、引进10个分散的应用系统,而数据标准不统一的模块共有71个,那么,要通过数据接口实现全部互联互通,就至少需要71×70=4970个接口。这是无论如何也做不完、跟不上分散应用增长的“接口难题”。
信息工程方法论(IEM)提出的解决这一难题的思路和办法是,统一数据标准,共建共用“主题数据库”,就会从根本上取消接口,实现应用系统集成;而规划设计主题数据库的前提和过程,就是做总体数据规划。我们从1986年开始学习引进这套理论方法,经过不断的消化、吸收创新,到1998年发展为信息资源规划。信息资源规划(IRP)是指,某业务域内信息资源的采集、处理、传输、利用的全面规划,是侧重数据流分析、为实现信息资源共享、消除“信息孤岛”的总体规划。主题数据库(SDB)的基本特征是:面向业务主题建库(不是面向业务报表建库);数据共建共用(不是数据自建自用);数据一次一处采集(不是多次多处采集)。信息工程方法论强调,在信息资源规划的基础上,实现数据环境重建(DER),是因为长期以来低质量的数据和无效的数据堆积在一起,靠数据接口或各种变相的数据接口方法,都不能从根本上解决数据不一致问题,都不能有效地实现信息资源共享。实现数据环境重建的要点是:在一定的业务领域内建立并遵循统一的数据标准;对无效或低质量的数据积累进行结构化的重组;逐步建设和运行以主题数据库为主体的数据环境。
信息工程方法论所制定的“自顶向下规划设计,自底向上建造实现”整体解决方案,对大型信息系统工程提出了四个阶段的建设任务:高层构思、业务域分析、系统设计、建造,即所谓的“金字塔模型”(图2)。
图2 大型信息系统工程建设的四阶段“金字塔模型”
综合大量的系统开发建设所存在的现实问题,不难看出,自底向上建造实现的问题不大,有诸多行之有效的软件工程、面向对象和开发平台等技术方法;而自顶向下规划设计的问题较大,很不好解决。首先,号称“总体设计”或“顶层设计”的方法很多,使你很难选择;其次,这些方法大都是规范性较差,不易操作;最后,也是最重要的,是这些方法的成功案例看不到,使你难以相信,难以下决心选择。在这种情况下,我们经过长期的理论研究和实践探索,将系统工程思想与信息工程方法论相集合,创新提出了一种科学、实用、易操作的总体设计方法——基于信息资源规划的总体设计方法。
3、基于信息资源规划的总体设计
大型信息系统工程建设基于信息资源规划总体设计,除了在业务流程优化的基础上,建立应用系统功能模型外,更强调基于用户视图规范化和数据流程分析,建立应用系统的数据模型;在信息资源规划过程中,建立统一的信息资源管理基础标准;编制信息工程实施方案,以此来指导、控制和协调“金字塔模型”中下层的开发工作。
业务流程优化,要充分发挥业务人员的积极性,提倡业务人员与系统分析人员密切合作,在全面深入了解业务、分析流程的基础上,采用现代信息技术改进、优化业务流程;同时,要分析评估已建应用系统,选留好用的模块,或全面了解、分析评估应用软件产品,选择适用模块,这样建立的功能模型才能真正适合企业的发展需要。
基于数据流分析的应用系统数据建模,是创新的总体设计方法的一项重要工作。首先要确立“用户视图”的概念——最终用户所看到的数据实体,即通常的单证、报表、账册和屏幕表单等数据载体的综合。数据流就是用户视图的流动。以某市的经济社会管理工作的数据流分析为例,发改委、财政局、劳动与社会保障局、卫生局等政府部门之间,以及这些部门与企事业单位、社会公众之间的数据流,是极为复杂的。但是,如果将其分类为“左右”数据流、“上下”数据流和“内外”数据流,进行定性和定量的分析,采用信息技术后就会发现存在不合理的数据流,优化改进的必然要求是建立该市的经济社会管理数据中心——电子政务数据中心(图3)。这种数据中心,绝不仅仅是数据集中存储的物理中心,更重要的是经济社会管理的信息服务中心;而信息内容的组织,要有科学的结构,即主题数据库,以最经济、最快捷、最安全的信息共享机制,支持政府跨部门、跨地区的业务协同,支持企事业单位和公众的“一站式”服务。
图3 电子政务数据中心的信息服务改变了过去的数据流
基于信息资源规划总体设计的另一项重要任务,是建立一定范围内的信息资源管理基础标准。对于上面某市的经济社会管理信息化的例子来说,所谓一定范围内的信息资源管理基础标准,就是为使发改委、财政局、劳动与社会保障局、卫生局等政府部门之间,以及这些部门与企事业单位和社会公众之间的数据流畅通的最基本的数据标准,包括数据元素标准、信息分类编码标准、用户视图标准、概念数据库标准和逻辑数据库标准等五项标准。这五项标准,可以在信息资源规划过程中建立。因为,信息资源规划要进行的数据流分析,是从用户视图规范化开始;当规范用户视图的组成时,所识别的数据项(如一个报表的栏目),就是数据元素的“原料”;数据元素的一个子集,就是信息分类编码集等。这样,我们在信息资源规划过程中,就可以贯彻执行国际——国家——行业数据标准,整合、补充建立本地标准(图4)。
图4 在信息资源规划工程中建立信息资源管理基础标准
基于信息资源规划总体设计的组织实施经验表明,必须发挥咨询顾问团队和专业支持工具的作用。咨询顾问团队既要掌握信息工程方法论的有关理论方法,又要熟悉所服务领域的业务知识,这样才能指导业务人员与IT 人员的合作。专业工具软件的核心是信息资源元库(IRR),它记录着规划设计全过程的调研、分析和建模的成果,作为电子化、活化的技术文档,不仅是信息工程实施方案编写的依据,也是后续开发工作动态应用的资源(图5)。
图5 基于信息资源规划总体设计的支持工具及信息资源元库(IRR)
5、“十二五”应用系统建设的建议
我们对“十二五”期间经济社会各领域信息化的大型应用系统建设项目,提出如下建议供有关决策者参考。
5.1要以系统工程思想为指导,首先搞好总体设计
很多单位通常由总体规划直接导向应用开发,我们建议在总体规划和应用开发之间加上总体设计(或“顶层设计”)这一重要环节(图9)。很多经验表明,这两种做法的效果大不一样。前者,常常是总体规划不能“落地”,继续导致应用开发或引进应用软件产品形成新的“信息孤岛”;后者,由于统一了数据标准,建立了信息模型,不论后续应用系统是定制开发,还是引进软件产品,都要按已有的数据标准和信息模型开发或修改数据结构,必然会从根本上避免“信息孤岛”的产生。
图6 总体规划-总体设计/顶层设计-应用系统开发
5.2要充分重视数据环境重建,下决心搞好数据治理
信息工程方法论(IEM)提出了四类数据环境的发展规律(图10)。数据文件环境,是指早期的数据处理软件将数据结构和程序都编到一起而形成的数据环境;后来有了数据库管理系统(DBMS),应用系统的数据库创建虽然容易了,但随意性也增大了,很多应用系统开发人员按业务报表原样创建数据库,造成低质量、甚至冗余矛盾的数据堆积,即应用数据库环境的重大缺陷。这两种数据环境属于低档次的数据环境,这在经济社会信息化建设中是司空见惯的问题,却长期解决不了。理论研究和实践经验都表明,采用信息工程方法论的数据环境重建方法,即统一进行信息资源规划,统一数据标准,建设以主题数据库和数据仓库为数据存储主体的数据中心,从而建成高档次的数据环境,这就是数据环境重建(DER)。当然,这是一项大型复杂的系统工程,因此必须做好总体规划设计,然后分期、有序、逐步实施。关键问题是要有理论指导,认识到位,下大决心,在IT治理工作中重点抓好数据治理。
图7 四类数据环境的发展规律和数据环境重建(DER)
5.3数据中心支持核心业务应用系统集成化开发与运行
以某市“金保工程”核心业务应用系统集成化开发为例,资金统筹、五险公共业务、社会保障、劳动就业等应用系统,一改过去分散开发“先孤岛后集成”的老路子,首先统一这些应用的数据标准,规划设计好共建共用的主题数据库,然后再开发或修改应用软件产品中的数据结构(或建立必要的转换接口),这就是集成化的开发。这样,建成的应用系统,是在数据中心——高档次的数据环境的支持下运行的,使核心业务通过存取共享数据库,实现最便捷、最经济、最高效的信息共享,而不是通过“交换区”的数据交换实现信息共享;“交换区”设立的作用,是解决社保系统与外部系统(工商、质监、银行等系统)实现数据交换的。
图8 数据中心支持核心业务应用系统集成化开发和运行
5.4数据中心支持数据自动化交换,逐步实现互连互通
针对各单位的三类应用系统——拟建应用系统、在建应用系统和已建应用系统,所谓的集成化开发实际上包括两个方面:对拟建的应用系统(包括计划新建和重建),如上例所讲的,在统一数据标准之上进行应用系统建设;对在建的应用系统,则强调随着信息资源规划进程-数据标准的出台,所涉及的数据定义和数据结构,要及时修改调整向数据标准“看齐”,这样,才能保证在建的应用系统不至于最终形成新的“信息孤岛”(图12中的“在建应用1”下的数据库)。对某些已经接近上线的在建应用系统、上级下发推广的应用系统和外部的应用系统(图12中的上右四块应用),需要建立数据交换平台,通过交换数据库做中转,解决与集成化开发的应用系统的数据交换;而数据交换平台和交换数据库并不需要在数据中心之外另设,本应该作为数据中心的一种机制。
图9 数据中心的两大功能:共享数据库服务和支持数据自动化交换
5.5通过信息资源规划,基于信息资源元库实现试点示范与推广
省级电子政务应用系统建设,如何进行试点示范和推广,一直是业内关注的问题。我们以全省社会保障系统建设为例,来说明通过信息资源规划,基于信息资源元库实现试点示范与推广的策略。选定试点市之后,绝不是忙于网络、硬件和应用软件的选型招标,而是做本文上述的基于信息资源规划的总体设计,其中,对应用系统建设最关键的社保数据标准和信息模型,首先研制出来,并存储在信息资源元库(IRR)中,以此来指导、控制和协调试点市社保应用系统的开发(图13左下部分);其他市的社保系统开发,基本上是试点市的复制,而且首先是标准和模型的复制(即IRR的复制,图13右下部分);这些规划设计过程中,自然涉及其上级——省社保业务应用系统,会有同步发展的效果。经验表明,试点市与其他市、与上级,在信息资源元库内容和应用开发工作成果方面,共性是主要的,这就是一种又好又快的试点——示范——推广之路。
图10 基于信息资源元库的试点示范与应用推广