“监管控一体化”实现高效电子政务运维管理
来源:中国电子政务网 更新时间:2014-05-27

作者单位:国家认监委信息中心 
摘要:随着“两网、一站、四库、十二金”等大型电子政务系统的建成,我国主要的电子政务系统已进入应用维护阶段。为了持续、可靠的提供电子政务服务,建立一套高效、规范的具有行业特点的电子政务运维体系,已经成为政府信息化工作面临的重要问题。本文首先分析了国内外电子政务运维管理的现状,然后结合认证认可行业“监管控一体化”电子政务运维管理的具体实践,对电子政务IT运维管理体系的建设思路和方法进行了初步探索和总结,最后对我国电子政务运维管理的整体发展趋势进行了展望。
关键词:认证认可;监管控一体化;电子政务;运维管理
1我国电子政务运维管理现状
从上个世纪80年代中期起,我国的电子政务建设大体上经历了三个重要的发展阶段,即80年代的起步阶段、90年代的重点推进阶段和2000年后的加速发展阶段。特别是“两网、一站、四库、十二金”等大型电子政务项目逐步建成投入使用,政府管理和服务水平得到大幅度提升[1]。
随着政府信息化工作的不断深入,核心政府服务越来越依赖各种信息化系统及IT基础设施环境。近年来,还出现了政务核心应用(如税务、海关、质检等)全国大集中的趋势。社会公众对电子政务应用系统运行质量的要求也逐年提高。这些都对电子政务的运维保障工作提出了巨大的挑战。但是,由于我国电子政务长期持续建设的工作惯性,对系统运维管理工作投入严重不足,普遍存在缺乏运维流程、运维风险控制力低下、人力资源短缺等问题,制约了电子政务系统效能的有效发挥。因此,建立一套高效、规范的具有行业特点的电子政务运维体系,已经成为政府信息化工作面临的重要问题。
如何保持电子政务系统的高可靠性和高可用性,提高IT资源利用率,利用有限的人力、资金投入来实现既定的运维服务目标,并有效管理运维风险,是我国电子政务的IT运维管理体系建设需要重点解决的问题。
2.电子政务运维管理的发展
IT运维(服务)管理全球最佳实践ITIL(IT Infra-structure Library)是英国政府于20世纪80年代为提升政府IT运维管理水平和IT服务质量,而总结出的政府部门和先进企业IT运维管理的最佳实践。到90年代中期, ITIL已经成为世界IT运维服务管理领域内事实上的标准。

如图表1所示,ITIL可划为两大流程组即:“服务支持”和“服务提供”。其中,服务支持流程组针对运营级的流程管理:包括服务台和事件处理与追踪(事件管理)、问题处理与追踪(问题管理)、系统变更(变更管理)、系统配置设定的记录与维护(配置管理),以及版本的发行与控管(发布管理);服务提供流程组针对战术级流程管理:包括服务层级的约定与管理(服务级别管理)、IT服务的财务管理(财务管理)、系统可用度管理(可用性管理)、系统容量的测量与未来规划(能力管理)、灾难情况下的业务持续运作与系统复原(持续性管理)[2]。ITIL为IT运维组织提供了一个客观、严谨、可量化的标准和规范,IT部门和最终用户可以根据自己的能力和需求定义以及要求不同的服务水平,并参考ITIL来规划和制定IT基础架构及服务管理体系,为业务运作提供更好的运维支持[3]。
ITIL在英国、澳大利亚、加拿大等国家应用较为普遍,不仅作为政府机构管理大型数据中心的实践标准,还用于电子政务运维外包时,评价服务提供商资格和服务能力的强制准入标准。在美国,ITIL的应用起步较晚,但得到了快速的推广。2005年8月,美国州政府CIO协会NA-SCIO发布了针对本国政府机构IT治理和管理的指导框架,并将ITIL作为IT运行维护管理领域的惟一推荐标准[3]-[6]。
在借鉴ITIL最佳实践的基础上,我国电子政务运维管理的研究也得到快速发展。2008年,中国IT治理研究中心制订了《中国服务型政府电子政务运维管理规范》;北京市信息化协会也发布了《北京市电子政务IT运维服务支持系统规范》,这些都是在电子政务运维管理研究领域的有益探索。
3.认证认可电子政务“监管控一体化”运维管理的实践
ITIL虽然为我国电子政务运维管理提供了实践样例,但是要实现ITIL与中国电子政务运维管理的结合,必须解决好以下几个突出问题:
1.整体电子政务IT运维工作思路的转变。从“设备管理”转为“业务管理”、从“被动救火”转为“提前预警、主动服务”、从“追求投入”转为“讲求绩效管理”等ITIL核心思想需要运维管理部门深入领会,并在日常的运维工作中予以实践。
2.ITIL理论与运维实际的关系。ITIL来源于实践,又用于指导实践。它虽然列出了各个服务管理流程的“最佳”目标、活动、输入和输出以及各个流程之间的关系,但并没有说明具体的操作流程。所以,在建设IT运维体系的过程中,不能迷信“ITIL”理论,必须根据运维部门的具体情况进行适当的调整,更不能脱离运维部门现阶段的运维目标和现状,IT运维体系的建设不能“一蹴而就”,必将是一个长期的、不断优化的过程。
3.工具与流程的关系。 在ITIL流程的建立过程中,一套优秀的流程管理软件(工具)的支持是必不可少的。但在关注流程管理工具本身的优化的同时,不应忽视这套工具与其他支持系统的互动。即:流程管理工具不能成为“信息孤岛”,实现与其他运维工具(如监控报警系统、运维展示系统等)的数据交互,才能提升整个运维体系的实用性。
正是基于对以上问题的思考,国家认监委信息中心对运维工作进行了认真的梳理,摸索自身业务需求、业务特点与ITIL的结合点,形成了具有认证认可业务特点的电子政务“监管控一体化”运维管理体系。整体系统架构如图表2所示:

系统整体逻辑上划分为:数据源层、数据采集层、功能实现层、功能展示层。
1. 数据源层主要指IT运维管理对象—各类IT资源,包括网络、主机、存储等。
2. 数据采集层主要依赖监控工具实现对各类IT资源的监控管理,包括告警、性能、配置等的管理。
3. 功能实现层是整个系统的核心,是本系统的创新之处。它主要由三个子系统组成:
1) 监控管理子系统:解决不同品牌、不同类别监控工具“各管一段”的弊端。对所有监控工具进行集成,屏蔽了底层监控工具的技术差别,实现了对告警数据、性能数据等监控数据的统一采集、分级处理。这不仅实现了对IT资源的“大集中”管理,使得运维“监管控”一体化成为可能。
2) 流程管理子系统:借鉴ITIL标准,构建以“服务台”为窗口,事件管理等五大运维流程的为支撑的流程管理系统,实现了“统一受理、积极响应、结果反馈”的工作机制。此外,通过监控子系统对IT资源的报警、性能数据的分级管理,流程管理子系统可进行快速运维响应,如根据报警信息级别,自动生成运维工单,极大的提高了运维人员的响应速度。
3) 业务管理子系统:业务系统运行监控管理,如某一业务系统下各类设备的拓扑关系图、报警关联图等,实现了“单点设备报警”到“整体业务系统影响度预警”的跨越,使得运维工作从单纯“设备管理”向“业务管理”转变。
4. 功能展示层:构建IT运维管理门户,使得运维工程师、运维部门管理者、高层领导均可以及时了解运维工作的现状和成果,运维工作不再是“雾里看花”,提高了对运维工作的关注度。
整个运维体系,以ITIL的核心运维管理流程(运维管理子系统)为主线,但又不限于ITIL流程本身。关键在于将ITIL关于业务管理、主动服务、绩效管理、用户体验等ITIL核心思想吸收,并体现在监控管理子系统、业务管理子系统、IT运维管理门户等进行梳理和构建,初步形成了认证认可电子政务“IT基础设施监控、运维工作流程管理、业务系统管控”的系统化管理架构。
此外,在构建运维管理体系的过程中,国家认监委信息中心重点抓好以下工作,使得整体运维保障能力得到了提升:
1. 运维管理体系建设,科学规划先行
国家认监委信息中心的运维管理体系建设始终遵循“统一规划、分期实施”的原则。在项目启动后,首先根据运维工作成熟度、应用水平状况及运维需求,对整个体系进行了科学规划。项目一期明确了以建设ITIL服务支持流程组为核心,贯穿底层数据采集-功能实现-功能展示的逻辑结构,并预留了与其他系统的接口(如:开发管理系统等)。整体项目的科学规划,将会使得运维体系拥有长久的生命力。
2. 转变运维工作思路,构建以用户体验为中心的“一站式IT服务”
国家认监委信息中心通过引入ITIL管理思想,将提高用户满意度作为运维工作的重点目标,逐步构建以用户体验为中心的“一站式IT服务”。首先从建立专业的IT运维呼叫中心入手,设置了专职的服务台/一线工程师岗位,实现对用户上报的故障保修、咨询投诉等业务统一受理。单一联系点的“一站式IT服务”模式使得运维部门能对用户服务请求进行快速反应,服务台对用户请求处理的全程负责,包括工单的初次处理、转交至二线工程师以及与用户进行沟通等,并进行用户满意度调查。这种服务模式,建立起运维部门与用户的沟通渠道,使得用户体验满意度得到大幅度提升。
3. 实行渐进式导入运维管理流程,实现流程与认证认可业务的紧密结合
为了实现ITIL的“理论流程”与认监委信息中心运维业务需求和实际工作的集合,在流程的构建过程中,不是简单的将流程引入,而是不断进行流程优化,并运用了渐进式导入的方法。
首先,运维部门进行了运维流程梳理和整合,并建立相应的制度规范和作业表单。
然后,运维部门全范围内开始试行手工填写纸质表单来实现流程的试运行。随着流程运行的深入,运维部门根据反馈信息及时调整各流程及表单。通过“梳理、实施、调整”的过程,使得流程与业务紧密集合,从而达到提升运维工作的效率与质量的目的。
最后,针对手工操作和纸质表单的不足(如:不利于高层管理人员监督流程实施情况、流程实施出现拖延导致不能及时完成、不利于汇总统计等),在手工纸质表单试运行的基础上,及时引入电子管理系统。这涵盖了监控工具、监控管理平台、流程管理工具三个方面。监控工具提供了IT资源的数据信息(如:主机监控、网络、应用等的报警、性能数据等);监控管理平台实现数据信息的采集、分级处理,并与流程管理工具对接,实现流程工单的自动生成;流程管理工具实现了运维过程的可追溯性,并可进行统计分析,寻找运维短板,实现提前预警。
通过以上努力,整个运维管理流程变得“有形”、“标准化”、“可重复”,并在实际运维工作过程中体现巨大作用。
4. 适应运维工作需要,建立“三级层次”的运维组织架构
按照ITIL运维管理流程,以流程为导向的运维部门组织结构最为高效,因为管理的扁平化可以简化流程,增强工作的灵活性和适应性。但是,不仅限于认证认可电子政务,纵观国内电子政务运维管理现状,在运维管理体系建设初期,就进行大规模的运维部门组织架构调整明显是不现实的。
因此,国家认监委信息中心结合目前的运维实际和组织架构,梳理建立了“三级运维层次”的弱矩阵式的组织形式,并通过运维角色的设置来实现(如图表3所示)。即:来自不同部门的运维人员根据岗位分工担任不同的运维角色,并形成层次分明的“整体服务链”。服务台/一线工程师负责统一受理用户服务请求,并进行初步的处理及故障定位,必要时转至二线服务支持团队;二线服务支持团队按照网络服务组、主机服务组等专业分工进行业务受理,必要时转至三线;三线服务支持团队由外部的专业服务厂商组成。整个运维组织形式淡化了部门界限,既有分工,又有配合,并能通过各个角色的统计分析数据来进行相应的绩效考核。

5. 运维绩效管理是关键
实现运维精细化的管理目标,提高运维管理水平和执行力,绩效考核是非常重要的管理手段。认监委信息中心的IT运维管理流程,实现了细分到个人、部门、运维团队的工作绩效统计分析(如一线解决率、故障解决事件等),并通过月度、年度运维服务报告的形式实现了对运维工作的量化分析。但是,整体运维绩效管理仍是需要继续探索的课题。特别是构建完整的绩效指标体系显得尤其重要,只有拥有完整的指标体系,才能确保绩效管理的有效实施,增强运维管理的服务效力与影响力。下一步,国家认监委信息中心将从成本管理、运营绩效、用户满意度等方面入手,进行IT运维绩效指标体系方面的探索。
4.结语 
细化和落实《2006—2020年国家信息化发展战略》中关于电子政务的目标,确保电子政务系统稳定、可靠、安全的运行,是我国电子政务运维工作的一项长期目标。在这一目标的指引下,IT运维管理体系建设将是我国电子政务IT运维管理发展的一个大趋势,特别是如何实现IT运维组织架构、管理流程、管控制度、绩效考核、运维成本核算以及技术平台贯穿融合、具有自身行业特色的IT运维管理体系,从而保障政务系统的可靠持续运行,将是今后值得长期研究和探索的课题。
参考文献:
[1] 孙炜刚.浅谈ITIL管理标准的IT服务管理实践[J]. 上海标准化,2009(8).
[2] Jan van Bon.IT Service Management[M].北京:清华大学出版社,2006.
[3] 鲁春丛.现代电信运维体系[J].电信技术, 2007.
[4] 傅贵,胡少鹏.如何实施基于ITIL的IT运维服务管理[J].广东科技,2007(5).
[5] 丰祖军.IT服务管理指标[M].北京:清华大学出版社,2008.
[6] 夏西平,龙朝阳.基于ITIL的电子政务运维管理研究[J].图书情报工作,2009