大型灾备中心解决方案
来源:中国电子政务网 更新时间:2016-03-06
项目概况

上海市电子政务灾备中心是上海市政府投资建成目前国内最大的政府灾备中心,机房面积达到12000多平方米,提供应用级容灾、数据级容灾、介质异地存放等灾备功能。面向异构系统、不同管理主体的应用系统,建设集中式灾难备份中心,普通的单一技术方案显然不能满足要求。为此,在项目前期技术调研人员采取了“请进来、走出去”的方法,对现有金融业灾难备份模式、IT各主流厂商灾备技术路线、产品特点和应用方案作了了解,其中包括了EMC、CISCO、NETAPP、华为、飞康、IBM、HP等国内外知名厂商,最终浪擎凭借过硬的技术实力经受住了严峻产品测试考验,成为了此项目唯一的国产灾备解决方案供应商,且为包含上海市财政局、上海市民政局、上海市卫生局、上海市工商局、上海市司法局在内的四十多家委办单位提供了灾备服务,根据其各自的实际情况采取不同的容灾备份策略——核心业务系统及用户需要实时访问的则采取双活容灾解决方案,对于非核心的业务系统则采取实时备份或定时备份。项目按照统筹设计、分批实施,目前第二期的项目实施已即将结束。

项目背景

上海市电子政务灾难备份中心是负责为上海市政府所属的各个委办单位提供技术方面的支撑,包含硬件设备、软件系统以及网络化等一系列技术的服务平台。尽管出于数据安全可靠性考虑已经采取了相关措施来保障此业务系统的稳定运行,如对该业务系统采用集群负载均衡技术来降低电子政务系统出现故障的风险,但是如果此负载均衡集群技术出现崩溃也会导致业务系统不能正常运行。此时,如何在保障现有电子政务系统正常运行的基础上采取其他技术方法来降低风险将是当前迫切紧要的问题。随着国家对于政府事业单位技术智能化,服务人民便利化等要求,因此政府相关单位需要在现在的技术基础上进行升级。备份容灾技术是当前互联网深入发展后有所需求而产生的,真正意义上对数据安全起到了保驾护航的作用。

目前我国信息系统的备份建设状况如下:

数据备份层次低,备份速度慢,恢复难度大

目前部分机构仅有的备份只是定时的数据备份,至今没有做到全部信息备份,备份层次低,速度慢的问题依旧存在。备份的可恢复性、可验证性都很差。

结构简单,应对灾害的能力差

数据定时备份虽然也具有备份数据的作用,但是由于其结构简单、缺乏应用系统环境的支撑,因此应对各种故障的能力很差。一旦主系统发生诸如停电、存储故障、火灾等灾难时,在系统重建以前,数据就无法恢复使用。

建设统一的共享式灾备平台是大趋势

随着2007年11月《信息系统灾难恢复规范》正式成为国家标准,中国的灾备市场进入了快速增长期。灾难备份是一个系统工程,其建设和维护专业性要求非常高。但是如何摆脱灾备系统成本高、建设难的困扰,是目前各地政府数据异地集中备份考虑的重点问题。在调研了上海市电子政务灾难备份中心项目需求后,浪擎提出集中灾备的建设思路,通过这种方式将政府相关资源整合,为各个委办局提供统一的共享式容灾备份服务。在规划和建设统一的灾备平台,综合考虑技术路线、运维管理、投资保护、长远规划等方面,做到统筹规划、分批实施。

共享式灾备平台建设方案

共享式灾备管理平台是为全市各委办局提供数据业务的备份容灾平台。各个委办局根据自己的实际情况把重要的业务系统通过共享式灾备管理平台实现业务系统的应急接管,把非重要的业务系统的数据备份到共享式灾备管理平台的云存储上实现数据的多层安全保护。共享式灾备管理平台实现资源池的弹性管理,对于接入的委办局分配相应的资源。如果随着后续委办局单位接入量的增多,导致计算资源和存储资源严重不足,则可通过共享式灾备管理平台的横向扩展特性来增加硬件设备实现业务的持续运行。

浪擎大型灾备中心解决方案

                         灾备网络拓扑图

方案亮点

l 接入用户管理和电子政务灾难备份中心两级监管

a) 电子政务灾难备份中心必需明确备份中心和接入委办单位的管理职责、边界的划分,必需搞清楚谁该做什么。这就要求备份工作必需得到细分,备份中心负责“怎么存”, 委办单位负责“怎么备”。

b) 共享式灾备管理平台设计方案的“两级监管”使备份事务和存储管理独立,两级管理各司其职。

c) 电子政务灾难备份中心提供通用备份和存储服务,负责存储、备份作业、各用户状态、网络等的监管。

d) 接入单位作为共享式灾备管理平台的一个逻辑用户,拥有可以配置的存储限额,逻辑独立的存储空间。

浪擎大型灾备中心解决方案

                     灾备中心存储资源分配方式

e) 各接入单位单位负责本单位各应用的备份策略、计划、代理管理以及日常运营等。

f) 各接入委办局单位也可根据业务应用特点选择不同备份服务类型,或者数据定时备份,或者数据实时备份,或者更重要业务系统的容灾接管。

浪擎大型灾备中心解决方案

                    接入单位备份管理模式

l 策略管理

a) 电子政务灾难备份中心通过共享式灾备管理平台管理接入单位的备份时间、优先级、网络流量控制;

b) 通过共享式灾备管理平台的资源虚拟化,利用其负载均衡技术实现资源的合理配置,保证业务的持续运行。

c) 对某些委办局重要的业务系统需要实现容灾接管的策略功能,则可通过共享式灾备管理平台的云计算平台分配合理的计算点,实现容灾服务器的接管。对于那些不需要容灾接管的委办局业务系统则采取数据定时/实时的备份策略,并通过共享式灾备管理平台的分布式存储技术把数据备份到云存储设备上。

l 统一监控

a) 作业监控

接入单位的业务数据备份容灾到共享式灾备管理平台时,通过备份软件系统实时监控接入单位的备份容灾作业状态。此方式便于对接入单位作业是否正常作业做出指导性建议分析。

b) 用户运行状态监控

如果对于接入电子政务灾难备份中心的各委办局数量较多,需要时刻对各个接入单位的运行状态集中管理,分析接入用户的运行状态是否符合规律性、合理性。

c) 存储空间报警

如果资源负荷较重无法满足业务正常运行的需要,则可通过短信、邮件等报警系统机制实现对管理员的提前通知,以此采取措施如云存储的横向扩展资源设备实现存储资源的增加。

l 作业报表

a) 记录每次备份作业的运行状况。

b) 在接入单位出现业务故障时,可通过作业报表查询备份作业的成功点,以此实现需要恢复的备份时间点。

l 安全管控

作为建立在城域网基础上的数据备份管理系统,加之政务信息的重要性,备份管理系统的安全性要求很高。

a) 管理登录

由于本系统应用于众多的条线单位,为保证系统的安全,委办单位必须经过安全系统的身份认证后,才能进行远程备份或恢复操作;各单位只允许操作本单位的备份数据,即必须为备份数据确立归属单位。

b) 数据传输

作为政府项目,对于数据安全性具有更高的要求,因此在数据传输过程中,采用数据加密的技术保证数据的安全性。

c) 存储安全

备份系统采用专有的文件系统存储格式来保证存储安全。

d) 云数据安全

虚拟机隔离安全、虚拟网络安全隔离、数据备份和恢复,云资源监控警告。

l 数据存储

a) 对于接入委办局单位而言,无论是核心业务系统的容灾接管还是非核心业务系统数据的备份,最终需要把业务数据备份在共享式灾备管理平台上的云存储设备上。

b) 对于接入单位的备份数据,共享式灾备管理平台会采用分布式存储技术把相关备份数据存储到合理的存储设备上。

l 统一WEB平台

a) 无论在用户端还是在中心端,相关的运行监管、备份策略、故障报警等配置都需要统一的Web平台界面方便操作和维护。

b) 在用户端安装Web模块负责本区委办单位用户的监控管理,同样电子政务灾难备份中心也是如此,只不过是监控整个灾备中心服务设备、网络运行、容灾业务等。

l 横向扩展功能

a) 备份中心面临越来越多需要备份的区委办单位。横向扩展做到备份中心备份能力的堆叠。备份中心只需添置更多的服务器和存储,然后加入到共享式备份管理平台中,再将新增的用户指派给这些服务器。

b) 这种模式无需再购买共享式灾备管理平台的备份管理软件,只对备份服务器做级联来支持更多的备份需求,从而不断扩充中心的接入能力。

浪擎大型灾备中心解决方案

                         灾备中心备份服务器扩展

l 应急容灾性

a) 云平台实现异构阵列间容灾,支持应用级容灾,灵活采用复制策略,阵列故障时业务不中断raid失效时数据不丢失,极大提升读的性能可达到50%。

b) 共享式灾备管理平台能进行数据的容灾保护和应用的分布式部署,提供异地容灾和双活:数据在一个中心保存,在另外一个地方能快速访问到。

 浪擎大型灾备中心解决方案

                       电子政务平台容灾拓扑图

l 高可用性

无论在云计算还是云存储中,负载均衡技术是其比较核心的,通过对虚拟机采用故障切换解决方案保持较高的可用性。