泰达荷银基金管理有限公司(下称泰达荷银)运营副总监兼信息技术部总经理高谦最近有些着急,作为与拥有180年经营历史的荷兰银行合资的公司,泰达荷银要定期接受来自外方的严格稽核。IT的内部控制以及业务连续性作为其中的重要内容,让高谦觉得有些不放心,希望能够找到好的合作伙伴确保万无一失。不仅是泰达荷银,许多对IT依赖程度较高的企业已经开始了对业务连续性计划(Business Continuity Plan,BCP)的关注。
虽然BCP的重要性平时体现不出来,可一旦发生不可预知的灾难,IT系统“罢工”,这种滋味想必每位CIO都不愿体会。但事实上,企业的IT系统每时每刻都处在各种威胁之中。2005年,哈里斯互动调查公司(Harris Interactive)对《财富》(《Fortune》)1,000强中50家公司的顶级主管进行了一项调查,结果表明,大部分企业对灾难的准备不足。其中有78%的企业感觉并未为处理系统崩溃做好准备,88%的企业计划在灾难发生时尽快备份自己的系统,只有12%的企业计划保持系统100%运行。在他们当中,有54%的企业在过去一年中曾经遭遇明显的服务中断。对于金融、电信企业以及大型企业集团来说,这样的中断是不可忍受的。
业务视角看风险
提起BCP,很多人的第一印象就是灾难备份系统。虽然灾备系统是BCP建设的重要部分,但“有备”并不一定能够“无患”。比如,去年国内一些机场就曾因中国民航信息网络股份有限公司(下称中航信)的主机故障,而数次导致航班延误。尽管各地机场也同时启用了备份的离港系统,但航班延误的情况仍然较为严重,原因在于许多数据仍然需要与中航信的系统进行传送,这中间可能出现了很多信息错误的情况,传输并不顺畅,使得备份系统的作用没有充分发挥。由此可见,从业务出发围绕风险建立一套应对流程才是当务之急。这也正是很多企业在建立了灾难备份系统后,仍然需要建设BCP的
原因所在。
“这就不仅仅是一个IT系统的问题,”科索路咨询公司(Cosolu,下称科索路)高级咨询师梁晟说,“对于这些企业来说,缺少的是风险分析和业务影响性分析。”梁晟所说的风险分析和业务影响性分析,是指将灾难对IT的影响进行量化,然后确定这些因素对业务可能产生的影响。从业务的角度出发,建立风险的可能性与影响性的矩阵表,这样就可以看出各种IT设施和应对措施的优先级别。梁晟表示:“业务影响性分析是从业务的重要性推出IT组件重要性的关键过程。”因此,面对泰达荷银高谦的咨询,科索路高级经理方乐的建议是首先对泰达荷银的员工进行培训,方乐说:“这个培训就是从业务角度出发的,只有进行了这个培训,之后的工作才能更顺畅地开展。”
精确计算做灾备
通过分析出来的风险及其影响,企业可以根据自身的业务需求确定对风险的承担程度,比如到底选择避免风险、降低风险、转移风险,还是选择接受风险。海富通基金管理公司(下称海富通)就是在建立了灾备系统之后,建设的BCP。在建设了该系统之后,海富通保证了在遇到灾难时,在短时间内将系统恢复正常。但这个仅仅是IT角度出发确立的恢复时间,这个时间能否满足业务的需求并不明朗。
海富通作为一家专业的基金管理公司,业务系统是集中化的处理模式,一旦因某种不可抗拒的因素,导致信息系统无法运行,将会给公司业务与声誉带来不可挽回的损失。不仅如此,中国证监会在其制定的《证券投资基金管理公司内部控制指导意见》中明确指出:“基金管理公司的信息技术系统应当定期稽核检查,完善业务数据保管等安全措施,进行灾难恢复的演习,确保系统可靠、稳定、安全地运行。”通过与万国数据公司(Global Data Solutions,下称GDS)合作进行BCP分析之后,海富通明确了公司的核心业务系统。海富通在深圳建设有异地的灾备中心,灾备计划是一旦出现紧急情况,深圳的灾备中心可以利用备份的系统和数据接替原来的系统进行工作。但由于上海与深圳需要进行远程操作,在灾难发生时可能出现延迟。根据这个分析,海富通在上海又建立了一个应急中心,经过测算,2小时之内,应急中心和灾备中心可以完成切换。从成本和效果的平衡出发,2小时既将灾难发生时的损失降到了最低限度,又不会像银行的实时热备那样耗资巨大,按照灾难恢复的国际标准SHARE 78,海富通公司达到了温备份的标准。
同样是灾备,中国中化集团公司(下称中化集团)与国际商业机器公司(IBM)合作建立的则是一个异地冷备份式系统,中化集团的IT系统在遇到灾难时,根据重要性能够在20小时至几天内恢复。这是一个符合中化集团业务需求的低成本高效率的灾难恢复系统。可见,根据业务的需求建立可能性和影响性的矩阵是BCP的前提,它直接关系到下一步投入与效果的平衡。
实战演习保万全
灾难并不是时时发生,因此如何检验企业的BCP在灾难来临时能否真正经受考验需要靠流程来保证,同时定期的实战演练必不可少。
“仅有灾备的操作手册是不够的。”科索路的梁晟说,“企业应该列出所有的流程,定位每个人在灾难发生时的职责。”在正常流程下,每位员工都很清楚自己的职责所在,而在应急流程下,这些职责会发生变化,如果没有事先定义好相关责任人,就很可能出现流程混乱。同时,一旦责任人离职,流程还必须及时定义新的责任人。这种“关于流程的流程”管理对于企业的管理水平的确是一大考验。
实战演练也必不可少。2006年7月,在北京举行的国际灾难恢复研讨会期间,还安排了灾难恢复的实战模拟演练。海富通现在每年至少与GDS一起进行1~2次的实战演练,模拟灾难发生时的应急流程。在BCP系统中,演练是发现问题、改进问题、确保灾备系统有效运作的重要手段。
从风险分析和业务影响性分析,到确定灾备方案,再到成功实施演练,BCP系统的建设已经不仅仅是一个信息安全甚至IT的问题,它考验着一家企业的管理水平和应变能力。自2005年4月国务院信息化工作办公室出台《重要信息系统灾难恢复规划指南》以来,BCP系统已经逐渐被许多重点行业和大型企业所接受,为业务系统的永动不息保驾护航。