见习记者 柳灯 北京报道
号称国际领先的IT系统也有故障的时候。
6月23日,全国多地中国工商银行柜台、ATM、网银业务出现故障,持续近1个小时。
“经分析与凌晨主机软件升级有关,进行紧急处理后,11:27各项业务全部恢复正常。”工行在发给本报记者的邮件中称。
而一位股份制银行科技部人士则表示,“解释并不完全,银行系统外还有灾备系统,两个系统是同时运行的,称"双活",如果一个出现问题,另外一个系统会自动对接代替,但是也只限于小故障,这次可能是系统核心部位出现了问题。”
记者就灾备系统一事采访工行信息科技部,但截至发稿时并未得到回复。
最近银行业务系统事故频出。6月24日上午,中行银期转账系统出故障半小时,解释称“银行端故障”。5月12日,招商银行ATM机、POS机、网银等业务系统瘫痪近两个小时,至今仍未对外解释原因。
“先进的信息系统在支撑银行业务飞速发展的同时,也面临着各种各样的潜在的灾难威胁,信息系统故障可能会造成客户财务数据的丢失和业务服务的中断。提高信息系统应对灾难冲击的连续运营能力成为商业银行一个无法回避的课题。”工行上海数据中心陈望斌此前撰文称。
此前模拟“损失”
6月23日0:10-1:40,工行按照此前公告进行了计算机系统升级,工行每年都要进行很多次类似的系统升级,但由于此次数据库升级的版本存在不够完善的地方,上午开始营业后业务量快速上升触发了故障。10:35左右,数据中心主机系统交易率出现下降,部分地区柜面和电子渠道业务办理缓慢。
“周日银行没有对公业务,相对来说业务量比工作日少。”上述股份行科技部人士告诉本报记者,同时,系统升级前都会有压力测试,会用超过平时业务量几倍的业务量去测试系统,业务量快速上升触发故障的可能性不大。
同时,银行柜台、ATM、网银的电源和系统都是独立的,同时维护人员也多,如该股份行科技部人数在总行各部门中最多为100多人,还有一批外包服务人员,“几块业务同时出现问题的可能性非常小”。
“解释有点牵强。”从事金融IT系统设计的某IT公司首席运营官刘晓光介绍,银行系统的软硬设施都是有严格备份的,一般出现故障时不会有问题。而且系统都是冗余备份,包括网络部分基本都是冗余备份,某个系统有问题不会影响到另外一个系统。即便升级也是有严格的割接流程的,即在升级之前要设想万一出现不成功之后的补救措施,一般都有应急的制度或流程。“现在的金融IT系统大多都是中心交易模式,可能是核心数据库出了故障,才会对各项业务都有影响。”
“工行于2002年1月在国内率先启动了主机灾难备份工程,目前灾备系统的建设水平达到了国际先进和国内领先水平。”陈望斌在文中称,根据工行2011年对主要业务所做的业务影响模拟分析,若全行业务中断8小时,所造成的直接财物损失达2亿元人民币;若中断24小时,损失超过5亿元人民币。
信息化考验
工行此次故障不足一个小时,上述股份行科技部人士表示,工行的IT系统确实在同业中算领先的,去年该股份行也出现过一次ATM、网银故障,并不涉及柜台业务,历时近三个小时。
据人民网统计,2007年1月,工行所有网点系统瘫痪90分钟,客户无法办理正常业务;2007年8月,多地工行网银系统不能登录,网站出现问题120分钟;2007年8月,工行网银及客服电话大面积故障及阻塞约480分钟。
而这块业务主要由银行科技部门负责。
4月25日,工行信息科技部副总经理张颖公开表示,目前工行的IT开发部门已发展为6000多人组成的庞大团队,其数据架构体系基本都是围绕数据仓库而建设的,其数据仓库系统于2007年开始建设,至今已投入超过10亿人民币,但带来的价值回报却远远超过了这10亿人民币。
此次事故可算工行转型信息化银行的首次考验。
6月7日,在股东大会上,易会满表示,工行经过这么多年的发展,已经基本上完成了银行的信息化,已经建成了国际领先的IT系统并积累了海量的经营数据,现在重点是在大数据下如何提升信息化银行的水平。