面对金融市场的激烈竞争和信息技术的飞速发展,银行的信息化建设呈现了“数据集中化、业务综合化、管理扁平化、决策科学化”的发展趋势。信息在现代化商业银行中与市场、资金、人才并列为最重要的资源之一,占据着越来越重要的地位,已经成为银行对外服务的基础,科学管理的保障,正确决策的前提,有效调控的手段。能否拥有及时、准确、全面的信息已经成为衡量一个银行是否具有发展潜力的重要指标。银行信息管理涉及信息资源的采集、存储、加工、处理、提供等工作进程。这其中,信息存储在其中起着基础性和决定性的作用。这里,笔者在对银行信息存储的现状进行分析的基础上,引入信息生命周期管理策略,阐述银行信息生命周期管理实现,旨在探求新形式下金融系统电子化建设的途径和方向。
一、信息存储现状
近几年,各银行都逐步意识到信息存储的必要性和重要性,加大了在这方面的投入,纷纷建立起以企业级存储设备为基础的存储区域网络( SAN: Storage Area Network) 解决方案,配套以磁带库设备以及集中备份管理软件来满足业务系统对于存储容量和性能的需求。以某典型银行为例,目前,建立有两个各自独立的SAN。其中,围绕EMC DMX800高端存储服务器,配置光纤磁盘,建立的SAN,供个人信贷业务系统、银行代理业务系统、特色业务系统以及业务数据分析决策与支持系统等10余个主要业务系统使用;围绕EMC CX600中端服务器,配置光纤磁盘的SAN,用于个人住房信贷业务系统、ATM业务系统以及银行内部邮件、OA及人事管理系统使用。系统架构如图一:
应该说,基于光纤磁盘应用的SAN存储系统建设理念的引入在银行的应用极大地缓解了长期困扰银行系统的存储容量和I/O性能等方面的困境。但是,随着应用系统投产数量不断增加,特别是类似业务数据分析决策与支持系统等典型数据仓库应用的不断深入,这种存储方式在具体应用中,也暴露出以下几个问题:
数据分析决策与支持系统的应用实现对存储系统的扩展成本提出了更高的要求。银行业务系统多年运行,积累了TB级的历史数据,这是一笔极其宝贵的财富。为了使得这些数据充分发挥其应有价值,各行都在着手建立数据分析决策与支持系统。对于此类属于典型数据仓库建设的应用,其实现的首要条件就是解决庞大的历史数据存放的问题。这种数据存放都依靠增加光纤通道磁盘驱动器来实现,考虑到光纤通道磁盘驱动器价格昂贵,需连续投入,成本巨大,显然是不切实际的。
内外部监管和信息审计对数据归档提出了更高的要求。近几年,随着银行系统改革的不断深入,特别是银行股份制改造工作如火如荼,银行系统面临着来自内外部监管的前所未有的压力。频繁的信息审计,帐务调查要求银行要具有快速提供历史归档数据的能力。而银行系统以前采用的数据归档方式都是将数据备份到磁带、光盘等来实现,由于这种备份一般都是基于数据库级的,数据恢复需要在相同OS和DB环境下方可实现,条件苛刻,恢复效率也比较低下。
相对独立的存储网络不便于存储系统带宽、存储空间的有效利用与管理。传统的“孤岛式”,“烟囱式”的各自独立的存储网络构架已无法满足业务系统迅速增长和快速变化的需求。存储网络的孤立给银行系统现有IT环境带来了很多潜在问题,例如数据迁移问题、数据共享问题、存储空间动态分配与扩展问题以及存储管理成本问题。
二、信息存储系统解决方案
为解决以上问题,需对原存储架构进行改造。这里,考虑引入“信息生命周期管理”。什么是“信息生命周期管理”, “信息生命周期管理”( ILM-Information Lifecycle Management)是一种信息管理的新的策略,它能够把信息随时间变化的各个阶段有机地联系起来??采用不同的技术、策略和资源对其进行存储和管理。ILM出现基于的是所有信息并非“生而平等”这样一个简单事实。例如:今天的紧急电子邮件比去年的员工备忘录更为重要。随着时间的推移,信息的价值不断增长或减少。紧急电子邮件可能会成为法律调查的一个关键因素,或者只会对您的存储基础结构造成更多数据拥塞。信息对于您的公司来说其价值在不断变化,因此需要为信息提供不同级别的可存取性和保护,这就是ILM。在信息存储管理中,ILM一般将信息划分为在线数据、近线数据和离线数据。
那么如何在银行存储解决方案中实现ILM呢? 我们仍以上述某典型银行为例。近期,该银行正在引入ILM实施存储改造,新的存储架构如图二所示:
该改造方案中,新增的设备有DMX2000存储服务器和网络存储(Network Area Storage: NAS)管理服务器NS500G,对原有CX600存储服务器新增SATA硬盘。其中:DMX2000存储服务器和原DMX800存储服务器共同构成核心存储环境; 围绕CX600存储服务器构建次级存储环境; 应用NS500G实现NAS。包含的软件和服务有: ECC存储管理软件、PowerPath通道负载均衡软件等,包含的服务有数据迁移服务、产品安装服务、SAN网络设计服务、NAS文件服务设计服务、通道负载均衡设计安装服务等。
整个存储环境构建以四台存储交换机为依托,其中两个32口交换机用于核心存储环境构建,互为冗余;两个16口交换机用于次级存储环境构建,也实现相互冗余。各存储设备、主机系统接入SAN都采用双线方式,实现通道负载均衡和线路备份。
在具体应用策略上,整个存储环境划分为核心存储环境、次级存储环境和离线存储环境三个主要区域。其中,核心存储环境用于实现对关键业务系统,包括:个贷、代理、ATM、委贷和业务数据分析等的在线数据的存储;次级存储环境一方面用于实现次关键业务系统如OA、邮件等系统在现数据的存储,另一方面用于实现对全部业务系统的近线数据的存储;离线存储环境采用原有STK L180带库和集中备份软件,实现对数据的日常备份和归档。
该方案除继承原SAN的高可靠性、高效性、高可用性等特点外,,还具有以下两个显著特征:
实现业务数据的分级存储架构,体现数据的生命周期。该方案以成熟和稳定的技术实现分级( 在线|近线|离线)存储架构,关键业务系统和次关键业务系统的在线数据采用光纤磁盘驱动器作为存储介质,近线数据采用价格更低廉、性能可接受的SATA硬盘作为存储介质,在确保诸如业务数据分析决策支持系统海量数据存放需求的同时,减少总体存储的投资成本,优化总体存储的性能、容量和网络利用率,同时满足数据安全、稳定、高效的迁移与共享。
实现统一的、开放的、灵活的存储系统,更好应对未来快速变化的需求。该方案实现了对原有分散的存储局域网络的信息整合,提供业务系统统一的、透明的访问存储系统上数据的方式;实现了对多种异构平台主机系统的透明接入,满足应用系统不断增长的需要;随着交换机层面存储虚拟化技术的不断成熟,还可以完全实现对异构存储设备的无缝接入,以满足未来存储系统的扩展需要,提高系统的投资保护,提升存储系统服务响应级别。
实现SAN+NAS结构,更灵活的适应业务系统的不同存储需求。该方案中的NAS设计不仅用于实现近线数据存储,也针对一般业务系统,特别是通过文件系统方式进行主要应用实现的系统,还可以提供存储接入机制。NAS的建成,并结合SAN的实现,使得整个存储环境层次更加丰富,功能更加全面,能为关键业务系统、次关键业务系统和一般业务系统等全部系统提供在线、近线和离线数据存储整体解决方案。
三、结束语
总之,伴随着所生成信息的增长,法规和审计对数据保存要求的变化,以及控制存储成本的压力使得在银行系统进行信息生命周期管理已经成为一种必需。
( 中国建设银行江苏省分行信息技术管理部/刘明书、陈威)