“2+2” 医疗行业数据容灾解决方案
来源:硅谷动力 更新时间:2012-04-15

 
 
  前言

  医疗行业的信息化建设经过了几个阶段的发展,逐渐形成了医院信息管理系统、实验室信息管理系统以及医学影像系统等众多内容丰富、功能强大的应用系统。随着这些系统的运行时间逐渐延长,功能逐步增强,医院数据的价值越来越高,系统一旦停机造成的损失也越来越大。

  另一方面,随着汶川地震的发生,“容灾”这个词汇逐渐成为人们谈论最多的焦点之一。其实医院的信息技术人员对医院数据存储系统的可用性十分关心,都希望了解到医院部署数据容灾方案的必要性和可行性。

  很多时候用户是否要选择应用容灾解决方案,选择什么样的容灾解决方案,是要根据用户具体的应用情况而定。医疗信息系统同样如此,在做出最终的决定之前,我们需要对医院的需求进行深入的分析,而不仅仅是简单地回答“要”或者“不要”。

  用户需求

  随着医院信息化水平的不断提高,his已从初期的以财务为主发展到现在以病人为中心,从单纯的文本数据扩展到有声音和图像等多媒体数据,存储的数据量逐年迅速增加。特别是x光片、ct和mr等大容量的数字图像,造成了医学信息量的急剧膨胀。

  曾经有人统计,一家三级甲等医院一天的数字影像数据容量大约为10g左右,数据备份10g,合计存储容量为20g,这样一年下来就是6t(1t=1000g)。若按照有关部门的要求数据保留十年,则是60t! 如此大的数据存储容量恐怕也只有金融、电信等行业能够与之相提并论。

  传统的“2+1”模式

  目前,在已经应用网络技术环境的医院中,绝大多数用户都采用了群集技术(双机热备份)来保证服务的持续运行,或者在用户可以容忍的时间之内,自动进行服务恢复。群集技术在应对服务器故障方面有着显而易见的效果,这一技术已经得到了国内大多数用户的认可,并已经得到很大程度上的普及。

  但是,随着群集技术运用的普及,很多用户也不约而同地发现群集所存在的一些非常明显的不足:由于传统的群集解决方案多采用“2+1”(即两台服务器间配一台磁盘阵列)的“双机热备份”模式,这个为了在两台服务器之间共享数据而存在的独立磁盘阵列,往往就成为了核心系统一个突出的故障点:一旦磁盘阵列发生故障,整个系统就会停机。作为7×24营业的医院来说,这种意外的停机对业务的影响可想而知。

  现在国内的医院用户大多数还没有认识到“容灾”的必要性。系统建设的时候,对数据和应用的容灾考虑得非常少,一旦发生火灾、地震等灾难性事故,或者人为的误操作都会使整个系统将毁于一旦,数据将一去不复返,医院将遭受无法估量的巨大损失。我们现在和SANRED公司共同推出一个适用与医疗行业的解决方案,为了区别于以前的群集模式,我们可以把这个方案称为“2+2”群集模式。从功能上来讲,这套方案突破了系统全冗余、无任何单点故障点,以及数据和应用的园区范围的容灾,使系统的运行真正没有了后顾之忧。

  先进的“2+2”模式

  所谓“2+2”,就是“两个运算节点+两个存储节点”。 “2+2”群集模式是在原来的“2+1”群集模式的基础上,增加了一台磁盘阵列,院方将每一台服务器定义为一个“运算节点”,而将每一台磁盘阵列定义为一个“存储节点”。

  这套灾备系统除了采用性能稳定,安全性高的Infortrend的磁盘阵列,还有一点配合SANRED的SVM控制系统。实现了两台磁盘阵列之间的镜像关系。每一次I/O的写入都分别通过两条主机通道到达两台磁盘阵列的控制器,并当两个I/O都返回正确的结果之后,操作才算完成。这样,两台磁盘阵列中的数据完全保持实时同步,不用担心任何的数据一致性问题。

  不过,“2+2”群集模式的部署对于网络数据的传输距离也会有一定的限制。 由于采用的是同步传输的方式,两个节点之间的距离不能相隔太远,如果距离过远,就会明显地影响业务系统的运行性能。对于远距离限制的应用环节,我们则采用了异步的传输方式,因为异步方式不会造成在线业务系统性能的下降。不过医院的园区级别的容灾要求距离基本不会太远。

  方案拓扑

  中心机房和容灾机房两个节点分别部署到了医院内不同的位置。这样,即使其中某一节点所在的位置发生意外或事故,医院的应用仍然能够继续正常运行,也不会有任何数据丢失的情况发生。此外,整个方案的架构也具有非常好的可扩展性,不仅可以将传统的“2+1”群集模式升级为“2+2”,还可以根据做到“2+n”,甚至“n+n”群集模式。

  实现方式

  V-Swicht2000是在S16E-G2130阵列之间一种基于存储系统的远程数据镜像技术方式,它提供基于逻辑卷级的数据迁移,在主磁盘存储系统和次磁盘存储系统之间通过存储系统提供数据镜像功能,而不需占用任何主机资源。主站与远端容灾站点可根据相互间网络连接状况选择同步复制或异步复制,由于完全基于硬件实现容灾,整个系统易于实施,易于维护。

  在主站由于计划内维护或灾难而瘫痪时,主站点可手动故障切换到远端站点,并可以直接在辅助站点中开始工作,同时也向指定主机显示所有灾难恢复卷。在这个阶段,远端站点作为主站点操作,此时可对主站点进行修复。在主站点修复或计划内维护完成时,再把远端站点手动故障切换到主站点,最大限度保护用户数据。

“2+2”群集模式相比“2+1”群集模式的优势

  1.全冗余连接,无任何单点故障点。系统中任意一个部件的损坏都不会影响系统的正常运行;

  2.镜像的存储节点为系统关键的在线业务数据提供了双重保护;

  3.结合综合布线系统实现了数据和应用的容灾;

  如果仅从方案的物理结构来看,这套“2+2”数据容灾备份方案只是“2+1”模式的升级,并无新奇之处。但方案中第二个存储节点的采用,不仅为医院整体信息系统的运行提供了有力保障,更使医院数据存储方案的部署更为灵活、实用。

  产品介绍

  1.iSCSI-SAS磁盘阵列,每主机通道传输速率为1GB/S;

  2.采用64位 CPU RISC I/O专用处理器 ,电源、风扇、支持热插拔在线更换;

  3.控制器高速缓存最大支持2GB ECC DDR,支持后备电池保护;

  4.支持RAID0,1,3,5,6,10,30,50,60,NRAID;

  5.支持逻辑磁盘RAID在线扩容,RAID自动重建,并且RAID重建优先级可调;

  6.支持本地、全局热备援磁盘,支持S.M.A.R.T技术;

  7.支持环境监控系统,动态实时监控系统各部件(硬盘、电源、风扇、内部温度等)的工作状态;


1.采用PowerPC RAIC CPU,由于采用了Supper Scalars架构(在一个时钟内执行多个指令),有效的提高MIPS速度,在实际系统应用中真正达到速度提升,同时在其CPU内部集成了1024KB内部二级缓存,大大缩短了CPU与Cache的交互时间;

  2.控制器采用独立硬件XOR(异或逻辑运算)芯片设计,不再占用CPU资源,大大提升可靠性、性能;

  3.控制器的高速缓存带有ECC DDR功能,最大可扩充至2GB,主机端总带宽达到4GB/s;

  4.最大支持32组逻辑磁盘、16个逻辑卷,每个逻辑磁盘最大支持64个分区;

  每个逻辑磁盘的最大容量最大可以支持64TB容量;

  5.支持每个逻辑磁盘独立设定不同Stripe Size(8/16/32/64/256/512/1024KB)功能,最大限度为应用系统提供性能优化;

  6.支持在线逻辑磁盘RAID初始化功能,用户无需再经过漫长的逻辑磁盘RAID初始化过程,可以直接使用逻辑磁盘,逻辑磁盘在使用过程中后台进行初始化;

  支持智能磁盘扫描功能