被宕机撞了一下腰,看双活如何保障业务连续性
来源:本站原创 更新时间:2015-06-04

近几日,一系列网站宕机事件成为热点话题,在令用户揪心的互联网金融交易受阻、旅行和酒店预定系统故障的背后,凸显的问题是:随着互联网+深入渗透,如何实现业务连续运行、如何保障数据安全,这对置身其中的每个企业都意义重大。

1

宕机”拷问数据保护,业务连续性尤为重要

在这里,小编不去探讨这些事件的起因是单纯“挖断光纤”的意外、是所谓的“程序猿操作失误”、是一次不够谨慎的应用升级导致业务中断、还是受到了网络攻击。

在网络段子调侃不断的同时,更需要深刻的认识到,宕机导致业务中断是企业普遍面临的风险,无论是近几年微软、亚马逊等国际巨头爆出的大规模宕机事件,还是今年年初微信遭遇平台瘫痪的悲剧,业务中断会严重影响用户体验,更对企业的经济及名誉造成巨大损失。

如何通过未雨绸缪,构建领先的高可用方案,保护数据安全,保障业务连续,降低企业的业务风险,成了身在其中的每家企业需要认真思考的课题。

 

乱花迷人眼,多种高可用方案如何选择

其实多中心的业务平滑切换主要需要三方面的支撑:业务流程支撑,网络访问支撑以及数据一致性支撑,这其中数据一致性以及数据安全性是最重要的部分,这需要构建一个稳健并有效率的存储高可用平台来提供底层支撑。

企业级存储高可用方案,一般有备份、容灾、双活/多活、两地三中心等。那么,企业怎么才能知道那种高可用方案适合公司的业务呢?

衡量企业高可用方案有两个重要指标:RPO恢复点目标和RTO恢复时间目标。当然啦,这两个指标是越低越好,说明企业的数据恢复速度快、业务连续性好,比如双活方案的RTO可以做到等于0或约等于0,而RPO可做到小时级、分钟级乃至秒级,能很好的保障业务连续性;但随着这两个指标的降低,技术开发的边际成本大幅上涨,企业的资金毕竟是有限,不可能任性的进行数据保护的投资,而是要在业务连续性需求和投资成本上找到平衡点。

根据企业的业务规模和核心数据的重要程度,一般金融、税务、电信等行业的大规模关键业务数据保护,多采用双活和两地三中心方案,在业务连续性方面提供最高等级的保障;而对于中小规模的企业级数据保护、非关键业务数据保护或初始投资有限的项目,企业会采用高效、经济适用的备份和容灾方案,从小规模部署起步,逐步提升数据保护能力。

双活,企业业务不再“躺枪”

第三方的调研数据显示,90%的战略型数据中心都已经采用了双活数据中心的配置。那么,双活/多活方案有什么优势,能够受到大规模企业业务连续性建设的青睐呢?

很简单,建立双活数据中心,是确保企业能够在危险到来后,最低的标准是还能够活着。

而对于业务“活着”的目标,业界的存储双活方案有多种实现方法,一是以EMC为代表的采用全局缓存一致性来实现双活;第二种是国外一些科技公司采用的一种智能路由技术:用IO拆分器实现数据同时写两份;对比来看第三种方法则更具先进性:通过同步镜像技术,在两个存储设备之间同步存储数据,采用这种方案的有浪潮、华为等。

按照浪潮存储资深产品经理王刚的说法,“以AS8000为核心的浪潮存储双活技术,可实现企业数据在数据中心内部及之间实时共享和移动,并统一提供对外的数据访问服务,保证数据的可靠性及可用性。”

即使在一台存储设备或一个数据中心出现故障的情况下,双活方案仍能确保业务连续性提供保障,给企业管理者踏踏实实的安全感。

2

以AS8000为核心构建双活方案

“三零”双活,零感知数据迁移

与传统的主-备方式的容灾解决方案不同,当单数据中心存储故障时,双活方案中的存储系统需要能够实现路径访问自动切换,同时受业务端软件驱使,数据访问需要自动切换到另一数据中心。最理想的状态是,能在用户无感知的情况下,实现了访问另一个数据中心存储数据的目的。

浪潮存储资深产品经理王刚表示,“浪潮以AS8000为核心的‘三零’存储双活方案,即故障零秒切换、零数据风险和零资源浪费,可以协助用户达到业界较高水平的数据中心业务连续性管理水平。”

当单台存储故障时可以实现应用无感知的切换,切换时间近乎零秒;基于缓存镜像的数据同步方式,可以实现数据的一致同步,不存在传输时差导致的数据不完整;双活中心意味着两个中心设备同时工作,可均衡业务负载,有效提升存储资源利用率,避免传统的一主一备模式的资源浪费。

这样,“三零”存储方案,就解决了传统灾备中心不能承载业务和业务无法自动切换的问题,同时提供亚毫秒级的响应时间。

在“互联网+”与电信、金融、政府、交通、能源、医疗等行业深度融合中,提供业务连续性保障。一些中等规模的企业客户,也可以利用该方案很好地满足对数据高增长的需求。

养成灾备“好习惯”,别忘找个“好伙伴”

我们的生活已经与互联网,移动互联网紧紧联系在了一起,而说句实在的,不管是哪家数据中心宕机,对于企业和用户都是一个不幸的事件,而绝不应止于网友们脑洞大开的调侃。

如何提升系统的稳定性、安全性,如何做好突发事件的应急预案,已成为互联网和传统企业都必须提上日程的当务之急。

但是,保持业务连续性不是一个可以一劳永逸的事情,而是一个从方案到运维的慢慢征程,企业不仅需要把高频度的“演练”的看成“习惯”,更需要选择一个好合作伙伴,比如像浪潮,双活方案无论从技术水平还是集成经验上都可圈可点,这对企业的业务连续性规划、演练指导和应急处理都非常重要。