大数据时代的数据保护趋势谈
来源:站长网 更新时间:2013-12-27

     当前,数据正在成为企业用户重要的资产而存在,又因其超大量、高流速、种类多样和不确定性的特点,数据特征的改变速度已经超越了处理技术,为此,步入大数据时代后,企业用户如何将数据存得更好、获得更有价值的保护?大数据保护是否需要和应用相结合,如何体现数据保护的先进性和自动化特点,需要对企业人员、流程、技术等做全方位考虑吗?一系列的问题都已成为业界大数据保护所讨论的重要话题。

  大数据来袭 数据保护迫在眉睫

  百度百科中显示,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。” “大数据”在物理学、生物学、环境生态学等领域以及军事、金融、通讯等行业存在已有时日,却因为近年来互联网和信息行业的发展而引起人们关注。

  既然当前大家对大数据如此聚焦,来自IDC的多组数据表明,全球产生的数据量在以几何倍的增长,而到了2020年,全世界所产生的数据规模将达到今天的44倍。对于数量如此巨大的数据,以非常惊人的速度不断产生,新技术的出现也在继续加速数据产量,我们首先要考虑的就是如何将这些数据存好、保护起来。对于企业用户来说,每天产生的业务数据已经成为企业的资产,其重要性可见一斑。那么大数据变化的大环境下,如何考虑企业用户的数据保护问题成为当前关注大数据发展的所有业内人士讨论的焦点之一。

  现实中,企业用户的数据也是流动的。大家在强调提升存储效率的同时,还需要对数据保护做出更为明确的定位。不过,在通过各种资料搜集分析整理发现,企业用户在大数据时代也面临几大现实问题:一是恢复时间目标(RTO)变的更加咄咄逼人,同时运维的挑战成倍增加;二是整个存储架构特别复杂;三是传统备份需要花费大量时间;四是传统的备份设备是否可以有效保护虚拟化环境数据;五是企业用户大部分准备恢复一切数据或任意数据,包括整个数据中心、一个关键应用或者一个邮件。
 
  针对这些非常现实而又重要的问题,在考虑大数据保护的同时,对企业用户需要保护什么样的环境做准确的定位和分析,比如生产数据存放在企业级的SAN存储上、需要被磁带保护的数据、快速增长的物理或虚拟化环境、多平台的服务器和应用环境,不同的环境,其数据保护策略肯定有所不同。即便是这样,戴尔仍然提出了非常实在的数据保护观点,戴尔(中国)高级存储专员白云强调说,首先数据保护策略需要和应用价值相结合,也需要对人员、流程、技术等做全方位考虑,也包括对最小化数据的抓取、移动、存储与保护的综合考虑,当然也会涉及到一些标准、整合以及统一的架构问题,再者需要提升数据保护的自动化与先进性,增加具备自我保护的存储设备与之对应。

  不同环境的数据保护策略分析

  既然我们需要对大数据保护的存储环境有所考量,那么可以从刚才提及的几个主要的环境来进一步的分析。

  通常情况下,大家谈及比较多或者说最为常见的就是在企业级SAN 存储环境上,戴尔强调充分利用内置的数据保护功能保护生产数据。当然对于选择这种SAN存储架构来说,其优势还是容易理解的,它的单一界面管理在线存储和数据保护,并且还可以在集成操作系统、应用平台以及虚机管理平台的同时,也集成具备远程容灾的数据复制功能。在这里,大家应该常见到Dell EqualLogic 和 Compellent,前者是简单灵活的虚拟化统一IP-SAN架构,后者具备自我优化、领先的企业级多协议SAN架构。需要指出的是,在针对这种SAN环境下,DELL EqualLogic 和Compellent可以提供先进的保护功能,但是需要和长期数据保护方案相结合,实现完善的数据保护。