浅析新一代数据保护策略在云计算时代的应用
来源:甘肃科技杂志 更新时间:2013-05-14
 
新一代数据保护策略是一种通过集成重复数据删除及持续数据保护等新技术,凭借单一解决方案就可以帮助用户实现全面的数据保护。随着云计算的深入应用,作为未来信息社会发展的可能趋势,云数据安全越来越成为安全业界关注的重点。在云计算模式下,用户数据以共享和动态的方式被保存,这使其安全性面临巨大风险,如何保证存储在云上数据的安全?新一代数据保护策略将如何应对?是本研究探讨的重点。
    数据保护是伴随着数据的诞生而产生的。随着IT技术的不断发展,数据保护技术也不断的跟进,从而产生如复制、备份、镜像等数据保护技术。互联网时代对数据保护提出了更高的要求,比如如何防范来自网络的风险等新的要求。但是,随着数据量的增大,过去用固定时间间隔的备份/恢复技术来保护用户的数据,已经满足不了用户需求,用户需要实现实时保护。在这样的背景下以基于硬盘的数据重复删除技术和持续数据保护技术为代表的新一代数据保护技术诞生了,使得数据保护概念发生了革命性的变化,新一代数据保护策略就在这样的背景下产生了。
1 新一代数据保护策略
    1.1定义
    所谓新一代数据保护策略,简单的说就是把传统数据保护模式和重复数据删除及持续数据保护等新技术通过整合和集成,凭借单一解决方案就可以帮助用户实现全面的一种数据保护策略。新一代数据保护具备三个关键特征:其一,必须要全面,能够全面覆盖复杂的环境;其二,必须以磁盘为动力,从而能够利用现有的磁盘阵列投人并同时提高备份与恢复服务等级;其三,要以恢复为中心,备份操作要以在任何时间都可进行最为快速有效的恢复为设计出发点。
    1.2应用说明
    新一代数据保护策略是因为重复数据删除技术和持续数据保护技术的出现而提出的,特别是持续数据保护技术的出现,使得传统的数据保护发生了革命性的变化。因此,大多数据保护研究开发企业,对新一代数据保护策略的研究,都是围绕持续数据保护技术(Continuous Data Protection,缩写为CDP)来进行的,对于目前应用和特点大体可以归纳如下:
    1)为关键型应用程序提供完整的数据保护和恢复解决方案。
    2)能够从火灾、洪水、地震等突发事件导致的数据丢失中恢复关键数据并保证数据完整性。
    3)提供选择性备份机制,节省带宽的保护功能。可以按照业务需求设置备份频率,为最关键的应用程序设定严密的恢复点目标(Recovery PointObjective,缩写为RPO)。
    4)统一管理,集中控制。一个中央控制站提供监控和管理界面,提供对分布式灾难恢复流程状态和远程办公室操作状态的完全访问,同时还提供远程控制功能。
    安全性和可靠性。在远程办公室无法使用虚拟专用网(VPN)或其他安全通道时,仍然能保证安全的数据传输。
    1.3研究重点
    CDP作为一种数据保护的高级形式,带来的数据保护技术的飞跃和冲击都大大超出了人们对于传统备份技术所把脉的尺度和界限,重新定义着数据保护的模式—新一代数据保护策略。随着这项技术越来越聆听到人们的叫好之声,人们已经看到了众多厂商加快了融人这种技术的步伐。当前市场上流行的CDP产品主要有FalconStor Software Inc.FalconStor Continuous Data Protector, Symantec Coip.NetSackup RealTime和IBM Corp. Tivoli StorageManager FastBack等10多种,如FalconStor CDP原本是复制结合快照的数据保护产品,添加了持续保护功能后,可连续撷取受保护磁盘的写入I/O,并提供不受时间点限制的任意还原能力等等。CDP持续数据保护技术成为了数据保护技术中的一个主流热点,而随之而来的云计算,带来了海量数据存储和共享等等新的概念,促使数据保护技术调整相应的研究方向。新一代数据保护策略今后的研究重点应包含以下3个方面:
    1)持续数据保护技术领域的拓展。从目前基于微软的各类操作系统平台延伸到更多企业级系统所采用的UNIX平台,为更多的行业和用户带来数据系统的高可靠和低成本保障。
    2)进一步增强连续行在各类应用上的突破。像exchange系统的恢复、数据库系统的恢复、以及单实例的恢复等等,我们期盼着新一代数据保护策略为各类应用带来的是灵活、快捷和高效的恢复机制。
    3)新一代数据保护策略需要进一步完善存档机制与分级保护体系。将近期的各时间点数据在不施加对应用的影响下存档,尽可能的提高离线保存能力和长时间历史数据的保管。
    随着CDP持续数据保护技术的应用范围的扩大和人们的认知的深入,新一代数据保护策略将会被认同是一种新的范畴的、贴近用户目标的高级数据保护方式。
2 云计算
    2.1国内外现状分析
    随着互联网的日益普及和TT技术的迅猛发展,互联网数据急剧膨胀,如何存储和管理海量数据已成为一个亟待解决的挑战性问题,云计算的概念应运而生。云计算(Cloud Computing)是分布式处理( Distributed Computing )、并行处理(Parallel Computing)和网格计算(Grid Computing)的发展,其核心思想是将海量的通过网络互连起来的计算资源通过统一的管理和调度,形成一个抽象的计算资源向用户按需提供服务。云计算的最早提出者是Google公司的高级工程师克里斯托夫·比希利亚,2006年秋,他向谷歌董事长兼CEO施密特提出了“云计算”这一计划。IBM于2007年8月高调推出“蓝云( Blue Cloud)”计划,Google在于2007年10月在全球宣布了云计划,Google与IBM开展雄心勃勃的合作,要把全球多所大学纳入“云计算”中。2008年1月30日,Google宣布在台湾启动“云计算学术计划”,将与台湾台大、交大等学校合作,将这种先进的大规模、快速计算技术推广到校园。近年来,各国政府对云计算给予了高度关注,纷纷出台战略规划,加快推动云计算的应用,力争强占云计算的产业制高点。美国正式起动了云计算规划,旨在降低建设成本和减少政府信息系统对环境的影响;日本通过15. 7亿元的政府建设推动产业发展;美国2010年产业预算中明确最优化通用服务和云计算平台,日本通过加速重要开发,强化研究开发的基础系统等项目来支持云计算的研发;韩国将云计算研发列为战略重点,投资3. 49亿元人民币用于关键技术的研发等等.不难看出在云计算这个新型行业的竞争是多么的激励。据统计,2009年全球云计算服务的市场规模为563亿美元,增速为21. 3%。多家机构预测2013年全球云计算市场规模将超过1000亿美元。
    国内的云计算起步基本上是在2008年,2008年3月,Google全球CEO埃里克·斯密特(EricSchmidt)在北京访问期间,宣布在中国大陆推出“云计算(Cloud Computing)”计划。在中国的“云计算”计划中,清华大学将是第一家参与合作的高校。同年,IBM与无锡市政府合作建立了无锡软件园云计算中心,开始了云计算在中国的商业应用。2008年7月份瑞星推出了“云安全”计划。2010年发改委做了通知,确定在北京、上海、深圳、杭州、无锡等五个城市推行了试点工作,切实推进云计算标准体系建设,服务相关标准的制定工作,并促进云计算关键技术研发和各地云计算平台的建设和应用。2010年11月19日,由中国电子技术标准化研究所、SOA标准工作组、ITSS工作组将联合举办的“中国云计算标准化研讨会”,来自工业和信息化部软件服务业司副司长陈英就《积极推动我国云计算健康发展》作了精彩的发言,发言中提到,2009年我国云计算服务市场收人达到356亿人民币,比08年增长23. 9 %。国内多加企业在积极制定云计算发展战略,部分市场已经推出云计算的服务。百度近几年推出几百年的研究,联想计划推动云计算将企业从设备提供商发展成为设备加服务创新的领先型企,实现战略转型。阿里巴巴成立了专门的阿里云计算公司,在南京筹建了电子商务的云计算中心。各地政府也纷纷投资建设云计算中心,全国各地政府投资建设的云计算中心超过十个,但这些云计算中心多为国外的企业来主导建设,软硬件设施多数采用国外的产品,利用率还不是很高。
    2. 2云计算所遇到的问题
    企业数据都有其机密性。但这些企业把数据交给云计算服务商后,具有数据优先访问权的并不是相应企业,而是云计算服务商。这样就不能排除企业数据被泄露出去的可能性。而除了云计算服务商之外,大量凯叙云端数据的骇客们也没有闲着,他们不停的发掘着服务商web应用上的漏洞,以期望打开缺口,获得自己想要的数据。2009年上半年,Google公司尴尬地承认并修复了其产品在隐私泄露方面的一些漏洞。由于Google采用的是单点登录模式,骇客进人用户Gmail之后,其doc文档、电子表格、代码库等全部都可无限制访问。不幸的是,在问题发现以前,一部分黑客已经对这些漏洞做了利用。Google宣布针对这一事件,谷歌向企业、政府机构和其他付费GoogleAppsPremier Edition客户提供巧天免费服务,补偿服务中断给客户造成的损失,每人合计2. OS美元。2011年3月,谷歌邮箱再次爆发大规模的用户数据泄漏事件,大约有15万Gmail用户在周日早上发现自己的所有邮件和聊天记录被删除,部分用户发现自己的帐户被重置,谷歌表示受到该向题影响的用户约为用户总数的0. 08%。谷歌在Google Apps状态页面表示:”部分用户的Google Mail服务已经恢复过来,我们将在近期拿出面向所有用户的解决方案。”它还提醒受影响的用户说:”在修复帐户期间,部分用户可能暂时无法登录邮箱服务。Google过去也曾出现故障,但整个帐户消失却是第一次。在2009年出现最严重的一次故障,有两个半小时服务停顿,许多人当时曾向Google投诉需用这个系统工作。接二连三出错,令全球用户数小时不能收发电邮。Google及微软等科技企业近年大力发展云计算,盼吸引企业客户,但云计算储存的事故,又打击了用户信心。综上所述,云计算数据安全已经成为制约云计算发展的一个重要原因,云数据安全问题成了云计算发展的绊脚石,因此,云数据需要保护,云计算需要数据保护技术和策略。只有保证了在云中数据的安全性,才能更加吸引用户,让用户放心,使云计算更加稳定快速的发展。
    2. 3云计算的安全分析
    云计算模式与一般信息系统相比较存在的安全风险有相同的地方,同时也具有其独特的特点。总结起来主要有:
    1)云计算计算模式下设备安全。主要包括:信息系统设备的稳定性、可靠性、可用性。当然这一部分的安全性保障,在云计算模式由服务商提供保障,用户只考虑自己终端的正常就可以了。
    2)云计算模式下“云”平台的安全。云其实也是一个大的系统平台,如何保障这个庞大的虚拟平台的安全,就像每个人自己的操作系统一样,也许受到病毒或攻击等情况的而导致宕机,云系统的安全性如何保障也是我们必须思考的问题。
    3)云计算计算模式下存储安全。在云计算模式下,云计算服务商在高度整合的大容量存储空间上,开辟出一部分存储空间提供给用户使用。但用户并不清楚自己的数据被放置在哪台服务器上,甚至根本不了解这台服务器放置在哪个国家;云计算服务商在存储资源所在国是否会存在信息安全等问题,能否确保企业数据不被泄露,出现重大事故时,企业用户的数据能否得到恢复等等。
    4)云计算计算模式下数据传输安全。在云计算模式下,将数据通过网络传递到云计算服务商进行处理时,面临着几个方面的问题:一是如何确保的数据在网络传输过程不被窃取;二是如何保证云计算服务商在得到数据时不将数据泄露出去;三是在云计算服务商处存储时,如何保证访问用户经过严格的权限认证并且是合法的数据访问,并保证企业在任何时候都可以安全访问到自身的数据。
3 新一代数据保护解决云安全的策略
    云计算已经是当今IT界最热门的话题,也是将来IT行业发展的方向,而云安全是云计算快速发展的“绊脚石”,是一个设计层面比较多的课题。新一代数据保护策略应结合云计算模式的特点,针对云计算模式下数据安全存在的风险,做出科学合理的应对。
    1)新一代数据保护策略需进一步提高应对复杂环境的能力。在云计算没有到来之前,我们所提到的复杂的环境,如服务器、电子邮件、业务应用以及数据库、分支机构、员工便携式电脑、工作站、以及虚拟环境等不同的平台与技术才构成复杂的环境。而在云计算时代具有复杂的系统结构、多样的数据模型、以及可扩展性、和容错性等等,其中最为突问题就是海量,海量包含多个角度:集群规模、数据量以及用户量等等,另一个突出的问题就是云计算平台往往采用廉价、不可靠的PC机来搭建sharednothing集群,因此出错几率高于传统的分布式数据库中的高性能服务器。因此,下一代数据保护必须能够提供全面的管理平台来覆盖这一复杂的环境,保障云计算模式下的硬件及系统安全。
    2)新一代数据保护策略应该向高性能的方向发展。在云的建设过程中,多条高速链路汇聚成的大流量已经比较普遍,在这种情况下,安全设备必然要具备对高密度的处理能力;无论是独立的机架式安全设备,还是配合数据中心高端交换机的各种安全业务引擎,都可以根据用户的云规模和建设思路进行合理配置,保障云计算模式下数据传输安全,真正实现大流量汇聚情况下的安全防护。
    3)新一代数据保护策略应该向虚拟化的方向迈进。虚拟化已经成为云计算服务商提供“按需服务”的关键技术手段,包括基础网络架构、存储资源、计算资源以及应用资源都已经在支持虚拟化方面向前迈进了一大步,新一代数据保护策略只有基于这种虚拟化技术,才可能根据不同用户的需求,提供个性化的存储计算及应用资源的合理分配,并利用虚拟化实例间的逻辑隔离实现不同用户之间的数据安全,从而达到保障在云计算模式下的数据存储安全。
    4)新一代数据保护策略应融人用户隐私保护服务。将所有的数据信息都迁移到“云”中,包括个人身份证号码、银行帐号、还有子女信息等等,公众把他们的个人信息交给服务商希望能够很好的保护这些信息。但在云计算时代,安全设备和安全措施的部署位置有所不同,安全责任的主体发生了变化。原来用户自己要保证服务的安全性,现在由云计算服务提供商来保证服务提供的安全性,用户把数据放在云中,服务商不但要对用户数据提供安全保护承诺,而且要保证这些数据不被泄露。如果我们将这些信息交给一家云计算公司,而这家公司非法将这些信息出售的话,我们该怎么解决?我们要承担这个责任。这充分显示了云计算安全问题的症结,因此,隐私保护是云计算非常突出的问题,应该确保用户的身份信息、访问历史、访问方式受到保护,以及数据的存储处理都要能保护用户的个人隐私,要能通过数据挖掘获得隐私,阻挡通过推理攻击获得别人的隐私。能否在新一代数据保护策略中整合数据隐私保护,是新一代数据保护策略研究一个思考的方向。
4 结束语
    综上所述,在云计算时代,共享、动态的云计算资源减弱了用户的控制能力。因此,给信息安全带来了新的挑战。云计算所暴露出来的安全风险,也给新一代数据保护策略及其相关技术的研究和发展,提供了良好的机遇。抓好这一机遇,相信云时代的到来必将推动信息安全暨数据保护行业有一个巨大的发展。