大数据时代赋予磁带存储的青春
来源:硅谷动力 更新时间:2014-05-16

 

【摘要】“磁带已死”的命题提出已很长时间了,虽唱衰之声一直不绝于耳,但磁带却一直活得好好的。IT巨头们开始采用,存储巨头还为磁带技术翻开了新的历史。此前,磁带因自身弱点遭遇的退市预期,在大数据时代,却成了生存和核心竞争力。可见,技术本身或许没有好换之分,其生存与否更多地取决于生存环境。
  “磁带已死”的命题提出已很长时间了,虽唱衰之声一直不绝于耳,但磁带却一直活得好好的。IT巨头们开始采用,存储巨头还为磁带技术翻开了新的历史。此前,磁带因自身弱点遭遇的退市预期,在大数据时代,却成了生存和核心竞争力。可见,技术本身或许没有好换之分,其生存与否更多地取决于生存环境。


  磁带存储技术有了划时代的最新突破

  一直致力于数据备份和重复数据删除业务的昆腾公司发布了最新财报,受磁带自动化产品和重复数据删除业务的不利影响,2014Q4财季营收同比下滑9%。昆腾磁带业务销售的下降,符合了人们对磁带市场的前景持续看淡的预期。2013年里,包括惠普、西数、SpetraLogic、甲骨文等众多厂商在磁带存储技术上虽多有突破,也未能挽救磁带市场下滑的宿命。

  最近,索尼公布了其磁带最新研发成果,单盘容量可达180TB。次举得到了业界的广泛关注,在一些媒体上甚至用了“下一代”的定语来彰显索尼为磁带历史翻开的新篇章。存储180TB的数据,意味着FaceBook正倾心的蓝光技术要用3700张蓝光光碟,7盘现在使用的标准磁带。可见,称索尼的磁带新技术有着划时代意义或许不为过。

  大数据挽救磁带消失宿命

  “磁带已死”的宿命结论早已有之,从当前存储基础的教科书中讲解磁带技术的部分占不了一个章节,就可见一般。从速度、性能、容量等方面,硬盘已经占尽优势,但近年来,每一次“磁带已死”的呐喊却有种如鲠在喉的感觉,硬盘一直没能完成其替代磁带的颠覆使命。何磁带没能如期的退出历史舞台?

  正是大数据时代,让磁带重新找到了往日的青春。

  最近几年,互联网对商业力量的推动不言而喻。在移动网络、社交应用、视频监控、RFID等各项信息交互技术的日渐普及下,企业的数据量在猛增。早先使用数台塔式服务器的机房已变成了可以容纳上百台服务器的超大规模数据中心。当企业的数据成为一定规模的时候,

  对海量数据的如何运用成为企业商战中的一个胜利的突破口。无数的实践已经证明,从传统制造到新型电商,从电子政务到金融结算,企业的海量数据日益成为企业资产重要的组成部分,而这部分重要资产正是通过大数据技术得以发挥其重要作用。

  大数据技术的运用对于企业的原有存储技术有着很多提升,如存储网络带宽的增加、数据存储结构的改变、存储基础设施的扩展等。尤其,企业对于数据服务已经远远超过了此前“存”与“取”的简单需求,除了知道“存在哪儿”和“快速取”,相应的服务需求变得更加复杂。

  企业需要有数据的长期存储能力。只有通过长期的数据存储积累,才可以完备大数据技术所需要的够规模的数据量。这要求企业存储容量要具备很好的扩展能力,可以方便的部署存储扩展支持。另外,企业也需要可以长久保存数据的存储介质。

  企业需要有对规模数据的管理能力。通过长期积累,企业会形成巨大的数据库,若是管理不当,容易造成运用的紧迫感。如大量的重复数据占据存储空间造成成本的浪费,冷热数据存放换乱增加延迟影响客户体验等。

  面对这些需求,早先磁带相对于硬盘在速度、性能、容量上的各种劣势变得不再重要,反倒成了大数据技术实现的有利支持。去年,作为提供大数据技术应用代表的谷歌与Amazon两大巨头双双开始利用磁带库处理数据归档工作,似乎是给了磁带一个新的历史机遇。如果连这些魅力四射、始终走在时代前沿的大数据巨头都在坚持使用那些看似老掉牙的磁带设备,这一定说明它们确实还有潜在的生命力值得发掘。也让惠普、西数、SpetraLogic、甲骨文、索尼们的努力变得更有价值。一些行业分析师表示,在具有大数据的企业中,磁带的作用正变得越来越大。磁带系统的整体销售在下降,但个别部署正在变大,低成本和能量需求是磁带的主要优势。

  大数据时代,磁带的机遇

  相对于硬盘,磁带储存历史太老了,老得已经让人们忘了它的一些优点,比如读取速度。虽说磁带的自动化装卸技术已经有了很大改善,在储存库中找出对应的磁带并装入读取装置中依旧比硬盘更加麻烦。磁带的装卸麻烦的增多,让人们觉得其可以达到硬盘4 倍的IOPS能力也可以忽略。大数据时代,归档变得越来越重要,对冷数据的处理,磁带优势明显。毕竟,你不需要那么多次对偏冷数据的读取。当内容所有者和数据管理者必须在主存储和归档存储之间做出实质性的权衡时,归档内容和理由这一问题显得更加重要。磁盘用于主存储,而磁带则用于归档。

  归档数据必须得到很好的保护,对耐用性的需求包括站点灾难以及存储组件故障。归档就是要保留数据,而不是转移数据或丢失数据。磁带的装卸麻烦真的是令人恼火么?想想一种场景,要是你丢了一块硬盘,上面的TB级数据有可能在30秒就删除没了。若是磁带呢,你至少能给警察找到小偷增加些机会。

  比起硬盘,磁带更加值得信赖。当前主流的企业硬盘一般都上了TB级别,这就意味着其机械操作的不可靠性,让任意一次的物理损坏也都处于TB级别。就算是做了RAID部署,业务损失也是不小的一笔。但断裂的磁带仍可以重新接上,而且仅会造成数百 MB 的损失——这对于动辄上 TB 的专业储存设备来说,实在小事一桩。另外,遭遇断电,磁带对你的拯救就更显得重要了。

  近几年,磁带技术的进步不只是在容量上,在数据耐用性上做出的突破也是值得关注的,或许没有其技术突破不如容量突破表达得那么直白。磁带在数据耐用性上做出的突破就是数据完整性检查,一些磁带库和许多归档解决方案有能力定期扫描磁带介质,以确保它们是可读和其上的数据是有效的。如果检测到错误或数据损坏时,整个带或损坏的数据可以被复制到新的磁带,而迁移到新的磁带技术可同样实现了自动化。

  管中窥豹,通过磁带在IT界的遭遇我们很难简单地评判一个技术的好坏。技术的生存状态对其历史环境有很强的依附性。若不是有着这些大数据应用的大客户的广泛使用,厂商们或许也早就不在磁带上下功夫了,而磁带若是能有不同于磁盘的某些特殊性,也很难成为大数据时代企业采用的一个选择。可见,一项技术能否得以顺利推广,除了其在性能上面有对现有技术的升级替代之外,也需有合适的市场需求环境。