数据中心建设的目标
我们提到数据中心的时候大家经常会想到电信、银行。银行跟电信都有一个非常庞大的数据中心,在这个数据中心里面通过我们大量的服务器、大量的存储系统,大量相关的网络设备为用户提供数据服务。
这是我们以前提到数据中心所想到的一些行业或者一些应用。实际上现在数据中心不仅仅只是为电信、银行等一些大的机构进行服务,现在很多互联网的网站,一些企业,他们也会建设一个非常庞大的数据中心,除了通过这个数据中心为用户提供在线的WEB网页的访问之外,还会为用户提供在线数学流媒体的服务以及在线视频点击服务,或者通过博客等大量方式提供数据以及音视频方面的服务。
在一些政府行业比如说公安系统、政府大型建设系统里面也会建大量的数据中心,在这些数据中心里面除了传统所能接触到一些数据库的业务之外,会有大量文件的业务以及大量流媒体以及视频,比如说政府在信息化里面所大量建设的文件共享系统,这些系统是非常多的。
另外还有一些系统数据中心可能是一些企业所建立的,我们可能常规概念中企业所建立的系统数据中心非常小,一两个机位,一两个服务器,但是很多企业里面需要做大两数据存储或者计算。比如说一些石油行业的勘探系统,他们会有一个非常非常庞大的数据库,每天通过几百个甚至上千个、上万个结点进行运算。这些都是我们现在所要面临,我们要建设的一些数据中心。
数据中心在建设的时候我们的目标是什么呢?一般我们是为了数据的存储,或者我们通过数据通过前瞻的计算结点来进行大量的数据运算或者进行图象的模拟,或者进行一些高级的运算,比如我们通过前端采集的大量信息点来计算某一个地区它的地下是否有石油,或者通过大量计算两天之后天气情况如何。
除了这些数据本身的存储和计算之外还有很多的服务,就是通过数据中心存储服务器为个人或者企业用户服务,通过这种提供服务收费的方式进行空间租赁或者容量的提供以及服务的提供。这些我们可以看到比如说现在有很多一些数据中心将通过空间租赁的方式为中小企业为个人用户提供在线的集中存储。很典型一个例子大家可以看到MSN或者QQ等类似于网络硬盘的方式,或者电信里面提供的容量空间给中小企业,中小企业通过备份软件方式将本地数据集中备份在数据中心里面。
这种方式都是我们数据中心建设的一个目标,目的是为了实现数据的存储,或者为了业务系统的运算、计算,或者通过运营的方式为企业用户或者个人用户提供空间租赁或者在线的一些服务。
所有大的数据中心里面可能投资几千万、几个亿,小的数据中心可能几百万的投资。那么数据中心里面核心就是数据的可靠性和系统的可靠性,数据在长期存储过程当中不会因为各种突发的事件,比如说硬件的故障或者软件的故障,或者人员操作失误造成数据的丢失,系统本身不会发生一些失败。
我们即使有故障发生之后也有快速的切换或者数据进行恢复,我们在这方面有非常高的要求。所以数据中心根据行业的不同,根据系统压力的不同,根据用户发生故障之后恢复的时间不同,我们要求达到3个9,5个9甚至达到6个9的要求。
那么系统不仅要保证它的安全性、可靠性,在扩展性方面也会有很高的一些要求,而且这个要求会越来越高,不仅可以满足在线存储数据的存储需要,同时可以通过各种方式来实现数据的备份,可以实现静线系统和在线系统数据的融合和调用,实现离线、静线和在线数据之间互相的恢复和备份。
同时各系统之间能够实现高性能自动的部署或者高度的集群应用。在管理性方面随着数据中心数据量越来越大,服务器以及设备越来越多,在管理性方面也会有很多很高的要求。我们以前在数据系统里面会是两台服务器或者几台服务器后面共用一个存储设备,现在很多数据中心里面存储设备不仅仅只为其前端一、两台服务器服务使用,可能前端会有大量的服务器设备与它进行连接。
同时服务器设备后端连接的存储设备也已经不再只是一台或者两台,比方说我们在大的系统里面我们通常会有多台服务器,多台存储设备,这个时候对于存储设备的管理就是一个很重要的方面,需要我们在前期设计时考虑。比如说通过存储的虚拟化、通过存储前期的集中管理控制、后期的在线性能监控,包括后期的性能升级、技术参数的调整或者软件升级的方式,这些都是对管理性方面的要求。
同时,一,设备要可管理性,在管理维护方面要能够降低运营的成本。比如说,我们有一个大的数据机房,可能还会有一些设备分布在多个机房里面,机房多个数据中心通过网络系统进行连接,在使用方式上很简单,但是维护呢?
如果说用我们维护人员一天去一个地方、一个数据中心或者前端的小的一些机房,那么每天去一个地方,我们有多个地方就会去很多趟,需要花费很多天的时间。假如我们可以具有一个非常强大、功能非常好的集中管理,管理人员在一个地方就可以完成所有设备的集中管理、监控、性能调整包括后期性能的升级、更新换代等多方面。
数据集中在统一的系统里面,数据的安全性包括网络的安全性都是非常非常重要的一个方面。那么在物理方面我们通过防震、防火、防水等方式。
前一段时间四川发生了地震,这个对于数据中心来说是一种物理的灾害,对于数据中心如果前期通过各种远程备份的方式,即使发生地震的时候我们也可以使当地的机房硬件设备恢复之后,也可以通过远程的容灾系统进行系统的恢复。这就要求我们在物理设置方面、在网络方面要有非常好的前期设计和规划。
那么在数据本身的网络访问方面可以通过大量的一些前瞻的设备进行前期的设备,比如说我们网络层通过防火墙、路由器等方式进行网络的隔离、访问的设置,通过我们的监控软件,通过我们在应用端采用数字签名的方式或者个人认证的方式来保证数据的安全和访问的安全。那么这些都是数据中心在进行安全方面设计的时候需要所考虑的一些问题。
经济性是数据中心建设的最后一方面要考虑的问题,但是对于投资者来说很多时候是第一位要考虑的问题。系统建设起来了,我们设计了,但是它投资非常大,对于用户来讲是无法承担的,或者说这个系统建立起来之后后期的运营成本非常非常大,需要大量的人员需要大量的人力和物力进行支持,这些对于数据中心的设计来说都是不合理的。
因此,我们在做系统设计的时候要充分考虑这五个方面,可用性、可扩展性、可管理性、安全性以及经济性各方面。只有通过这五个方面一个完全的设计,这样一个数据中心的设计方案才是一个合理的设计方案。
前面讲了这么多都是比较虚的,我还讲一些也是虚的,数据中心归根到底我们要做什么?就是我们在一些明确的目标要求的基础上考虑到诸多能对系统进行影响各方面因素,最终达到我们系统运营的一个目的。
这样一个系统不管是我们未来实现数据的存储,还是为了实现系统的整个性能的运算,或者说我们通过各种运营的方式、租赁的方式来实现最终的增值服务,这些都是我们在系统设计时候所需要考虑的一些问题。
当然在考虑这些问题的时候我们需要设计的因素比较多,牵扯的方面也比较多,比如说基础的设施,我们机房本身物理的位置、房间内部的一些布局、内部的温度湿度同时考虑周边网络环境、安全环境、防盗环境以及网络可接入的环境,这些都是基础设施方面的考虑。
在IT方面我们要考虑人员的投入,人力的投入,人力技能是不是达到数据中心正常运营和建设的层次或者是技术的标准。在战略方面我们不能仅仅考虑我们今年做成数据中心就做这样的服务,在系统设计的时候要考虑今后三年、五年、十年,我这样一个数据中心该如何进行发展、该如何进行功能、性能各方面的扩充,这也是我们预先要考虑的一些问题。
前面讲了这么多,现在我给大家简单介绍一下UIT所推出的UDC数据中心的数据模型,这个数据模型我们从左下角一直到左上角,这是数据中心在建设时候的两个阶段,第一个阶段就是信息化工程的管理,我们在系统建设前期要做什么样的工作,通过四个阶段,基础设施、信息整合、系统整合、系统建设实现四个应用,基础网络应用、实时事务应用、内容管理应用、信息服务应用。
在整个过程当中要做到三个统一:统一规划、统一建设、统一管理,所有的应用、所有的设备、所有的服务器之间我们要基于统一的规划方式,为实现统一的目标。在整个建设过程当中我们在IT系统层面能够管理大量各种各样不同类型的数据,通过我们的数据,通过我们所建立这样的IT系统来为前端提供各种不同系统的应用。
接下来UIT本身对数据中心的一些概念和想法简单说一下,简单说一下UIT公司以及我们说的解决方案,UIT公司全称是创新科存储技术有限公司,成立2001年,目前在研发方面有两个大部门,一个在硅谷做芯片以及硬件方面的研发。另外一个研发中心在深圳,目前大概有150人,主要做软件存储以及应用管理,包括存储软件性能的一些开发。
公司在中国区目前有四个分支机构:北京、上海、深圳、香港,主要负责全国产品的销售、技术支持和研发。全国目前还有六个办事处,还有一个成都在上面没有写出来,人员大概200人。我们目前的行业在于广电、通信、监控、互联网以及政府行业,这是UIT的情况。我们从这右侧图上看到UIT的分布情况。
那么UIT通过200多人以及将近10个在国内的分支机构可以为国内的用户提供从产品的研发、生产、销售、技术服务以及运维等各方面的服务。UIT在数据中心方面我们所提供的一种模型是这样一个图表,可以从左侧看到,基础设施是服务器、网络设备、安全设备一直到上面通过各种软件的方式提供各种的应用,最终实现我们系统的信息化。
在这些里面对于UIT来说我们认为核心是存储设备,大家可能认为本身UIT就做存储,就认为存储是核心的东西。实际上从技术方面来说,服务器网络设备、安全设备经过很多年的发展,性能非常稳定,而且技术相对走上标准和统一。而存储设备在大型数据中心里面不断更新换代、新技术、新的产品、新的设备不断出现,因此在进行大的数据中心建设和设计的时候首先要考虑存储设备。
通过存储设备实现不同类型数据的存储和管理。 我们都知道以前数据中心建设的时候大多数是数据库的应用,随着现在业务的发展,存储设备可以用于不同类型的一些系统。
对于应用来讲服务器和存储之间的缓和方式,我们可以分为三种:一种方式就是数据库的应用,服务器是以数据库的方式来对存储进行访问,前期数据库创建一个数据的表格。还有两种方式大家以前都在用。第二类就是文件服务类。第三种是流媒体应用。这三类可以涵盖我们所有的应用系统。
我们在线进行网站网页打开,一种应用是数据库应用另外一种是文件应用。我们打开动态的网页服务器和存储访问方式主要是数据库的应用,如果访问是静态的网页这种访问方式就是文件类服务应用,如果同样在网站,如果说在线点播一个视频,这个视频文件进行在线的播放,这种应用方式就变成了流媒体应用,这种方式也可以用于广电、视频、监控,这些都是流媒体应用。
这三种应用访问方式不一样,数据传输不一样,存储也不一样。因此我们在前期设计的时候要明确数据中心里面有多少种不同的系统应用方式,根据不同系统的应用方式来确定我们这个数据中心里面应用的方式是文件服务应用还是流媒体应用。根据三种不同应用的方式,根据三种应用对存储设备的不同要求来选择存储设备。
UIT针对数据中心提出了几种产品或者我们的思路主要有四个:
第一,针对数据中心提供统一的存储平台。所有的设备所有的应用基于统一的存储平台进行不同数据、不同应用类型的服务。
第二,提出Data Service Infrastructure存储系统,为不同用户提供服务。
第三,通过Data Service Management存储软件进行存储设备管理包括应用管理。那么数据中心的管理是我们最核心的一个业务。
第四,提供"云存储"的解决方案。
我们数据中心目前或者说我们以前常建设的一些系统里面都是为企业级应用或者大型的系统应用,比如说银行、电信专业的系统进行数据存储的应用。随着我们现在个人用户或者说企业的用户级的PC数量的不断增加,用户级数据也越来越多,而用户级数据的安全性以及安全保护、备份方面的要求不断提高。
那么我们数据中心除了能够满足服务器本身数据的安全和保护之外,还应该对大量的用户级数据进行备份和保护。"云存储"就是这样一个服务方式,它可以通过网络的方式来为网络中所有的用户级数据进行集中的存储、管理包括备份。
简单介绍一下我们几个不同的产品或者产品的思路,一个是集中、统一的存储平台,我们建立在统一的基础系统之上。简单来讲就是基于同样一个硬件的环境可以提供多种不同功能的存储设备,可以提供FC等各种不同的功能。在软件功能上可以提供存储的虚拟化、数据加密、数据删除包括镜像、容灾,为不同的行业进行服务和支持。
这张表格当中核心是USP的统一存储平台,有两个方向:第一个方向就是在产品形态来讲可以支持NAS、FC等,同时在后期发展支持存储的虚拟化,可以支持集中管理等不同产品类型。那么在产品档次方面可以从OM或者中端产品、高端产品不断进行性能带宽等方面的扩充。
支持的行业可以为低端的用户比如说个人用户或者中小企业用户或者企业级用户移植到电信用户的使用。这是公司产品线的一个架构,同这种入门级的设备到中端、高端设备可以实现NAS到DR的使用。在集中管理方面可以通过SCM软件系统实现设备的集中管理和监控。
这个软件不仅可以实现UIT自由存储管理监控包括软件的升级,后期还可以实现网络中所有的存储设备之间的管理和监控。 另外就是Webdisk软件,网络化管理的软件。
我们在建设数据中心所需要考虑的问题,数据中心在建设过程当中我们在设计方面所考虑关键的内容。前面所讲的都是针对大型企业级应用或者专门的行业应用做的。现在对于大型的数据中心来讲还有一种应用方式就是针对个人用户,以及在企业内部用户级数据的管理。
我们知道电信的数据机房里面,我们的存储设备我们的服务器是为专用的设备进行使用的,很少有针对个人用户来进行服务的一些系统。
随着我们个人级用户数量的不断增加,PC数量的不断增加,随着个人PC上或者工作机上资料的不断增加,如何对个人电脑中数据进行备份以及数据保护,就是一个很重要的问题。
而现在经过一个统计,大约65%的用户是完全没有办法或者对自己电脑中数据进行备份和容灾,只有20%通过简单的备份方式比如刻录光盘或者通过移动硬盘的方式进行简单的数据备份。另外一部分就是由少量的用户通过专业的备份软件和服务器一样进行备份。
那么这种备份对于我们来讲:一,花费的精力和前期的投入非常多。二,效果并不好,它只能实现备份,无法实现远程数据的容灾。同时,这也是我们现有备份的情况,可是在我们具体使用过程当中我们有大量的机率会引起个人数据的丢失,比如说人为的错误、硬件故障、软件病毒等引起个人数据的丢失。
"云存储"可以解决我们目前现在个人用户电脑资料丢失所面临的一些问题,它是基于一种网络化的数据集中管理和备份的一种方式,在web2.0技术不断更新,随着网络特别是我们的互联网个人可用带宽不同的增加,我们可以通过"云存储"的方式对个人电脑当中一些重要的数据进行网络化的管理和监控。
在这个系统里面通过"云存储"实现网络的接入,不管在我们公司内部还是出差在外地,都可以通过互联网络或者通过公司内部的专用网络实时与数据进行接入,访问数据。另外我们个人电脑里面如果数据存在,全部是一个信息的孤岛,通过信息存储将公司内部所有人员的重要数据进行统一管理。
经常听到研发团队的领导抱怨说,我的单位里面又有一个高级的开发人员走了,但是他手里有很多没有做完的工作,或者已经做的工作里面有很多重要的数据不愿意交出来,因为他的数据在单独的PC里面,通过个人的备份或者把重要的数据删除,这对于企业、开发者来说都是非常大的损失。
如果我们对这些重要的数据,在前期的时候就将所有的重要数据统一存储在数据机房大容量设备里面,实现统一管理,就可以完全避免这样的情况。
还有一些应用,我们有一个案例里面针对一个研究院里面的,大量的人员经常出差,他们是一个设计院里面会有很多的重要资料,曾经发生过多次设计员出差笔记本丢了,里面重要的数据没有了。如果我们有"云存储"所有的资料都保存在集中存储里面,个人带的笔记本里面只放普通的资料,这样即使移动PC或者电脑丢失的话造成的影响也会非常小。
这是"云存储"的一些功能,实际上它更多功能还包括海量的容量空间管理,随意读取,我们可以在任何地方通过互联网都可以访问其中的存储数据、动态的容量扩张、统一管理以及自动的备份,我们可以通过备份方式进行全备份和增量备份,还有一个对于一些研发人员、对于一些前期设计人员,比如说写方案的人员,我们经常会用到不同的版本,"云存储"可以实现这种基于版本的备份。
UIT一个存储价值核心是采用Wbbdisk的软件打造"云存储"的服务,这个系统非常简单,基于存储的一个平台,通过数据,通过wbe服务器进行存储,服务器端和存储端根据需要自动灵活进行数量和性能的扩展,可以支持多平台的兼容,服务器端实现集群的扩展以及管理的方式。那么在技术方面支持P2P的传输,特别在音视频文件的时候,P2P可以节约带宽方便系统的使用。
对于大的一些企业级内部很多的一些工作用PC,它的配置基本上是相同的,我们可以通过重复数据删除技术可以将几百台甚至上千台服务器通过很小的容量就完全备份下来。
还可以通过数据加密的方式保证数据的安全性,任何人员通过在服务器端是无法访问的,同时即使通过一些非法的方式获得这个数据的话,他也是无法直接打开的。
"云存储"对于我们数据中心来讲有三种应用模式,一种应用模式就是对于大型企业数据中心来说,可以通过webDisk的方式实现企业内部所有PC或者所有个人数据的集中管理备份。
冯凯: 另外就是对于一些电信大的数据机房来说或者对于银行系统来讲,可以通过云存储通过WebDisk大的容量,针对不同类型提供不同的服务,通过购买空间实现数据的集中存储备份或者远程的管理共享方式。还有一种方式就是针对互联网的应用,在一些大的网站数据机房里面我们可以通过WebDisk和"云存储"建立在线类似于网络硬盘或者在线备份的方式。
这三种应用方式对于客户端来讲使用起来非常简单,可以通过浏览器的方式,可以通过Web虚拟文件夹的方式,也可以通过软件客户端的方式进行使用,满足数据的上传、下载、在线的点播,可以通过软件的客户端实现核心、重要数据的集中备份。这些就是我们针对新一代数据中心所提供针对个人用户的解决方案。