浪潮集团高级副总裁、高效能服务器和存储技术国家重点实验室主任王恩东 发言
作为信息系统的关键基础设施,数据中心伴随着信息产业的发展,刚才大屏幕上看到了壮观、漂亮的数据中心,是否说所有的数据中心都是这样的?现在让我们来看一张图片,这张图片既不是码头,也不是工厂,而是谷歌在比利时建造的海上数据中心。目前,谷歌公司已拥有200多万台服务器,每个季度硬盘数量超过50万台。目前,随着IT产业的不断发展,微软、facebook等国际知名厂商,在全球正在不断建设新的数据中心。
同样,在我们国内,也已经规划了几十个十万台上规模的数据中心,例如:在重庆要规划建设服务器数量高达三万台的亚洲最大的云计算中心;河北廊坊要在规划建设数据中心产业园;像哈尔滨、内蒙古,也都在利用自己的区位优势或者能源优势,准备成立云计算数据中心的网点;互联网企业也在纷纷加快自主建设数据中心的步伐。在数据为王的时代,数据中心更加成为信息产业发展的核心环节。
今天在这里我将与大家共同分享浪潮对数据中心的理解和认识。
数据中心面临第一个挑战是数据量爆炸。随着信息化的深入发展,移动互联网、物联网、大数据快速发展,数据膨胀速度在加快,数据中心面临着数据爆发式的增长。根据权威机构调查结果显示,今年全球产生的数据总量将达到270万PB,每两天产生的数据就是从人类有史以来到2003年所有积累数据的总和,并且这种数据还在继续爆发式的增长。
以前我们社会的发展把大量的数据给忽略掉了,现在我们如何将它有效利用起来?正如陈伟司长讲的,数据挖掘产生巨大价值,应该说把这么大量的数据存储起来,计算起来,存储能力和计算能力都提出了巨大的挑战。我们来看几组与在座各位息息相关的例子:随着社会的不断发展,交通拥堵问题已经成为一个亟待解决的社会难题。传统的限制、限行的交通数据管理模式,对于治堵效果实际上并不明显。但现在完全可以充分利用这些数据,更科学地关注或者解决这些问题。例如,北京有50万个摄像头,每天产生3PB的数据,公交卡产生4000万次记录,还有每天50多场的大型演出等。这些数据本身并不能给我们带来什么价值,但我们可以通过对这些数据进行及时的存储、处理、挖掘,形成了各种有用的决策和服务,像实时导航、交通路线规划,同时也数据的时效性提出了非常高的要求。
数据中心面临第二个挑战就是资源利用率低下,同时资源共享率低下和资源使用率不高。我们建设了很多信息系统,这些信息系统是孤立的,数据是分离的,造成了大量信息孤岛,严重影响了资源的共享。据统计,我们数据共享的比例不到8%,这个统计显示在我们中国的企业内部有20%的时间花在了部门之间的数据交换上,并且这种数据交换免不了出错,我们决策都是在错误之上进行的,错误重建率超过50%,资源共享率低下导致了资源管理效率下降了30%,成本提高40%。
数据中心内部大概有15%的服务器是完全处于闲置状态,空壳资源,没有产生任何的价值,过去十年当中数据平均利用率始终在10%,在数据中心里面75%的数据低于20%的,由此导致产生消耗的比例不到3%。
数据中心面临的第三个挑战是安全可靠。根据对CIO的调查,使用云计算最关心的问题是什么?安全和隐私的问题排在了第一位,去年12月21号CSDN天涯社区用户社区的泄露,对整个互联网用户带来了恐慌,对互联网应急中心的统计,这一次被泄露的数据库多达26个,涉及帐号密码信息2.78亿条,很快有发生了支付宝大量用户帐号的泄露,这种泄露给电子商务企业带来了很大的损失。
同时大规模资源的集中和共享使得数据中心基础设施容易故障,对业务系统的影响加大。就像我们说大家都使用电网,我们信息系统集中起来以后,也要面临这样的问题。有数据显示,银行数据中心每小时的代价是750万美元,在今年双十一期间,淘宝一天的网上销售额190亿人民币,我们可以想,如果在这几天平均一小时损失接近10亿人民币。当然我们也知道,在北京奥运会期间出现了软件瘫痪的问题。
数据中心面临第四个挑战,就是能耗问题,2011年全球数据中心耗电量2400千瓦时,我们中国达到700亿千瓦时,未来五年我们中国数据中心处理能力的需求将达到7到10倍的增长,这种能耗的需求也是直线上升的。
我们来看一个例子,一方面应该说我们数据中心的能耗问题很突出,但同时我们很多数据中心能源的利用率非常的低,这是一个例子,这是比较大的数据中心,4千平米的机房,6百余台机柜,8千余台服务器,一年支出1亿元,在整个电费消耗里面光智能和配电就超过了70%,也就是说我们数据中心的POE值超过了3%,在发达国家POE值在1.1以下,接近1,这个数据中心能耗的问题是非常严重的问题。
既然数据中心面临着处理规模、利用效率、安全可靠以及能效各个方面的挑战,如何去构建绿色高效的使用于云计算时代的数据中心呢?
我们大家知道,信息产业经过了大型机时代、PC机时代、互联网时代,现在走向了云计算时代。同样数据中心的发展也经历了第一代、第二代、第三代,今天我们正在走向第四代也就是云计算数据中心时代,既然我们走进新的时代,新的数据中心就要有新的理念。首先是开放融合,开放融合是信息产业发展重要的特征,第四代数据中心应该说更加强调技术架构的开放性、兼容性,包括计算,存储、互联等等各个层面的技术,实现对各种资源的融合,在规划建设数据中心时既可以选择最先进的技术产品,又可以保护已有的资产,同时通过标准的建立和对标准的遵从,数据中心的建设评价有规范可依,提升数据中心的建设速度有一个好的效率和好的服务质量。
第二个理念就是灵动成长,云计算数据中心能够实现资源的按需扩展,灵活的调动,加快部署速度,降低投资成本和运营运营,通过智能化的管理才能实现智能监控。
第三个理念就是安全可靠,刚才讲了云时代的数据中心一定要是可靠的,尤其是站在国家信息安全的战略角度的话,我们在建设数据中心的必须考虑整个供应链的安全,只有实现完全自主的云计算平台,数平台才能得到彻底的技术保障,完全掌握从系统部件到虚拟化,可以为客户提供安全可靠的数据中心解决方案。也是秉承刚才提到的开放融合、灵动增长、安全可靠的理念,浪潮在基础设施和基础软件进行了积极的研究和探索,形成了浪潮面向行业问题的解决之道。
浪潮的云数据中心是有谋而划的结构组建,共建模块,专业化的计算单元和存储单元,智能化资源管理平台,以及主机安全和数据安全等组成,提供了模块化、智能化和安全可靠。模块化是浪潮云计算数据中心最主要的特征,什么是模块化?让我们一起来看一个视频。
(浪潮模块化数据中心视频)
王恩东:刚才视频中展示了模块化数据中心大致的构建过程,通过使用的方法和设置来实现我们三个指导思想,首先是功能的集中化,把智能、散热、配电功能进行整合设计。第二设计的模块化,把基础设施和设备功能进行云化,形成标准,实现产品的模块化。第三是管理的自动化,使数据中心能够保持在高效的运行状态。
我们看功能的集成化,传统的数据中心每台设备内部都有各自的电源、散热模块,属于功能独立和分散的设置,这种传统的模式存在数量多、成本高、功耗大、效率低的问题,集中化的设置目标将分散的功能模块进行集中和整合,减少模块的数量降低成本,提高整体的利用率。我们以一个标准的基本点通过功能集中化的集中设置我们实现小风扇减少到36个低干速、低功耗的大风扇,实现结点共享的散热。同样电源模块,由原来80多个减少为6个集中供电的系统电源,电源利用率原来的不到50%提高到80%以上。同时还提高了从计算模块的部署密度,设计更加简洁,也会减少运营的复杂度。这个图体现了如何把功能集中化。
第二个是设计模块化,将散热、供电、计算、存储、网络、管理等各个单位按照功能进行合理的模块划分和布局,模块可独立,模块设计完了之后,又能够快速的进行系统的整合,减少相互之间的交叉,来提高系统部署的灵活性和维护的简便性。通过这种制定系统的设计标准,规范功能模块的结构尺寸,可以保证模块之间的互联,模块灵活组合配置,数据中心从业务,对供电、散热、功能模块的需求不一样,所以针对各种场景我们开发了相应的模块,比如供电模块可以按功率分段,散热模块分为智能、水冷等等。
第三个管理自动化,传统数据中心对基础设施单项检测,只是简单把这些数据收集起来,能够看到运行状态,能够报警,而模块化数据中心可以更好的把控制功能加仅需,实现双向的控制,通过监控数据可以将相关数据进行分析以后,动态的进行调整。通过设备内置大量传感器收集信息,通过调整策略实时调整风扇的速度,达到了比较高效的工作效率。
我们的产品是SmartRack和Smart Cloud。Smart Rack集中散热与供电,适合大规模部署的共翁云数据中心。Smart Cloud,支持六个PB的存储容量,尤其是这种系统能够在两个月内就可以实现数据中心的交互和上线。我们看一个例子,百度大家知道,百度是全球最大的中文搜索引擎最大的中文网站的提供商,在全球有16个数据中心,服务器的保有量超过了15万台,明年采购量在10万台左右,浪潮通过Smar Rack产品帮助百度构建了新一代数据中心,POE值1.8降到了1.5,能耗大幅度降低,部署的速度和计算密度大幅度提升。
我们模块数据中心通过模块化的实施,标准化的产品的形式出现,应当说IT设备一体化交互部署,将数据中心的部署周期由原来的两到三年缩短为两到三个月,通过供电、智能等设备的调整,使得整体能动率提高一倍,还可以降低总体的运营成本。这里有两张图,传统的数据中心基础设施是一次性的投入,周期长,但是相关基础设施在非常长的时间之内,处于闲置的状态,利用率是逐渐上升的态势,用模块化的数据中心,这张图,它可以在建设和使用周期之内分析的投入,按需扩展,我业务需要了,我在建设,建设周期非常短,只有两个月左右就可以上线,因此提升使用效率保持在非常高的状况下,所以有非常好的保护投资,提高投资的回报率。
我们再来看看专业化,数据中心的业务类型各种多样,以前的做法采用通用化的服务器构建平台,通用化的设备无法很好的匹配应用,导致实际应用效能比较低,浪潮采用专业化的思路解决这个问题根据不同的业务类型,结合各种业务的特点满足各种应用。
举一个例子,我们来看机械工程这个行业,原来的机械工程也是比较单一的,今天到一个工地上可以看到各种各样的机械工程完成不同的工作,大家可以想,同一个机械工程完成不一样工作的时候,效率肯定很高的。浪潮针对不同应有类型对从计算处理的需求特征,我们设计了轻载、重载专业化的计算模块满足个性化的需求。轻载的计算模块,面向的是轻量级的,网站的全端接入,每秒达到几十万上百万,每个访问量需要的资源非常小,浪潮IS510这个产品是低功效,采用最小化和优化设计来开发的这样一个产品,2U的空间放置128个处理器。
中国万网有277多个万域名客户,非常希望有独立的系统硬件,独立的保证端口,但是希望是轻量级的,最后我们经过给他设计,部署密度提高10倍,工作效率大大提高了。还有就是重载模块,模块数据量大,耦合度非常高,对于数据的稳定性有所影响,基于高端处理器设计了8到12个天梭850的处理器,应该说这个产品也达到了像IBM、惠普这些公司在高端计算设备里面市场的垄断。建设银行新疆分行,是典型的事务处理应用,业务种类多,并且复杂,需要为14个二级分行,2400多个会员机,2000多个ATM机,才能浪潮这个软件之后,成本降低了50%。
第三块是专业加速模块,特定的计算密集类的应用。这个应用的特点是计算量非常大,具有特定的算法,并且使用频率很高。使用这样的产品用于石油勘探领域,整个系统性能提升6倍,性价比和性能功耗分别提升了4倍和4.5倍。当然除了前面三个非常明显的应用特点的模块之外,还有一般的模块,在一般的计算模块方面,浪潮也拥有非常完备的产品线,各种规模的通用服务器能够满足数据中心各种常规类的处理业务的需要。
根据特点设计专业化的模块,性能功耗比可以提升2.8倍,总有拥有成本可以15%到60%。我们再来看存储的模块化,针对数据业务的多样性,我们融合多种协议满足不同的存储特性,面向结构化和非结构化两大类数据的存储产品,其中结构化数据存储模块面向银行、通信、电子商务等行业,非结构化存储产品用于数字图书馆、平安城市、演播等应用。
我们看结构化存储产品,这些产品主要是面向我们数据库,这些应用应该说对于系统的可靠性要求非常高,我们通过设计传统的硬件内嵌式的操作系统,设计全球化的冗余的互联加速,实现了高性能,这个产品可以支持2到8个控制器,可见它的可靠性是非常高的,融合了多种存储器,具有非常好的灵活性,它可以扩展到1PB的容量,支持32个系统的并联,适合关键行业的应用。这个产品在整个洛阳银行得到了很好的示范应用,洛阳银行综合大前置系统,支付网上银行等核心的业务,处理能力提高了两倍。非结构化数据的产品,高性能计算数据挖掘中需求特点是数据容量非常大,数据存储率非常高,并且高并发访问。AS3000这个软件,采用统一的命名空间,合并多个系统,最大支持64个PB的容量,10亿量级的文件。
中国资源卫星应用中心,每年数据容量超过2.6PB,现在它是有2.3个PB应用AS3000部署在浪潮数据中心,应该说效果非常好,比原有的系统处理时间缩短了59%,尤其值得一体的是,这是他们来讲的,以前我们的卫星是我们自主发射的,但是地面数据处理系统都是用的国外的,通过使用浪潮的系统使中国成为第二个天上和地下都是自主可控的国家。
我们再来看看浪潮数据中心第三个特点,智能化,模块化和专业化是数据中心的基础,而网络存储资源的数据中心操作中心是数据中心的灵魂,在底层操作系统能够实现对各种软硬件的资源兼容,能够实现资源的扭转,从用户端来看,能够按需,云海设备系统采用开放融合的技术理念和层次化、构建化产品架构设计,实现了数据中心资源的融合和统一,智能和灵活的观点。
下面分别介绍它的三个特点。第一是资源的池化。虚拟是技术可以将物理资源等底层架构进行抽象,从而降低千差万别的各类资源融合大资源池,相当我们把水电、火电上升到资源池一样,例如种在资源池等等,我们以这种资源池为基础,按照用户和应用的配备要求,操作系统可以按需动态地组合不同的资源,形成符合用户应用的虚拟机,可以从专业加速的资源池的宣传资源整合而成,可以提供符合外部网站应用,ERP应用,数据库应用的需求的虚拟机。
第二个特点是资源交付方面。云计算当中按需供给是非常重要的,按照需求在线申请,自己的虚拟资源这样的能力,这样的功能。比方说用户A可以申请10用中等规模的虚拟机,用户B申请20台虚拟机,按照用户的需要提供镜像挖掘,保持用户的业务的可用性。
第三个特点就是资源管理性。数据中心庞大的规模和复杂的结构应该说带来了很多问题,如何实现高效的全面的功能,有效运行的基础,因此,我们的操作系统可以提供全面的统一的管理结构工具,来管理数据的各类资源,包括硬件资源,各种操作系统、中间件、数据库,能够自动发现修复系统的故障,有效的提高相应的速度。我们来看一下我们操作系统的应用案例,我们操作系统在云计算中心正式部署,成为国内首个警务云数据中心,原来154个应用系统,30亿条数据都运行在这个系统之上。通过这样的应用济南警务云比整合前,资源利用率由10%提高到了60%,节省了80%的硬件投资,同时采用的技术之后,应用部署的时间由原来数天减少到几分钟,管理的效率提高3倍以上,可用性达到了99.99%。
浪潮云数据中心第四个特点,安全可靠应该说数据中心安全可靠的运行,需要成熟的安全技术产品和体系的保障,在这方面大规模的主机和海量数据的存储是数据中心的重中之重,浪潮的工作重点也是在这个方面,我们针对数据我们开发了专业的安全存储和数据灾备备份,把原来传统方案性的数据安全的方案形成专业化的存储产品,我们设计了专用的X芯片,专用的操作系统,全面与网络的访问、传输进行加密,这些数据存在这个地方还是存在的过程当中都是加密的,不会出现被窃取的情况。在数据容灾与备份方面,保证数据的高可用,我们不但提供文件型的备份软件。
浪潮针对WiodowsLinux Unix的操作系统,我们通过内核的访问控制和这样的基础实现了主动防御,从根本上免疫针对操作系统的问题达到了防御的目的。举一个案例,这个项目覆盖了全国14个支柱平台核心系统,通过用浪潮的基础和产品达到了这样的要求,每台主机拦截率达到百分之百。
各位来宾,在数据中心的以开放融合,灵动成长,安全可靠的理念建设浪潮开放融合,我们推出了一系列模块化中心的产品,充分享受云计算带给我们更加便利的生活。谢谢大家。
马洪涛:谢谢王总的介绍,这么大的强大的数据中心,提供的云服务到底给用户带来什么样的价值,是否让政府还有企业在管理模式和商业模式上带来一场变革呢,我们接下来马上一起来分析两个案例,第一个案例是关于政务云应用,掌声欢迎有请青岛市人民政府副秘书长刘惠军秘书长。
刘惠军:在我正式介绍之前,先说三个关键词,第一个是祝贺,热烈的祝贺浪潮成功地举办了这么一次盛大的峰会,更重要的是祝贺浪潮这几年的取得的成绩。第二是感谢,感谢浪潮给我提供这么大的舞台,更重要的是感谢十几年来浪潮对青岛电子政务的鼎立支持,我们的硬件、软件、咨询服务等等都得益于浪潮的支持。第三是期待,期待着我们的浪潮能够更快地崛起,成为我们民族IT的积累。