数说“东数西算”
来源:中国电信业 更新时间:2022-05-16

近期,东数西算工程正式全面启动,标志着我国算力发展迈上新台阶。

关系到数十万亿数字经济底座的关键工程

新一轮科技革命和产业变革正在重塑全球经济结构。数字经济规模凸显,中国信通院报告显示,我国2020 年数字经济规模为39.2 万亿元人民币,数字经济占GDP 的比重为38.60%。数字新基建是数字经济的底层架构,算力是数字经济的核心生产力,成为全球战略竞争的新焦点,因而“东数西算”作为数字新基建的关键工程而至关重要。

万亿市场新风口

“东数西算”是数字经济产业链中至关重要的一环。数字经济产业链上游主要为基础设施等底层架构,包括数据中心、5G 等;数字经济中游围绕数字产业化展开;数字经济下游围绕产业数字化展开。基于上游的基础设施,通过中游的各类应用为下游的各类场景提供全面的数字化服务。

“东数西算”每年带动社会4000 亿元直接投资。对相关产业拉动效应会达到1:8,相当于直接撬动3 万亿的市场。4000 万亿的投资本身主要包括土建、主干网络及5G 建设、数据中心升级和建设、云计算。撬动的万亿市场主要围绕产业数字化展开,主要包括工业互联网、人工智能、大数据、物联网、数据中心和5G 网络核心芯片、云网融合、车联网、数字孪生、元宇宙、ARVR、异构算力网络、新能源和碳中和。

2030 年我国数据中心将带来2 亿吨的碳排放量

数据量和算力在以20% 的年增长率增长,数字经济占比持续提高。据相关部门统计,到2025 年数据创建总量将大幅增长至175ZB,复合年均增长率约为26%。现在每小时创建的数据比过去20 年前一整年创建的数据还多。同时全社会对算力需求也十分迫切,截至2022 年1 月,中国数据中心规模已达500 万标准机架,算力达到130EFLOPS(每秒一万三千亿亿次浮点运算),预计每年仍将以20% 以上的速度快速增长。

数据中心碳排放也在不断突破更高上限,能源供给不断承压。据开放数据中心委员会ODCC 数据显示,2020 年中国数据中心能耗总量为939 亿千瓦时,碳排放量为6464 万吨。预计到2030 年,中国数据中心能耗总量将达到3800 亿千瓦时左右,碳排放增长率将超过300%。如果不使用绿色能源,碳排放总量将突破2 亿吨,占全国总碳排放量的2% 左右。目前中国数据中心的碳排放占全社会比例较全球平均水平高出一倍,减碳势在必行。

“东数西算”与经济一同减碳

既往数据中心布局和能源布局存在错配。根据《2021 年中国数据中心市场报告》显示,全国范围内累计数据中心存量机柜总数中,华东、华北、华南占比达到79%,我国大部分的数据中心都集中在东部。而西部地区的土地资源和电力资源更加丰富,数据中心需求却不高,且电费明显低于东部地区。数据中心能源结构亟待改变。2020 年,全国数据中心共耗电2045 亿千瓦时,占全社会用电量的2.7%。预计到2025 年,这个值将达到3952 亿千瓦时,占比将提升至4.05%,“不冒烟的钢厂”之名名不虚传。当前中国的电力结构仍以燃煤发电为主,在数据中心供电结构中,火电占比超过70%,会产生大量的温室气体及其他污染物,数据中心绿电使用率仍不到20%。

西部具备成为算力枢纽和集群的天然优势。例如,宁夏中卫的水电、光伏电站、风电等清洁能源装机比例超过50%,现有实际折算电价成本约0.34 元~0.36 元/ 千瓦时,与东部相比降低了20% 以上。贵安新区全年气温保持在14℃左右,水资源丰富,可为数据中心提供稳定的水冷支持。通过“东数西算”将算力迁移到综合能源成本更低的西部地区,在西部就地消纳光伏、风电等绿电,使用水冷技术节电,有望将数据中心绿电使用率在未来提高至80%,既能提升国家整体算力水平,也能符合双碳要求,支撑数字经济可持续发展。

20 万公里/s、100Gbps 以及N 到1

算力是“东数西算”工程产出的核心生产力,算网融合、端网融合以及下一代原生数据中心是支撑算力上台阶的核心技术。算网融合存在并作用于数据中心与数据中心之间,以及数据中心与边缘端/ 终端之间;端网融合存在并作用于数据中心内部;下一代原生数据中心则是数据中心的变革方向。

算网融合是“东数西算”的“大动脉”

算网融合用最少时延和最优网络方案输送云算力。在光通信时代,光在光纤中的传播速度是20 万公里/s;在算网融合时代,算力的传播速度是否也能接近20 万公里/s,会是一个有意义的话题。电信运营商是宽带时代的基础设施主要提供商,提供网络;而互联网大厂则是初代云时代的基础设施主要提供商,提供算力;面向未来,算网融合的网络基础设施提供算力网络,用最少的时延将算力输送到目的地。作为“算力+ 网络”协同发展的关键点,算网融合强调了借助信息通信网络协同异构算力资源,通过智能化技术实现计算能力的统一调度和编排,全面重构网络服务方式和计算模式,是“东数西算”的大动脉。“东数西算”也对算网融合提出新的技术要求。从架构上,需要改变当前以地域为中心的布局方式,做到以算力为中心布局;从互联互通上,需要提升云间链路的带宽,降低云间传送的时延;从网络本身来看,需要就近、最优发放算网资源。

端网融合是“东数西算”的“毛细血管”

数据中心内部100Gbps 网络造成DatacenterTax 巨大。数据中心虽然可以在逻辑上被视为一台计算机,但其中的节点是需要通过网络互连的。计算的分配、存储的共享、硬件资源的虚拟化等,都将成为整合数据中心资源的开销。而数据中心的CPU 和GPU 都不是针对数据中心的这些负载来设计的,诸如网络协议处理、存储压缩、数据加密会过多地占用CPU 和GPU 的算力,使有效算力降低。以网络协议处理为例,要处理10Gbps 的网络,需要大约4 个Xeon CPU的核,相当于单是做网络数据包处理,就会占去一个8 核高端CPU 的一半的算力。如果考虑100Gbps、200Gbps 的高速网络,CPU性能的开销就更加难以承受了。Amazon 把这些开销都称之为“Datacenter Tax”——还未运行业务程序,先接入网络数据就要占去的计算资源。端网融合可以为数据中心网络带来高带宽和低延时的价值此外更重要的还可以卸载CPU 的非计算能力,使数据中心有效算力提升,打通数据中心内部的“毛细血管”。

“东数西算”深度推动下一代数据中心迭代和落地

截屏2022-05-16 09.53.55.png

下一代原生数据中心

数据中心的发展经历了IT 机房、IT 数据中心和下一代数据中心三个阶段。IT 机房阶段,依赖单核和单机堆积高算力,从1 台主机对外服务,演变为n 台主机对外服务,实现了1 到n;IT 数据中心阶段,出现了Hadoop 等云计算架构和系统,可以统筹更多的N,每台服务器由Hadoop 等云架构来协调和分配任务,实现了n 到N;下一代数据中心是原生的、由软件定义的数据中心,其中CPU、GPU、XPU、FPGA 等高效异构计算资源、内存资源、存储资源、网络IO 资源等全部虚拟和资源池化,可软件定义,实现“The Datacenter as a Computer(DAAC)”,也即N 到1 的状态。随着“东数西算”工程的深入推进,软件和硬件厂商将更多地参与进来,共同构建一个原生的下一代数据中心。