邬贺铨谈东数西算
来源:电子政务网 更新时间:2022-06-08

邬贺铨谈东数西算:西部不能只做数据存储和计算,需向产业链上下游延伸


记者 任晓宁 今年2月东数西算工程启动后,东数西算一直是行业关注热点,也被视为西部大数据产业崛起的机会。4月21日,中国工程院院士邬贺铨在热度之上提出了一些冷思考:目前西部大数据产业有明显短板,如果西部只注重于数据存储和计算,仅仅依靠财政补贴电费和土地出让金这种方式来吸引数据中心入住,是很难持久的。

邬贺铨在2022年第二届中国IDC行业Discovery大会上提出上述观点。他认为,数据存储和计算是一个重资产和重算力的环节,投资大,回报时间长。为了保持可持续性,西部应向大数据上下游行业拓展。

上游发展方向为数据预处理产业。包括数据的标注、清洗脱敏,以及本地数据挖掘服务。比如百度在山西阳泉建立的人工智能基础数据产业基地,现有数据标注师超过2300人,这种数据预处理不仅仅是标注,还是一种人工智能的训练。阿里巴巴有600多名人工智能训练师,训练智能客服机器人,在双11高峰期的时候,阿里巴巴可以用智能客服机器人代替8.5万个客服,完成97%的在线服务。这些数据服务产业都可以在西部建设(002302)。

下游发展方向为引进大数据产业链里的硬件。包括服务器边缘计算机房设施的生产,建立工程和运维队伍,提供数据中心机房建设的工程服务。其中边缘计算是一种需要建立在本地的云服务,通过边缘计算再上云,可以大大减少时延。他举了一个玩游戏的例子说,正常手机游戏上云每秒钟渲染5~7帧,通过边缘计算上云,手机渲染的效果每秒能达到58~60帧。2022年全球边缘计算市场能达到133亿美元的规模,如果能获得这部分市场,将是西部大数据产业的机会。

目前,西部大数据中心多数以服务器和机架等出租或者托管服务为主,市场吸引力不高,数据中心的价值也难以体现。国家信息中心大数据发展部规划处处长王建冬也提到,目前数据存储业务,东西部之间的价差大概是20%左右,如果考虑到数据网络的传输,包括数据的流动时延,可能在西部存储数据的经济成本其实并不占优。但如果是计算优化型业务和 GPU型业务,东西部之间的价差会达到40%以上,西部去布局一些这样的东数西算节点,成本优势是巨大的。

邬贺铨建议,西部要注意提升算力网络的性能,如果丢包率高,则要引起重传,会浪费很多算力资源。据他统计,对重要业务0.1%的丢包率将导致算力损失50%,还会增加能耗。

当然,西部做大数据产业也有优势所在,对比东部,西部一个最明显的优势是低碳。我国西部地区资源充裕,可再生能源丰富,比如太阳能和风能等。西部地方气候比较凉爽,也有利于为数据中心散热节约成本,具备发展数据中心、承接东部算力需求的潜力。

在优势之上,邬贺铨认为,西部数据中心要善于处理冷数据。通常数据分为冷数据和热数据,热数据为对实时性、可靠性要求比较高的数据,一般占比较低,冷数据占到整个数据总量的80%。冷数据调度的时间没有热数据那么频繁,可以用磁带处理存储,如果西部使用这种方式处理冷数据,将比磁盘存储方式节省73%的存储成本,从而具有商业吸引力。