“数据要素×”与“东数西算”:全国一体化算力网建设的关键
【中图分类号】F49 【文献标识码】A
当前,大数据、人工智能、移动互联网、云计算等新一代信息技术应用普及,数字经济发展速度之快、辐射范围之广、影响程度之深,正深刻改变着经济社会的发展进程。算力作为数据处理能力的集中体现,随之成为重要的生产力。2023年12月23日,国家发展改革委、国家数据局发布《数字经济促进共同富裕实施方案》,强调要加快推动全国一体化算力网建设,弥合区域“数字鸿沟”。2024年1月4日,由国家数据局、中央网信办、科技部、工业和信息化部等17部门联合印发的《“数据要素×”三年行动计划(2024—2026年)》正式公布,旨在推动数据要素的高水平应用,推进数据要素协同优化、复用增效、融合创新。推动算力高质量发展,助推数字经济蓬勃发展,已经成为重要课题。
“数据要素×”对国家算力建设提出新要求
“数据要素×”及其战略构想。“数据要素×”是国家数据局成立后提出的一个概念,也可以说是对数据要素本质的一种新概括,其核心在于将数据要素的放大、叠加、倍增价值充分挖掘和利用,让数据要素这座“富矿”在促进经济高质量发展和社会进步中发挥更大作用。为了说明问题,我们首先需要就数据要素本身的属性特征、“数据要素×”的内涵以及数据要素价值网络等进行一些必要的介绍和分析。
在人类社会发展的历史长河中,生产要素具有关键性作用,主要包括劳动力、土地、资本和技术。进入以互联网创新为标志的大数据、人工智能时代后,情况则出现了新的变化,其中最为重要的就是数据的重要性大幅度上升,并成为一种全新的生产要素。有人形象地将数据要素称之为“经济增长的新能源”,就像油煤气电对经济增长的重要性一样。也有人认为,随着数字技术和人类生产生活的深度融合,数据已经成为优化资源配置、提高生产效率的关键。正是基于这样的认知,我国在国家政策层面将数据确立为生产要素,成为全球第一个在国家政策层面将数据确立为生产要素的国家。2020年4月,中共中央、国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》,数据作为一种新型生产要素首次写入了中央文件;2022年12月,《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》发布,明确提出要建立数据要素流通和交易制度、数据要素收益分配制度、数据要素治理制度,促进数据高效流动使用,赋能实体经济。
数据要素与其他生产要素相比,有其独特的属性和特征。目前对数据要素属性和特点的认识大体可以归纳为两个层面:一是技术层面,二是经济层面。
从技术层面看,数据要素首先具有虚拟性。数据要素是指大量的数字、文本、图像、音频或视频等数据的集合,而且主要以电子文本的虚拟形式存在。虚拟性是数据要素区别于传统生产要素的主要特点,相比土地、劳动力等传统“有形”的生产要素,数据要素没有有形的存在物。其次具有非消耗性,即数据在使用过程中不存在损耗。相比传统生产要素在使用过程中会自然衰减或损耗,数字化形式的数据使用过程并不存在衰减或损耗,还可以永久存储,甚至可以重复使用,越用越多,形成巨大的规模效应。再次具有依赖性,即数据要素的价值创造必须依赖于网络、算力、算法、区块链、人工智能等技术,也需要依赖其他生产要素或资源,否则,数据要素就很难完成价值创造和价值实现。最后具有高速性。借助现代信息技术可以在瞬间处理海量数据。
从经济层面看,数据要素首先具有非竞争性,即数据要素能够被不同主体在多个场景下同时使用。这与传统生产要素大多处于竞争状态、在同一时点不能被多个主体同时使用是不同的。其次是非排他性,即数据的生成使用过程中并不排除其他主体的使用。数据生成过程涉及产品服务的供需双方、第三方平台、网络电信运营商等多个主体,使得数据信息自生成之时起就同时栖息于多个不同主体,加之数据资源易于扩散的特点,形成了数据要素使用过程中非排他的客观现状。再次是规模性。随着技术的进步和人类处理数据能力的提升,数据形成的规模巨大,且每年都呈指数级增长。而数据规模越大,种类越丰富,数据使用者越多,对经济社会的促进作用也越大。最后是价值性。数据蕴含着巨大的经济价值和社会价值,可以为人类带来巨大的经济和社会效益,如政务、医疗、教育、金融、交通、能源等。
作为新型生产要素,数据要素虽然具有多方面优势,但其应用到具体的经济社会领域时,也存在诸多限制和要求。首先是如何保护数据安全,包括个人隐私、商业机密和政府信息安全等。其次是如何合规使用数据。数据要素的使用必须遵守国家相关法律法规,不得侵犯他人的权益。最后是如何合理利用数据。数据要素的价值在于其使用过程中要不断地挖掘和探索数据的潜力,以实现最大的效益,因此,不断提升算力、改善算法,引进新技术、新方法,就成为提高数据利用效率的重要途径。
通过以上对数据要素基本特征的分析可以看出,数据要素的价值释放不是简单地通过加的形式实现,而是以乘的形式呈现,数据量越多,应用的领域越广,积累的数据规模越大,同一数据使用者越多,其创造的经济价值和社会价值也就越大,再加上其可复制、可重复使用的固有属性,使得数据要素与其他生产要素相比,显现出独特的优势和特质,这也是国家提出“数据要素×”的原因。
数据价值网络的发展前景。2024年3月,信百会研究院与波士顿咨询(BCG)联合发布《数据价值网络》白皮书,不仅提出了数据价值网络的新概念,而且从经济学的视角对数据市场的现状、发展进行了比较深入的探讨和前瞻。主要集中在以下四个方面:第一,对数据价值网络这一新概念作出明确定义。数据价值网络是指以数据要素作为交易流通对象的价值网络,涵盖了从数据生成到运用的一系列价值创造环节。价值链是价值流动的最基本路径,一系列价值链组成了数据价值网络。数据价值网络的首要环节是数据价值的创造,而数据价值创造要齐聚算力、数据、算法和应用场景四大要素,算力是基础,数据是原料,算法是手段,应用场景是价值产生的根本动力。
第二,对数据市场的整体状态进行描绘。在对数据价值网络内涵定义的基础上,从数据要素的需求、数据要素的供给、数据要素的流通、数据要素的应用以及数据要素基础设施保障这五个维度,全景式地分析了数据要素在优化资源配置、促进经济社会发展方面发挥的关键性作用,剖析了当前数据要素应用的痛点、难点,并提出了一些解决方式。
第三,对参与数据市场的各类主体的功能、定位、作用等进行比较深入地分析。认为目前市场已经形成“4+1”的专业化分工格局:以决策、管理、服务、营销、研发、风险控制等为代表的需求方;以政府、金融机构、运营商、互联网以及交通、物流、医疗、汽车、能源等为代表的供给方;以数据聚合商、数据交易商、数据处理加工商等为代表的数据流通方;以应用解决方案供应商等为代表的数据服务商;再加上数据基础设施技术工具提供方。
第四,对未来数据市场的发展趋势进行了推演。未来在政策利好的大背景下,数据需求方新应用场景将大量涌现,数据需求会爆炸式增长;数据供给方将有更多的数据对外开放,还会产生以千行百业为代表的新的数据供给方;与此同时,数据价值流通链路将发生变化,数据需求与数据供给初步匹配形成数据流通链路雏形,新流量平台崛起;风控要求更加全面精准;人工智能的广泛应用以及在大模型的带动下将对数据流动路径带来重大变化:新数据源涌现,新数据标注自动化,以及通用大模型为专业大模型提供数据,形成新链路等。
通过以上对数据要素特征以及数据价值网络发展前景的分析和介绍,我们可以清楚地看出,随着数据要素价值的释放,以及数据在优化资源配置、促进经济社会发展中作用的提升,作为数据基础设施的算力供给,将成为一个关键性话题。
“东数西算”工程对“数据要素×”行动及国家算力建设的影响
2022年2月,“东数西算”工程正式全面启动。这里的“数”是指数据,“算”是指算力,即对数据集的处理能力。其将东部密集的算力需求有序引导到西部,使数据要素跨域流动,织就全国算力“一张网”。在缓解东部能源紧张问题的同时,给西部发展开辟新路。在数字中国加速发展的背景下,“东数西算”工程将会对数字基础设施布局、西部数字产业发展、国家算力体系建设以及“数据要素×”行动产生哪些影响?这无疑值得关注。
对全国数字基础设施均衡布局的影响。数字基础设施是数字中国和网络强国建设的重要支撑。在“十四五”规划中,国家对未来信息基础设施建设作出了一系列重要部署。其总体目标是,围绕强化数字转型、智能升级、融合创新支撑,布局建设信息基础设施、融合基础设施、创新基础设施等新型基础设施。在建设重点方面,除了强调要加快5G网络规模化部署,扩容骨干网互联节点,加快互联网协议第六版(IPv6)商用部署,推动物联网全面发展等,特别提出要加快构建全国一体化大数据中心体系,强化算力统筹智能调度,建设若干国家枢纽节点和大数据中心集群,建设E级和10E级超级计算中心。实施“东数西算”工程,实际上就是在落实国家“十四五”规划中有关构建全国一体化大数据中心体系、强化算力统筹的重大战略部署。而这一部署的重要意义在于使以数字化为代表的新型基础设施布局更加合理——通过在西部相对落后地区部署为东部计算服务的算力枢纽节点和大型数据中心集群,实现国内地区间数字基础设施的相对平衡。按照“东数西算”工程,将在全国建设8个国家算力枢纽节点,其中5个集中在西部地区,具体有成渝枢纽、内蒙古枢纽、贵州枢纽、甘肃枢纽、宁夏枢纽。随着这些算力枢纽建成并投入运营,必将从整体上改变以往数字基础设施较多集中在东部经济发达地区的格局,对于平衡数字基础设施布局、促进数字经济发展具有长远战略意义。
对西部数字产业发展的影响。算力枢纽节点和一体化数据中心集群建设面临的一个重要问题是对电能的巨大消耗。我国东部地区虽然经济发达,但资源禀赋并不占优势,能源短缺是不容忽视的问题。相比之下,我国中西部地区资源禀赋相对较好,有较为丰富的资源储备,在能源供给方面一直扮演着重要角色。例如,“西电东送”工程的实施极大地缓解了我国东部地区的能源压力。另外,我国的西北地区气温相对较低,在数据中心集群建设运营方面具有明显的气候优势。过去的若干年间,我国西部一些地区利用自身的优势,已经在云基地、大数据中心建设方面进行了有益探索,并积累了丰富经验。其中进入国家“东数西算”战略布局的贵州枢纽的贵安数据中心集群和宁夏枢纽的中卫数据中心集群,就是很好的范例。
贵阳是我国最早发展大数据产业的西部城市之一。贵阳具有发展数据产业得天独厚的优势,冬暖夏凉的气候条件和丰富的煤电、水电资源,加上中央政策的扶持,贵阳的大数据产业快速发展,并产生了越来越大的影响。贵安数据中心集群把促进云网边一体化融合发展、推动算力高质量供给作为重点,优化国家级互联网骨干直联点、国际互联网数据专用通道、贵州省根服务器镜像节点和国家顶级域名节点,推进与其他7个算力枢纽节点的直连网络建设,大幅度提高网络带宽、降低网络延时,推动基础设施云、平台云、软件云建设,实现云边高效协同,提升各行业各领域用户的使用体验感。
宁夏枢纽的中卫数据中心集群所在地中卫市,早在2014年就开始云基地建设,先后吸引了一批知名互联网企业进入,如亚马逊、华为、阿里巴巴、腾讯、360、中国联通等。中卫拥有建设云基地的独特优势:整体气候比较寒冷,且拥有充足的煤电、风电,以及全国最大的光伏发电基地,可以进一步降低数据中心集群的运行成本。随着中卫云基地建设不断推进,一大批国内外优秀信息技术企业落户中卫,形成囊括互联网企业、电商巨头、IT领域、信息服务业等行业的智慧产业集群。据测算,中卫云基地正式建成后每年可实现销售收入100亿元,并同时带动数字经济的发展。
对“数据要素×”行动的影响。建设现代化产业体系,加快建设制造强国、质量强国、航天强国、交通强国、网络强国等,都离不开“数据要素×”行动和算力体系建设的支持。就算力体系建设而言,2021年5月印发的《全国一体化大数据中心协同创新体系算力枢纽实施方案》明确提出,构建数据中心、云计算、大数据一体化的新型算力网络体系,促进数据要素流通应用。这里的一体化主要将围绕五个方面展开:集群数据中心直联的网络一体化、双碳目标的能源一体化、各行业数据中心的算力一体化、数据开放共享的数据一体化以及智慧城市、重点应用领域的应用一体化。可以设想,未来全国一体化算力网形成后,可以有效解决东部经济发达地区算力不足的难题。就赋能“数据要素×”行动而言,“东数西算”工程通过构建以西部地区为主体的国家算力枢纽节点和数据中心集群,不仅可以促进全国一体化算力网形成,而且可以推动“数据要素×”行动实施,助力打造中国数字经济新优势。
一是推动工业互联网和智能制造迈上新台阶。在人工智能广泛应用的背景下,工业互联网与人工智能融合发展的趋势更加明显,而智能制造无疑是这种融合发展重要的应用场景。从工业互联网、人工智能融合发展与算力供给的关系来看,对算力的需求会越来越旺盛,要求也会越来越高。在企业内部,工业互联网平台汇聚内部算力资源、构建算力资源池,针对不同时段、不同用户和不同级别的算力需求,通过大数据分析统筹使用内部设备,提高设备使用效率和智能制造的水平;在企业外部,工业互联网平台对接各类算力供应商,通过租借、购买等方式,补充企业内部算力的不足,以提升整体算力水平,缩小人工智能应用需求和实际算力之间的差距。可以预见,“东数西算”工程的实施将为工业互联网和人工智能的融合发展提供强大的算力支撑。
二是赋能传统产业转型升级。算力作为新质生产力的重要代表之一,其作用的发挥直接影响着数字经济的发展速度和社会智能化的发展高度。而以新型基础设施为支撑的“东数西算”工程,面向高速运转的数字经济,加快推进的数字产业化与产业数字化,以及全社会不断增长的算力需求,完全有可能在推动数字经济与实体经济深度融合发展方面发挥重要作用。可以设想,随着“东数西算”工程的落地实施,以网络为根基,以算力为中心,网、云、数、智、链等要素互融互通的一体化算力网络将逐步呈现。
三是为加快城市数字化转型和可持续发展提供算力支撑。近年来我国智慧城市建设加速推进,城市运行、管理和可持续发展成为重要议题。随着城市大脑、5G、大数据、云服务、物联网、区块链等新技术的应用,智慧城市对算力的需求大增。但受区位、气候、能源等多重因素的影响,数据中心小而散的问题比较突出。“东数西算”工程的启动、“数据要素×”行动的推进以及全国一体化算力网的建设,将在很大程度上满足智慧城市对算力的需求,也会涌现出更多的算力供应商和算力交易平台,探索出更加健全的算力租赁、交易、托管等新型服务模式,更好助力智慧城市建设。
四是为消费互联网的拓展提供算力保障。与工业互联网不同,消费互联网主要是面对消费者个人的互联网服务,其主要特点是以个人用户为中心,以日常生活应用为服务场景,满足消费者在互联网中的消费需求,如出行、购物、旅游、娱乐、医疗健康、教育培训、社交等。消费互联网之所以能够在短时间内飞速发展,与其依托于强大的信息与数据处理能力,以及多样化的移动终端,在电子商务、交通出行、医疗教育、金融服务、文化娱乐、休闲旅游、社交网络、搜索引擎等行业形成规模化发展态势和完整的产业链条是分不开的。未来这方面的拓展空间依然很大。“东数西算”工程的实施以及“数据要素×”行动的推进,特别是大数据一体化的新型算力网络体系的构建,将会对不同区域、不同行业的数据资源进行有效整合,从而最大限度发挥枢纽数据集群的功能,进一步降低算力成本,更好地为以民生服务为主要使命的消费互联网赋能。
破解“东数西算”工程推进的难点,为“数据要素×”行动提供保障
“东数西算”工程在推进的过程中会遇到诸多难题,需要我们认真加以解决,这样才能为“数据要素×”行动提供算力保障。比如,“东数西算”工程的主要目标是建设算力枢纽节点和数据中心集群,进而实现数据集群间的直联,形成全国一体化算力网。这意味着全国8个数据中心集群要率先实现互联互通,推动各行业数据中心的算力一体化、数据开放共享的数据一体化、重点应用领域的应用一体化以及实现“双碳”目标的能源一体化。而当前这一目标的实现,仍面临着一些约束。由此,就需要形成新的建设思路或者打造新的模式。
有效整合现有数据中心。“东数西算”工程的重要目标是通过构建国家数据枢纽集群,对各类数据中心进行必要的整合,最终形成全国一体化算力网。过去这些年,随着数字化进程的加快,各个地区、行业已经建设了大量的数据中心,并形成了相当规模的云服务能力,对数字化发展起到了重要的支撑作用。比如,北京抢占数字新赛道,加快算力基础设施建设,目前已形成1.2万P的算力供给规模,包括通用算力、智能算力和超算算力。但如何防止重复建设、浪费等,仍然是不容忽视的问题。资料显示,目前全国31个省市自治区都已建起了大数据中心,许多地市甚至一些县区也在推进大数据中心建设。但从机柜上架率看,一线大城市机柜上架率相对较高,大体在50%左右,而三四线城市机柜上架率在10%—20%左右,存在资源浪费问题。由此可知,“东数西算”工程在实施过程中,应加大对已有数据中心的整合利用,避免出现重复建设和浪费问题。
降低算力成本。数据中心维持运行需要消耗大量能源。有调研显示,2018年,全国数据中心总耗电量1500亿千瓦时,达到了社会总用电量的2.19%。预计到2025年,占比将增加一倍,达到4.05%。作为国家战略工程,“东数西算”工程具有平衡数据中心运行能源消耗的功能作用,但在具体实践中,如何发挥好这一优势,还有许多问题需要解决。例如,西部地区的5个枢纽、6个数据中心集群所处的区位不同,能源生产成本有较大差异,能源的消耗量也会有所不同,如何平衡不同数据中心集群之间的算力成本,实现“双碳”目标下的能源一体化,需要提前谋划。
更好发挥市场的力量。“东数西算”工程应坚持以应用为导向的建设方针,对于国家重点应用领域的算力需求,要优先予以保障。在消费互联网发展大潮中,由于市场作用发挥得比较充分,涌现出了诸多具有国际影响力的民营企业,如华为、阿里巴巴、腾讯、百度、京东、字节跳动等。这说明,在数字化领域,市场力量是非常关键的,地方政府只有找准自身的角色定位,正确处理政府作用和市场驱动的关系,充分发挥市场在资源配置、应用创新、需求牵引中的关键作用,才能保障算力行业的健康发展。同时,面对全社会各行业对算力的巨大需求,地方政府要保持冷静头脑,以满足算力应用需求为导向,在实践中创造新的发展。
(作者为中共中央党校(国家行政学院)教授、博导,第三、第四届国家信息化专家咨询委员会委员)
【注:本文系2022年国家社科重点项目“完善互联网领导和管理体制研究”(项目编号:22AZD066)阶段性成果】
【参考文献】
①《首次全国数据工作会议:加快全国一体化算力网建设》,中国新闻网,2024年4月2日。