加快大数据存储技术创新和产业变革
来源:人民邮电报 更新时间:2022-02-15

大数据战略与双碳战略双轮驱动 加快大数据存储技术创新和产业变革
——《“十四五”大数据产业发展规划》解读

2021—2025年是我国国民经济和社会发展第十四个五年规划时期,也是“两个一百年”奋斗目标的历史交汇期,对我国国民经济和社会发展具有重要的意义。在这承前启后的重要时期,各部门都以习近平新时代中国特色社会主义思想为指导,推出“十四五”规划,明确“十四五”期间的发展方向和路径。工信部印发了《“十四五”大数据产业发展规划》,围绕“十四五”时期大数据产业发展的总体要求、主要任务和保障措施作出全面部署。

随着我国信息经济发展,数据作为新型生产要素已经成为重要的战略资源,数据所蕴藏的价值逐渐释放。《“十四五”大数据产业发展规划》明确了充分激发数据要素价值潜能,夯实产业发展基础,构建稳定高效产业链的发展方向,同时提出重点提升数据生成、采集、存储、加工、分析、安全与隐私保护等通用技术水平。“十四五”期间,要加大数据通用技术创新力度,推动数据处理各环节的技术发展,赋能大数据产业,支撑大数据产业蓬勃发展。在数据处理各环节中,数据采集能力的提升、数据生成速度的加快、数据加工分析的多样化都需要强大的数据存储能力做支撑,因此数据存储需求在“十四五”期间将呈现加速增长的态势。只有保证海量数据存储的高效安全,才能加强数据资源整合,提高全要素生产率,支撑我国社会经济数字化建设。在数据存储技术上实现突破,是落实《“十四五”大数据产业发展规划》的关键之一。

数据存储技术创新的驱动力不仅仅来自大数据产业自身发展的需求,节能环保也是数据存储必须达到的目标。以往数据中心所导致的高能耗与高成本等问题很大程度来源于数据存储所消耗的能源。为实现我国双碳目标,数据存储技术也开启了一场浩浩荡荡的绿色革命。国家发展改革委印发了《“十四五”循环经济发展规划》,为“十四五”时期我国循环经济发展提供了指引,对加快促进我国发展方式绿色转型、实现资源高效利用和循环利用、推动碳达峰碳中和具有重要意义。因此,如何兼顾双碳目标和大数据战略,推动数据存储技术变革,成为当前所面临的重要挑战。

优化存储密度和提升性能同样是数据存储系统技术创新的主要方向。《“十四五”大数据产业发展规划》推动数据集约化整合和高效化利用,释放数据红利。集约化整合意味着同样规模的数据要发掘更大的价值。这要求数据必须得到妥善的存储,以便于持续或者反复利用,不断与多源数据进行关联,充分发挥不同类型数据的短期和长期价值。大量的数据需要长期保留,从而数据存储密度成为技术优化的方向。同样,高效化利用意味着大数据计算的效率要进一步提高,对于存储数据的检索和读取速度,将成为计算效率的决定因素之一。因此,提升数据存储在空间利用率和读取效率,可以放大数据效益。

可扩展性也是数据存储技术创新的一个基线要求。数据正以指数级的速度增长,存储系统必须跟上数据增长的速度,需要不断扩展容量。但是,可扩展性并不仅仅是简单地增加存储设备,要考虑到扩充设备对整体系统可靠性的影响,解决“冷”、“热”数据的分级存储、处理多种类型不同大小的文件、查询检索的最优化、元数据管理等很多伴生的问题。只有实现高效、灵活的数据存储可扩展,才能加快《“十四五”大数据产业发展规划》所提到的“大数据容量大、类型多、速度快、精度准、价值高等特性优势转化”,推动大数据产业高质量发展。

综上所述,为了更好地实现《“十四五”大数据产业发展规划》,数据存储领域以下工作将成为重点:

一是明确数据存储技术的发展目标,通过多元化的技术路线形成数据存储体系的顶层设计。充分认识各种数据存储技术的优势和缺点,基于当前数据规模和数据增速预期,针对不同类型数据的访问频次和读写操作特征,选择块存储、文件存储、对象存储技术路线,同时综合考虑规模、成本、能耗、寿命、可靠性、可扩展性等多方面因素,积极探索在保证读取速率的前提下最大程度降低能源消耗的软硬件技术和产品。在架构上,除数据中心外,边缘数据中心、高性能计算中心、智能计算中心等正成为数据存储的重要发力者,构建分层分类的数据存储体系能够提升数据存储安全性、完备性和持久性,为数字经济持续稳定发展提供有力支撑。

二是推动数据存储技术的自主创新。培养基础软硬件的底层支撑能力,用“揭榜挂帅”等方式激励创新,突破瓶颈,实现数据存储核心技术的自主可控。鼓励政府产业基金、创业基金及社会资本积极参与创新项目,培养创新型人才,鼓励有能力的企业参与算法、基础设备及软件的研发,推动自主开源框架、组件和工具的研发,促进前沿领域技术的借鉴和融合,推动大数据技术与新一代信息技术集成,对大数据产业进行深层次的升级改造,夯实产业发展基础,构建稳定高效产业链。

三是形成配套的指标体系,验证和评估数据存储技术与产品的效果。坚持标准先行,明确数据存储系统的核心指标和基线要求,积极开展标准编制工作,并推动标准落地应用。围绕数据存储技术和产品的功能性能、行业应用、节能环保等需求,聚焦低功耗、高性能、可扩展等重点方向,加快关键标准研制。建立标准验证和试点示范流程,培育标准符合性评测服务能力,推动以数据存储标准为重要组成部分的大数据技术标准体系的落地实施。

四是对符合标准的、技术先进的数据存储方案和产品进行示范性应用推广。《“十四五”大数据产业发展规划》明确了适度超前统筹建设新型基础设施;全国一体化大数据中心体系统筹推进,高技术、高算力、高能效、高安全数据中心加快布局建设。适度超前的部署数据中心,必然需要建设数据存储能力,因此,要将经过验证符合标准的、技术先进的数据存储方案和产品率先应用到新型数据中心中。在大数据行业应用方面,工业大数据平台、金融大数据平台等已释放出卓著能效,应积极在数据容量大、类型多、大数据技术应用基础好的消费领域与工业领域推广创新型数据存储技术,发挥示范效应,拉动大数据技术服务更多的行业。

面对世界百年未有之大变局和新一轮科技革命和产业变革深入发展的机遇,我国适时出台的《“十四五”大数据产业发展规划》,开启了大数据产业创新发展新赛道,聚力数据要素多重价值挖掘,抢占了大数据产业发展制高点。各项支撑大数据产业的通用技术应基于面向未来的动向和战略态势研究,统筹发展,系统布局,加强技术、产品和服务协同,全面发力,为打造数字经济发展新优势、建设数字中国奠定坚实的基础。
 作者系北京邮电大学数据科学中心主任