2009年全球爆发甲型H1N1流感,美国专业的公共卫生机构疾病控制中心在工作效率上输给了民用商业企业谷歌。究其缘由,疾控中心在统计疫情传播的起源和渠道时,使用的是传统的数据反馈方式,由于人们可能患病多日实在受不了才会去医院,而且信息传回疾控中心也需要时间,获得的信息比疫情的真实传播速度整整滞后了两周;而谷歌公司通过美国人在网上检索的海量词条,总共处理了4.5亿个不同的数字模型,构建疫情的大数据库,并基于此,迅速且成功地判断出甲流传播的途径和趋势,为官方提供了及时有效的数据。
这是1月24日黄河水利科学研究院杨勇博士在黄河科研信息化工作座谈会上向大家谈到的生动实例。该座谈会由黄科院总工程师姜乃迁博士主持,旨在探讨治黄科研与信息化深度融合的途径,为开创科技治黄新局面集思广益。
自然~生态环境~经济社会三者耦合
“信息化不是新的概念,现在又被赋予了更为丰富的内容。对于黄科院来说,信息化与科研的融合是我们创新的重点。”黄科院总工姜乃迁开篇明义。他指出,“我们要利用好这个难得的机会,充分加强信息采集、数据共享、数据集成以及成果展示的能力。”
黄河信息化建设的目的,在于支撑流域经济社会可持续发展和河流健康生命维持。信息化建设离不开科研,如何让黄河科研为信息化建设服务,使二者深度融合发展?黄河数学模拟系统首席专家、黄科院科研处处长余欣建议通过提升四种能力,即面向科学研究的数据采集能力、多源数据融合与共享服务能力、多物理场在线仿真计算能力、面向公众的成果表达能力,进而实现河流自然~生态环境~经济社会的三场耦合,支撑重大治黄决策。
“数学模型”建设是黄河信息化的重要内容之一,如何在“数学模型”建设中融入耦合理念?“数学模型”课题组的夏润亮博士提出:“要进一步提高多物理场仿真计算能力,在多方程联立求解效率和计算资源间做出平衡。”为此,需要提供更强大的计算资源,加强超级计算平台建设,研究开展黄河云计算管理和服务平台建设。
建设黄河科研物联网
数据是科研的根本,高精度的及时数据可以为科研提供更广泛时空尺度的研究领域。因此,提高面向科学研究的数据采集能力就显得尤为重要,建设黄河科研物联网是与会专家的共识。
“物理实体模型太需要信息化的支持了。很多试验的关键环节因为数据采集不足而无法进行,比如当异重流的流量小于0.02立方米每秒时,仪器就不能读出数据,明明看到水在流,但仪器显示为零流量。”小浪底研究中心主任郜国明说。试验人员每次在占地1.1万平方米的小浪底库区模型上做放水试验,都要消耗大量的人力物力,但关键的异重流放水过程却很短暂,且现有测量仪器很难提供精确的观测数据。
黄河模型厅冬天寒冷、夏天闷热,科研人员每次做试验都苦不堪言。如何借用高精度、高感知的仪器自动采集试验数据,将科研人员从恶劣的工作环境中解放出来,提高工作效率?
专家认为,要借助黄河科研物联网来解决。该物联网可分两个层面,在感知层引进高精度、高感知的试验测量传感仪器,进而提供更为广泛的时空尺度、更加精确稳定的数据;在网络层搭建黄河科研的光纤高速公路,及时将一线观测的数据传输到科研人员手中,实现办公室、试验场地、高性能计算的互通互联。
实现多源数据融合与共享
资源共享是大家谈论最为热烈的话题,信息孤岛也成了频繁出现的名词。科研人员一致认为,目前黄河科研资料共享难以实现的症结在于缺乏统一的数据平台。科研需要数据,数据难以共享,科研人员不得不陷入无尽的重复劳动中,严重影响科研效率。
引黄灌溉中心总工姜丙洲提出,解决资源共享问题首先要树立融合和共享的理念,在黄委层面统一采集标准和处理方法,对模型设计和编码方法进行标准化。
“共享的前提是保护合理的利益,同时要注意信息内容的分类界定,保密不能忘。”“数字黄河”工程首席专家、黄委数字办主任寇怀忠说。
在共享能力建设上,多位专家提出建设统一的信息资源整合共享平台,构建面向水利科研的数据库。实际上就是建立一个数据的索引和资源的平台,便于数据的检索、查看、管理及长期保存,让科研人员既是数据的提供者,又是数据的享用者,打破信息孤岛的壁垒。
在数据存储和服务方面,专家建议用云存储实现存储虚拟化,为科研人员提供跨服务器级的文件存储服务。一线科研人员不必时刻奔波在试验场地和数据处理场所,可以直接将数据保存到云端服务器中,也可以从各种服务终端及时下载所需数据。“数学模型”课题组的王敏谈到:“我们不能再用做项目的思维去搞信息化。项目一旦通过验收就被高高挂起,这种思想已经远远跟不上时代的步伐。我们要针对数据进行甄选,让数据为应用服务。”