在不改造原有系统的情况下,把信息系统彼此连接,实现不同数据的共通共融
打破信息孤岛是一个世界难题。
随着信息技术20多年的网络化发展,新需求不断产生、技术不断演进和升级换代,再加上其他人为的因素,越来越多的信息系统成为孤岛。这给信息共享和数据的深度挖掘带来诸多不便,也让信息化发展面临阻碍。
在不改造原有系统的情况下,把信息系统彼此连接,既能维持原有系统的稳定和安全,又能让连接信息孤岛的成本大大降低,实现不同数据的共通共融——这是北京大学梅宏院士和黄罡教授团队“云—端融合项目”的研究思路,该成果荣获“2018年度国家技术发明奖一等奖”。
这一项目被同行誉为“颠覆式重大发明和创新”。
成果获专利普通(非排他)许可费9500万元,创下中国高校信息领域之最。其研发的“燕云”平台,在政府数据开放共享、互联网+政务服务、政务信息系统整合共享等领域均发挥了重大作用。
更为重要的,该成果突破了国际上传统的通过中间件实现信息系统连接的思路,另辟蹊径、自主创新,这也是我国科学家在信息领域摆脱“路径依赖”,完成从跟随到原始创新跨越的一个成功案例。
从“白盒”到“黑盒”,不仅是颜色的变化
推动技术融合、业务融合、数据融合,打通信息壁垒,形成数据共享大平台,构建全国信息资源共享体系,这是通过大数据提升国家治理现代化水平的必然要求。
但是,如何打通信息壁垒,让数据真正融合起来,形成数据共享的大平台,对于我国信息领域的工作者来说,是任务,也是难题。
“这工作就像‘老城改造’”,在北京大学理科一号楼信息科学技术学院办公室内,梅宏院士用一个简单的类比给记者做解释,“就像把各种来自不同厂商的电器连接起来。”尽管过去几年已先后担任上海交通大学和北京理工大学的行政职务,在北大学习工作多年的梅宏依旧与北大的核心研究团队保持紧密联系,“云—端融合项目”的研究也是在这里持续推进。
按照国际传统思路,要先做一个采用某种“插座”标准的“接线板”(即中间件),同时公布一个接口标准,随后各自的系统按照标准进行内部改造,从而形成连接,这种思路也被喻为“白盒”思路。按此思路,每一个系统的二次开发、二次改造,工作量很大,改造过程中也可能引入新的错误或安全风险。
与之不同,梅宏—黄罡团队采取了另一种思路——不变动原有系统,通过客户端驱动的软件资源反射机制自动重构系统体系结构和数据访问接口,从而实现连通。就像一个城市拟新建地铁,不再需要开膛破肚地把马路挖开,影响沿线工作和生活,而是采用“盾构机”,在隧道中掘进的同时,铺设好地下管道,然后实现城市交通各集散点的地铁连通。
这是效率的重大跨越!也被喻为“黑盒”思路。
这种此前国际上从未有过的新思路,最终成为在大数据时代解决数据共享问题的利器,通过“黑盒”方法,数据开放效率平均提升两个数量级。这意味着,运用该项技术,连接信息孤岛的成本降为原来的1%。
以“电子政务”建设为例,过去建设过程中要完成所有政务数据的共享融合,需要以“白盒”方式连接原有的政务信息系统,这就需要协调整合不同部门、不同系统以及不同系统的开发商,工作量庞大。但使用“黑盒”技术,仅需获得某系统的合法访问权限,就可以重建这个系统的数据访问接口,省去了协调、改造等诸多繁复的程序。
这是一次了不起的变革和提升!
坚持原始创新,坚持做有用的研究
“黑盒”技术是整个团队“十年磨一剑”的产物。
“最开始,只是出于好奇”。相关研究从2007年就已起步,但当时还停留于被动跟随国际上主流的“白盒”思路。日复一日,由于“白盒”方式的庞杂与繁琐,让梅宏渐渐对“黑盒”思路萌发了兴趣,这也是“无心插柳”的第一步。
“日后回想,这种‘无心插柳柳成荫’的结果是符合科研基本规律的。”谈及科研的原动力,梅宏有感而发:“目的性”很强的研究往往难以实现重大原始创新,多只在前人成果的基础上实现一定程度的改良。这给我们带来一个启示,要淡化功利、淡化目的性,要大胆想象,要敢于跳出思维的束缚,努力摆脱“路径依赖”。
当然,即便是“无心插柳”,也不能仅靠灵光一闪。思路的转变意味着科研方向的整体转变。在梅宏看来,“想到”与“做到”有着同等重要的意义。
“黑盒”技术的门槛很高,但不是不可为,实现的前提是要对计算机系统运行原理及其软件栈都很熟悉,这就要求团队真得“做到”。
经过反复探索、实验,“想到”也“做到”了。但让团队始料未及的是,技术推广应用又成为难题。
团队曾做了很多尝试。一开始试图将技术用在软件系统使用培训方面,通过把操作软件系统的轨迹记录下来,以后通过回放,帮助人们学习使用新软件。后来又做过异构云的统一管理,通过体系结构恢复和接口重建,把采用不同厂商的云管理平台构建的数据中心连通起来,实现统一的资源管理和调度。还做过对已有信息系统针对移动终端、桌面等不同终端设备的用户界面适配。
这些早期的技术应用效果虽然很好,但最终都因为没有足够大的市场而告一段落。对此,梅宏很理智,也很淡然,“技术大规模应用,必须有合适的应用场景,着眼于解决实际问题。”
后来,大数据热潮带来的数据共享开放需求为这一项目带来了市场前景,“大数据时代,只有多元的数据相互碰撞,才能产生最大的价值。” 这是梅宏对“大数据”内涵的理解。特别是政务数据共享开放为技术成果应用提供了时代机遇。到目前为止,该技术已打通国家部委、各省市6000多个信息孤岛,为政务信息系统的互联互通和数据共享提供了高效支撑。从四川崇州的综合执法到贵州的精准扶贫,从浙江的“最多跑一次”到贵州的“万企融合”,大数据的应用场景越来越广泛,打破信息孤岛的数据互操作技术的地位也日益凸显。
“在技术学科,我们要做有用的研究”,这是团队一直坚持的理念。“技术学科做科研的目的应该是帮助人类解决问题。而现在一些科研项目的成果却只看重论文。论文只是成果的一种表现形式,而不该是根本。”科研评价标准的优化、学术风气的端正,是根植梅宏内心的期望。
“万物数字化、万物互联的时代正在开启。”梅宏表示,随着信息技术的不断发展和信息化的不断深入,未来将形成人—机—物连接、融合的世界。数据量将持续保持高速增长,大数据带来的新的科研命题也将不断出现。
在师道传承中抓住机遇
梅宏是一个传承者。
这次获奖的团队传承于杨芙清院士在北京大学创建的软件团队,作为杨院士的学生,梅宏说自己一个很重要的责任就是把老师开创的事业传承下去并发扬光大。
杨芙清院士是我国软件学科的奠基人之一,几十年的努力让北大软件学科在国内奠定了学术地位,更重要的是培养了一支很强的科研队伍。上世纪90年代后期,在杨院士主持的国家重点科技攻关项目青鸟工程中,梅宏跟着老师做操作系统与软件工程领域的研究,并开始接触信息系统的互操作问题。随着黄罡、张颖、刘譞哲等青年才俊的陆续加入,团队逐渐壮大。
不仅是计算机事业,杨芙清质疑、开放、平等的教育观念也深深影响了梅宏。对于培养学生,经过几十年教学实践,梅宏逐渐形成了自己的方法。
因材施教,是梅宏在育人过程中的首要坚持。当前社会发展变化快,学生面临的选择也日益多元。要启发和帮助学生明确自身潜能和兴趣所在,进而朝目标踏实前行、奋发向上。本着这样的原则,梅宏并不会要求学生全部致力于高精尖的学术研究,而是根据每个学生的不同特点差异化培养,在平等融洽的师生关系中尊重学生天性,鼓励学生进步。
与此同时,梅宏还鼓励学生大胆质疑、发表不同学术意见。在与学生交流的过程中,就一个学术观点,学生与他争得面红耳赤的现象十分常见。“一个方法,一个观点,即使别人已经提出过、论证过,我们也要带着疑问去看。我一直强调批判性思维,如果学生不能、不敢质疑我,就无法取得进步。”质疑、平等、开放的教育态度,是梅宏一直坚持的,也是杨芙清院士一直强调的。
在梅宏看来,老师的责任,就是要营造一个让学生茁壮成长的环境。好的环境、好的土壤,才能最终成就“颠覆式发明和创新”。