当房子越建越高时,就需要回头看地基是不是坚实。中国科学院院士、北京大学教授张平文团队最近在做一件事——给人工智能“大厦”夯基,即为人工智能机器学习中常用的数学符号提供一个通用标准。
人工智能作为一个高度交叉而又发展迅猛的学科,吸引了来自数学、物理、化学、生物甚至人文社科等不同领域的众多研究人员参与其中。对于不同学科的研究人员来说,一个现实的问题就是如何消除信息鸿沟。统一数学符号等基础性工作,看似简单,却是人工智能长远发展的“地基”。
“目前,人工智能的数理基础还不成熟,但这也为广大青年学者提供了更多创新机会。”在日前举办的2020北京智源大会上,张平文等专家围绕人工智能下一个十年发展面临的重大问题进行交流探讨,呼吁加强人工智能数理基础等相关研究。
有望催生新的研究方向
中国科学院院士、清华大学教授张钹认为,第一代人工智能靠知识驱动,第二代人工智能靠数据驱动,目前进入第三代人工智能发展期,主要靠认知驱动。“认知驱动中,深度学习研究尤为重要,发展前景广阔,但仍需加强理论和方法等基础性工作。”
张平文也认为,机器学习等深度学习理论是当前人工智能数理基础研究的热门方向之一。虽然在此次人工智能浪潮中,深度学习理论表现良好,但研究人员还不能解决它的可解释性问题。
事实上,可解释性、可计算性、泛化性、稳定性等正是人工智能未来发展面临的重大理论挑战。例如可解释性,“分两个层面,一是从数学算法的角度解释,二是从数学模型的角度解释机器学习的问题。这些基础性工作都有待深入研究。”张平文说。
“机器学习是从数据中挖掘出有价值的信息。数据本身是无意识的,不能自动呈现有用的信息。”北京大学长聘教授张志华说,“怎样才能找出有价值的信息?首先要给数据一个抽象的表示,然后进行建模,再进行计算。”
“机器学习想要实现的是从数据到决策到预测的过程,这意味着很多新问题会出现,而这些新问题都有赖于通过加强算法、模型等数理基础研究来解决。”张平文表示,数理基础研究无法在短时间内实现,需要开展大量工作。
反过来,“人工智能数理基础研究对数学发展也非常重要,研究界期待未来可以产生类似于概率论的新的研究方向。虽然短时间内不太可能实现,但仍有这种可能性。”张平文说。
为此,张平文鼓励广大青年学者投身人工智能数理基础研究,“数理基础研究别具活力,希望通过大家的努力使它趋于成熟,产生更多原创性成果”。
从应用出发定夯基计划
人工智能数理基础研究涉及数学、概率统计、计算机理论等众多学科,不同学科、不同研究方向使用的数学记号和表述不尽相同。看起来相去甚远的两个记号,可能表达的是同一个概念;在一个学科已经公认的优美、简单的记号,在另一个学科或许还需被重现发现、重新定义,而新定义的记号很可能远不如已有的记号方便。
这给新进入该领域的科研人员和工程人员造成了不少麻烦。北京大学教授李铁军说:“机器学习的普及,迫切需要制定一套统一的数学记号。这将大大减轻研究人员在不同符号体系间反复切换的工作量。”
为人工智能研究提供一套统一的符号标准,这项基础工作“增强了不同领域研究人员的互相理解。研究人员在看其他领域成果的时候,也更容易看懂”。张平文呼吁研究人员在科研中尽量采用同一套符号标准来交流、写论文,并为完善符号标准而努力。
也就是说,基础研究要与应用结合起来。“开展人工智能研究不能凭空想象,必须了解实际问题,考虑实际应用需要。”张平文说。
北卡罗来纳大学教堂山分校终身教授朱宏图对此表示认同。他说:“人工智能领域的研究应该从应用角度出发。”
“人工智能的核心是如何利用收集的数据来为用户创造价值,提高用户满意度。”朱宏图认为,随着收集数据的方法越来越多、频率越来越高,为用户提供相应的方案也会越来越多。“这为人工智能研究带来了新机遇。”
朱宏图表示,从研究需要出发,为用户提供更好的方案和服务环境,也需要加强算法、模型等数理基础研究。
“人工智能数理基础研究,一方面要强调它与应用的连接,另一方面也应该基于数学本身的基本问题开展研究。”李铁军认为,虽然数理基础研究当下可能跟应用联系并不紧密,但有可能提供一些最基本的数学语言,深化人类对人工智能数学结构的认识。
实践是检验合作实效的“金钥匙”
夯实人工智能“大厦”,加强数理基础研究,“主要有两条路,一是从高维空间走向低维空间,二是从低维空间走向高维空间,但无论哪条路都存在困难。”张平文说,不管走哪条路,都需要加强学术界与产业界及不同领域间的交流。
与会专家认为,一直以来,产业界与研究界的信息鸿沟制约着数理基础研究的进度。产业界拥有研究界缺乏的大数据,而产业界欠缺研究界对实际应用背后的科学认识。
朱宏图同时还担任滴滴出行公司的首席统计学家。他表示,人工智能领域相关研究,数据在其中起着越来越重要的作用。企业积累了丰富的数据,这是人工智能研究的重要基础。
目前,在张平文等业内人士的努力下,北京智源人工智能研究院已设立“人工智能数理基础”重大研究方向,联合全国相关科研院所和产业界人士,致力于打破基于计算机实验和神经科学的人工智能的惯用建模范式,以可解释性的新型人工智能模型、新型机器学习算法、深度学习的基础研究等为研究内容,建立以数学与统计理论为数理基础的新一代人工智能方法论。
香港浸会大学兼职教授季春霖认为,研究将会面临挑战。他举例说,在材料设计中,机器学习提供了新方法,但既有机器学习模型并不能直接拿来用,还需要把机器学习的模型和材料物理的模型结合起来。
在他看来,人工智能数理基础研究需要产业界和研究院所合作。这样的合作将为行业发展创造更大空间,而实践必将成为检验合作实效的一把“金钥匙”。 (见习记者 田瑞颖 记者 郑金武)