智能化国际关系研究的发展创新
来源:中国社会科学报 更新时间:2023-08-10


当前,伴随大数据、人工智能等先进技术的创新应用,国际关系研究正朝向以“高密度数据”和“智能化计算”为核心的“第四范式”迈进。但是,这种革新进程却面临数据和计算两方面基础公共产品短缺的难题。近年来,国内一批高校纷纷创建了国际关系实验室,本文基于对外经济贸易大学国家安全计算实验室的经验,展示其作为一家基于大数据、人工智能技术,为国际关系研究提供新时代基础公共产品的数字平台,希望从数据供应和计算供应两方面推动智能化国际关系研究。

研究变革推动实验室发展

在先进数字技术广泛应用的背景下,国际关系研究的变革趋势突出表现在以下几个方面。其一,研究素材发生巨大转变。相比于传统深入文献、借助理论指导局势判断和政策制定的国际关系研究,智能化国际关系研究正在通过对海量数据分析打开“上帝视角”,寻找潜藏在嘈杂混乱数据之下的复杂关系和发展趋势,能够进行更加精确、更加科学的政策指导。其二,研究方法出现新的变革。传统研究主要以理论推导、因果假设、现状描述为根本,而智能化国际关系研究则能够通过来自计算机科学、基础数学、数理统计等方面的计算模型探索海量数据之间的相关性、相似性、关联性和共线性等特征,为国际问题探索开辟新的研究路径。其三,研究工具更加智能高效。从网络数据抓取、信息传感器数据收集,到数据清洗、降维分析,以及计算模型的预训练和算法封装等,国际关系研究的工具逐渐智能化、简便化,正在推动国际关系研究朝向科学化、工程化发展。

然而,当前这些变革在很大程度上还处于畅想阶段,尤其对于多数国际关系学者而言,获取海量数据、构建对应分析模型仍是其研究过程中难以逾越的障碍。换句话说,当前主流国际关系研究仍然没有真正进入以智能化或半智能化为主的大数据时代。

首先,数据获取和阅读难题没有解决。一方面,数据获取包括针对不同网页编写不同种类的网络爬虫程序、维护各类爬虫程序的功能以及对获取的海量数据进行降噪、降维等。这些操作不仅要求较为专业的技术能力,同时还需要付出大量的时间和精力,对于多数国际关系学者而言,都是一件极为困难且枯燥的事情。另一方面,面对海量不同语种的数据内容,虽然当前有各种辅助翻译工具,但对于多数只掌握一到两种语言的学者而言,仍然面临无法对数据进行高效阅读和准确分析的问题。

其次,数据分析与计算仍然困难重重。在传统国际关系研究中,不仅缺乏既懂国际关系又懂数据建模的交叉型人才,同时现有计算模型都是建立在计算机科学、数理统计等学科基础上,存在基础算法模型粗糙、适配国际问题研究的预训练模型较少等问题。这导致算法模型构建和复用能力较低,多数国际关系学者难以应用现有计算模型。另外,处理海量数据内容对相应的算力也提出了更高的要求,不仅需要大容量存储设备,同时还需要高性能的计算设备。

简言之,在当前国际关系研究迈向智能化或半智能化的进程中,数据问题和计算问题已经到了不得不解决的关键节点。

数据供应方案打破技术障碍

放眼未来,数据供应和计算模型必将成为智能化国际关系研究的基础公共产品,而解决数据难题和计算难题将成为当前以及接下来一段时间国际关系研究的重要议题。在当前国际关系研究新旧范式分化的节点上,对于智能化国际关系研究面临的数据难题,对外经济贸易大学国家安全计算实验室正在构建两类数据库资源:通用型数据库和垂直型数据库。

实验室认为,当前采用人工智能技术对海量数据进行摘录、编码的数据库已经超越了传统人工采集、手动编码数据库,是适应当前大数据、人工智能时代的新型滚动更新型数据库。虽然建设这类数据库对技术和软硬件的要求都较高,数据获取和存储也有一定的门槛,但可以想象,为应对未来海量数据的挑战、寻找国际关系领域繁杂信息中的潜在运转规律、探索更加精准且贴切的政策方案,这种数据库将伴随着技术的更新和普及而逐渐增多,成为包括国际关系研究在内的整体社会科学研究的新型基础公共产品。

在此理念下,实验室首先建立了一个针对全球新闻、智库进行自动抓取,自动提取关键信息,自动编码的通用型数据库。该数据库目前已经针对全球各国主流新闻网站的国际政治板块、国际关系智库网站以及主流社交媒体平台,部署了近1000个网络爬虫程序,时刻抓取各种最新的数据信息;每天抓取全球数据达10万—15万条,基本能做到时差在一个小时之内的即时更新。并且,该数据库还部署了相应的文本翻译功能,能够翻译全球42种主流语种,为相关研究人员的数据阅读和信息提取难题提供相应的解决方案。未来该数据库将继续扩充爬虫队列,计划将各国政府网站、国际组织和非政府组织官方网站的数据一并进行抓取,试图将此数据库打造成一个能时刻感知全球态势发展、辅助政策决策分析的通用型数据公共产品。

另外,实验室还建设有垂直型数据库。随着先进智能武器在全球军事领域的广泛应用,无人机已经逐步颠覆传统战争形态,无人机参战方式和应用态势将影响国家安全和军事战略布局,成为国家军事发展和研究的重要问题。为此,实验室首先采用人工方式对全球无人机军事应用事件进行编码标注,形成固定的数据库格式,然后采用机器学习的方式对大数据库中的相关事件进行文本识别和信息提取,构建专注于无人机军事应用的专有数据库。

计算供应方案助力学科创新

纵观历史,新技术的产生和应用是推动学科创新和范式突破的重要驱动力,而真正将先进技术应用集成化、简单化,形成科研创新的基础公共产品,才能打破对应阶段学科研究的障壁,实现突破性创新。面对智能化国际关系研究的计算难题,实验室试图从人才培养、计算供应两方面提供解决方案。

首先,加强相关数理统计和算法编程方面的人才培养。该方式和当前国内其他学术团队的发展思路不谋而合,要想真正推进智能化国际关系研究,除了吸引其他具有数理统计优势的学科人才以外,还应当在本学科领域加强培养、推动交叉型人才建设,只有进入该领域的人才数量不断增加、人才规模不断壮大,才能真正实现智能化国际关系研究范式的突破。

其次,加速集成相关数理统计方法,实现模型的可复用性、可理解性、标准化以及简洁化。相比于人才培养需要付出的巨大成本,集成计算方法不失为一种更加行之有效的思路。或许对于大多数无法真正掌握数理统计的国际关系学者而言,与其直面数理难题,不如绕过艰难学习阶段,直接应用集成算法系统来展开相关大数据研究。这不仅能够填补相应研究的“技术鸿沟”,而且也能带动更多学者加入智能化国际关系研究行列。目前,实验室已经开发了文本分析、视频分析、人脸面部微表情识别等计算模型,只需要简单的输入、输出操作,即可提取相应的计算结果;已经达到将复杂分析留给机器,研究人员只需要基于自身的专业知识对结果进行分析、解释的程度。同时,实验室正在开发一套包括机器学习、文本分析、社会网络分析、地理空间分析、双重差分模型、时间序列分析等在内的算法集成平台,并为这套集成算法平台提供充足的算力支撑,致力于将这些算法模型简单化和可复用化,为国际关系领域的智能化研究提供基本计算支撑。

总而言之,当技术创新和应用在一定程度上简化操作难度并赋能学术研究时,新技术将不再是研究障碍,反而会成为一种工具,助推学术研究进入新阶段。面对国际关系研究迈向“第四范式”的转型难题,实验室正在从数据和计算两方面为国际关系研究构建智能化时代的基础公共产品,消除传统因技术障碍而造成的不同学者之间的“技术鸿沟”,推动国际关系研究实现下一阶段的重大创新。

(作者系对外经济贸易大学国际关系学院教授;对外经济贸易大学国际关系学院博士研究生)