本报综合外媒报道 一项新研究显示,社交媒体平台应凭借其拥有的资源和影响力,有效识别网络中的种族主义言论。
2月17日,美国密歇根大学官网发文介绍了该校信息学院副教授利比·亨普希尔(Libby Hemphill)参与的一项研究。该研究考察了白人至上种族主义言论与普通言论之间的区别、社交媒体识别白人至上言论时的难点、白人至上主义者是否以及怎样躲避平台检测,并就如何改善针对种族主义言论的自动化识别方法提供建议。
研究人员使用机器学习算法、动态主题建模等方法,分析主流社交媒体平台和极端主义社交媒体平台的数据,发现白人至上言论的几个特征。第一,频繁使用颜色名词(如“白色”)指代不同肤色的种族/族裔人口。第二,将“白色”与其他不会被检测系统标记出来的词语(如“权力”)一起使用。第三,对不文明语言的使用少于社交媒体常见水平,以便躲避基于“冒犯性语言”的检测机制。第四,在主流平台和极端主义平台上表现一致。第五,发布的消息和怨言在多年里始终如一。第六,以种族词汇而非宗教词汇描述犹太人。
研究人员表示,鉴于上述特征以及越发先进的计算机技术、日益丰富的数据,白人至上言论是可识别的。但是,社交媒体平台在这方面仍存在很大缺陷,且难以区分用语文明的种族主义言论与用语不文明但危害性较低的言论。研究人员为平台提供了几点建议:执行自己的规则;使用极端主义网站的数据创建检测模型;寻找特定的语言标志;在识别仇恨言论时,减少对不文明语言的关注;训练仲裁者和算法,使其认识到白人至上言论是危险的。(刘畅/编译)