大数据检察以类案为思维方式
来源:检察日报 更新时间:2022-06-27

能否从数据中发现检察办案所需掌握的类案特点或规律,是判断检察大数据成效的真正标准

大数据检察以类案为思维方式

▶ 全国检察机关要以“类案”为切入点,打造数字式“类案监督”,作为以大数据赋能法律监督的核心任务。

▶ 相比于个案监督而言,类案监督是一种既无法割裂又有重大提升的高阶状态。检察机关开展类案监督的技巧在于,针对办案中发现的共性问题,实现促进该类问题一并解决的精准、高效监督,最终达致“办理一案、监督一批、治理一片”的社会治理效能。

“以类案监督为核心”,是最高人民检察院明确数字检察创新发展的要义之一。具体而言,全国检察机关要以“类案”为切入点,打造数字式“类案监督”,作为以大数据赋能法律监督的核心任务。“类案”是其中的关键词,对于探索“大数据+检察监督”(下称“大数据检察”)的重要价值不言而喻。

所谓“类案”,是“同案同判”法律原则中“同案”的近义词。长期以来,人民群众对于“同类案件、同样判决”正义观有着朴素的青睐。学术界作出了“类似案件、类似判决”“同样案件、类似判决”“类似案件、同样判决”“同样情节、同样处理”等理论表达。此等要求系立足个案角度,着眼于个案处理之间的连续性。而自从兴起智慧科技拥抱司法的探索后,法律文书的要素相同、文本相似或条文同引等相关性的新式“类案”说出现,进而丰富发展了既有概念。相应地,基于类案的“类案检索”“类案推送”“类案强制报告”等新事物层出不穷,基于类案处理而成的机器智慧就成为智慧检务、智慧法院各场景的一项基础工作。究其原因,含有类案元素的数据交由机器“学习”,方能形成不同于人类智慧的机器智慧。这就表明,类案不再仅作为衡量司法正义的标尺,更成为“法律+科技”创新中机器学习之源。

对于大数据检察的探索而言,关于类案的现象与规律是不能忽略的,有关类案的原理也是可以嵌套并再造的。关键在于,如何从类案的视角理解大数据检察的基本问题。

检察大数据是什么?

简而言之,检察大数据指的是数据量达到一定级别的,可用于发现检察办案所需掌握类案特点或规律的各种电子材料。对纸面卷宗等传统介质的材料进行扫描、光学字符识别、摄录而出现的电子化材料,也在此列。当然,检察大数据的数据量很难具体量化。从经验层面来看,超越检察官或办案组的手工分析能力的数据量,均可算作检察大数据。如一起刑事案件中被刻入光盘、硬盘的电子数据,就是检察官手边的数据宝藏。而从技术层面来看,数据量当然大一些、纯一些为好,否则难以展现运用的优势。

相比而言,能否从数据中发现检察办案所需掌握的类案特点或规律,是判断检察大数据成效的真正标准。这需要检察人员在办案中所使用的数据达到一个低限的量级。检察大数据的低限在具体场景中并不高。笔者团队曾经做过一些相关试验,如利用多元线性回归建模方法对破坏公用电信设施罪已决案例进行训练,以生成量刑预测模型用于对异常量刑进行监督。当时发现,一旦用作训练数据的裁判文书达到20000份,量刑预测模型的准确率就相对稳定了。在其他罪名的相关试验中,我们也曾遇到训练数据达不到20000份法律文书的情形。此种情况下,可以进行一定程度的补救,如对同一批训练数据进行多次使用而起到数据扩增的作用。

满足低限要求的检察大数据可用于支撑数字检察创新,奥妙在于通过求同法、求异法等进行类案特点或规律的提炼。如果分析获得了不符合同类案件中正常规律的异常迹象,就可以作为法律监督的线索。完成这些任务,通常需要借助数据画像、数据碰撞、数据挖掘等技术模型,下文将作进一步展开。

至于检察大数据的具体样态,司法领域常见的法律文书数据、法条适用数据、证据采信数据、执行类数据、民生领域数据、线索研判数据、资源保护数据、诉讼异常数据、非诉终结处理数据、行政非诉执行数据、网络舆情数据、司法网拍数据、保险理赔数据、补(救)助资金监管数据、犯罪记录封存数据、行业合规数据等等,均在检察大数据之列,也支撑了当前检察机关法律监督模型的开发。其实,法学研究领域中常用的学术论文、数字档案馆、会议综述、专业网站等电子资源,也可以被用于数字式检察监督实践。笔者曾经调研了解到,某地检察机关在查处一起医疗统方领域窝串案时,使用了期刊论文数据库的作者检索功能进行关联分析,便捷地将涉案的医务工作者同统方代表、医药代表区分开来。类似的还有使用国家专利检索数据、企业工商信息查询数据、组织机构代码证查询数据、裁判文书查询数据等的情况。

检察大数据的样态并无限制,但是,对于检察官是否能够发现体现类案特点或规律的信息则确有要求。在当今大数据时代,检察官群体缺乏的不是检察大数据,而是一对洞悉大数据的科技透视镜。左视镜用于寻找基本够量的专业数据或普通数据,右视镜用以从数据中洞察到有关类案的信息。

大数据检察如何推进?

大数据检察的推进,要依靠科技创新与制度创新相互协调、交错发力,共同形成一个整体运行架构。

在科技创新层面,检察机关组织研发各种检察大数据算法模型时,应聚焦类案监督。相比于个案监督而言,类案监督是一种既无法割裂又有重大提升的高阶状态。检察机关开展类案监督的技巧在于,针对办案中发现的共性问题,实现促进该类问题一并解决的精准、高效监督,最终达致“办理一案、监督一批、治理一片”的社会治理效能。2022年3月,最高人民检察院印发的第三十六批指导性案例中的检例第146号是一个好示例。该案中,交管部门因相对人卢某醉酒无证驾车撞伤行人,作出吊销其驾驶证的决定。卢某以其行为已被法院作出刑事判决、交管部门的行政处罚“系属不当”为由,提起行政诉讼。二审法院判决交管部门败诉。交管部门不服,申请检察机关开展法律监督。检察机关不是就案办案,而是延伸办案。通过分析司法大数据,检察机关发现该案不是一起简单的个案,而是反映出行政执法与司法裁判对法律的理解和适用存在认识分歧的类案。检察机关以对该案提出抗诉为契机,加强与公安、法院等部门沟通,就办理吊销机动车驾驶证行政案件促进司法裁判尺度统一。这是对醉驾案件中交管执法不统一问题的一次性解决方案。该案的指导意义在于“解决执法司法办案中认识不一致、标准不统一等共性问题,推动统一执法司法标准,正确执行法律”。

这种具有政策形成性的检察监督案例,就是典型的类案监督。该案的成功在于检察机关在行政检察监督中使用了大数据,形成“个案线索特征发现—潜在共性要素研判—类案监督方案构建”的机制。该案办理过程中,大数据初显作为。从提升效率来看,该案的经验是可以借助开发“检察大数据—类案监督”的算法模型快速复制的。

“指向类案的数据碰撞模型”是当下着力最多的一大类工具。它指的是通过专门的计算机软件对两个以上的数据集进行碰撞比对,并对重合、交叉数据进行深度分析,进而识别可纳入监督范围的类案。仍以面向道路交通管理领域的大数据检察为例,我国有的地方检察机关将公安机关警综平台中关于醉驾的110接处警数据同提交酒精检测机构的相关案件数据进行碰撞,或者将提交酒精检测机构的醉驾案件数据同移送检察院起诉的相关案件数据进行碰撞,或者将移送检察院起诉的醉驾案件数据同移送法院审判的相关案件数据进行碰撞,一旦发现数据间比对结果异常,就可以启动类案监督。

“指向类案的数据挖掘模型”是第二大类工具。它指的是从大数据中通过算法搜索其中隐藏的异常信息,进而识别可纳入监督范围的类案。以车辆保险诈骗类案为例,浙江省绍兴市检察机关曾以同一原告或者关联原告多次提起交通事故赔偿之诉为类案监督点,对当地相关案件的法律文书进行检索。结果发现,有汽修厂多名员工名下交通事故责任纠纷案件异常高发,且呈现出相关案件诉讼代理人或者鉴定人单一的征象。之后,检察机关通过对人员、社保、资金方面的信息流进行分析,挖出了一个骗取保险理赔款的“犯罪利益链”,后将该类线索移送公安机关立案侦查。若对该案中关于找到犯罪利益链的方法进行抽象建模,得出的就是一个形象的数据挖掘模型,且指向类案。

“指向类案的数据画像模型”是第三大类工具。大数据的天然优势在于可用于画像。检察机关对办案群体、办案环节、具体案件等均可以进行数据画像。就任何类型案件而言,经由数据画像后能够形成一般的正态分布情况或规律。以此为衡量,若发现部分案件的办理情况不符合正态分布的情况或规律,就需要转由检察官进行人工判断是否存在倾向性苗头问题,再决定是否用作类案监督的线索。当下,一些地方检察机关围绕虚假诉讼、民间借贷、交通事故赔偿和婚姻财产分割等为重点领域开展类案监督,一个基本前提是基于此类案件出错频率较高的特点搭建了专门的数据画像模型。

上述各种检察大数据模型对类案异常点的识别,均是以机器自动判断“类案”因素、人工判断“类案线索”为特征的。这是两项任务,也是两个步骤,不可或缺。

目前,各种检察大数据模型尚未达到真正智能化的程度。根据《中共中央关于加强新时代检察机关法律监督工作的意见》指示的“运用大数据、区块链等技术”的赋能方案,检察机关还可以通过区块链技术等强化这两个步骤、两项任务的融合,促使基于相关模型的类案监督平台进一步走向智能合约式监督。简单地说,检察机关在开发的大数据法律监督平台或软件中可以预设各种自动执行的智能合约方案,既减少前期检察官的参与压力,也助推后期检察机关同其他社会治理部门协同治理。

在制度创新层面,我国要启动面向检察机关类案监督的建章立制任务,积极化解已经或可能出现的各种重大法律障碍。举例来说,大数据检察往往带有事前监督的色彩,这就昭示着行政检察监督中引入大数据要警惕越界的问题。党的十八届四中全会通过的《中共中央关于全面推进依法治国若干重大问题的决定》指出:“检察机关在履行职责中发现行政机关违法行使职权或者不行使职权的行为,应该督促其纠正。”这里明确限定了行政检察监督启动的前提条件。那么,检察机关在大数据检察中如何把握和执行“在履行职责中发现”之设定,做到于法有据、于情合理?这些都需要从国家层面的规章规则上予以明确。

但并不是说,大数据检察只能墨守成规。当下力推“类案监督”是为了实现溯源治理,而两者的重心不同:前者重在监督,后者重在治理;前者由检察机关单独实施,后者可以由检察机关提出关于具有普遍性问题进行溯源治理的检察建议,督促其他社会治理责任机关、社会自治协会等组织堵塞漏洞,在条件成熟时还由检察机关参与协同发力;前者有不同程度的究责促改意思,后者鼓励从源头上化解潜在的风险……如此众多的差异,就让大数据检察向溯源治理延展中具有更大的开拓空间。从这个意义上讲,政法院校、法律学者也不是大数据检察探索的旁观者、局外人。

以类案为切入点,开展理念转变、数据拓源、模型研发和制度跟进,全体检察人要争做大数据检察的行动派。

作者系中国人民大学法学院教授、博士生导师刑事法律科学研究中心研究员