运用大数据提升法律监督质效的四个维度
来源:检察日报 更新时间:2022-06-21

今年年初,全国检察长(扩大)会议强调,要增强大数据战略思维,运用大数据助力法律监督“本”的提升和“质”的嬗变。检察大数据战略,是检察机关深入学习贯彻习近平法治思想和习近平总书记关于网络强国、数字中国的重要论述,贯彻新发展理念、适应信息化时代新趋势的重要举措,是检察机关科学行使检察权的重要内涵之一,有利于促进强化法律监督手段,提升法律监督实效,助推国家治理体系和治理能力现代化。

第一,全面、完整的检察大数据是科学行使检察权、提升法律监督质效的先决条件。检察大数据的全面、完整,就是基于检察数据的全样本践行检察大数据战略。这个意义上的检察大数据,在数量上要大,大到司法案例数据全样本;在内容上要全,全到涵盖实体、程序的全部内容。大数据概念的核心就在于全样本,是全景观察。样本意识说到底就是证据意识,大数据分析说到底就是从样本数据中挖掘规律性认识和决策依据的过程。应当承认,个别事例也是真实的,但个别事例随时可能遭遇反例,以其作为证据演绎理论,很可能只能是一种意见、猜想,无法作为规律性认识,更无法以此指导大规模实践。在统计学上,个例可能处在正态分布中的任何一个位置上,既可能碰巧代表大量同类案件的集中趋势,也可能远离均值。残缺、人为裁剪、筛选的部分数据,将严重阻碍检察大数据战略的落地。因为,法律监督其实就是监督者与被监督者之间的博弈。信息不全,对于被监督者来说是信息优势,而对于监督者来说则是信息困境。所以,从源头上拓宽司法大数据的供给,是科学行使法律监督权的第一步。
第二,基于司法大数据全样本,建立“小但书”数据库,以提高指导性案例的科学性。最高检已经发布了三十六批指导性案例,可以引入大数据思维,丰富指导性案例的筛选视角,提高案例指导建议的可操作性。例如,抢劫罪往往被认为是暴力当场夺取他人财物的行为。然而,对大数据中筛选出变更罪名样本进行观察就会发现,发生在一定冲突背景中的暴力当场取财行为,却不被认定为抢劫罪。例如,某被告人因购买的推土机质量不合格,偶遇来自同一地方的推土机推销商,便以暴力手段逼迫其“赔偿损失”。被害人因其产品确属拼装机而惧怕对方报警,当场交付了财物。对此,有观点认为构成抢劫罪,有观点认为构成敲诈勒索罪。类似发生在一定冲突背景下的当场暴力取财,往往没有按抢劫罪定罪。据此可以认为,所谓抢劫罪,通常是指没有明显前因后果的当场暴力劫取他人财物的行为。通过大数据挖掘出这类抢劫罪认定的补充性判断,尽管法律对此没有明文规定,在许多刑法教科书或理论文章中也鲜有提及,却能为司法实践准确定罪提供有益指导。
这种从变更罪名大样本中提取共性以发现某些否定性特称判断的方法,称为小但书法。从逻辑学规则来看,“小但书”只是特称判断而非全称判断。所以,“小但书”具有某种或然的性质,只是说“某些”“有的”案件事实“很可能”不属于某种犯罪。然而,当得出某个特称判断所观察的司法案例多到接近甚至几乎等于所有案例时,据此处理案件出现失误的机会也就接近于零。这就是为什么形式逻辑的方法可以同大数据研究方法相结合的原因。据此,建议检察机关指导性案例的制作除了说明何种情形构成何种犯罪外,也应基于司法大数据的挖掘梳理,建立自己的常见罪名“小但书”数据库,以丰富指导性案例的形式和内容。
第三,基于司法大数据全样本,建立常见犯罪量刑预测数据库,以提高量刑建议的可靠性和说服力。检察机关对构成犯罪的案件提出确定刑量刑建议,是检察权行使的重要内容。而提出高质量量刑建议的前提是依法对具体案情作出比较客观的量刑预测。基于科学客观的量刑预测,加上一定的刑事政策考量,才可能提出令人信服的量刑建议。问题是,如何综合不同案件事实和各种量刑情节预测可能的量刑结果?难点之一是,尽管司法机关出台了量刑规范化指导意见,对许多量刑情节的量刑幅度作出了比较详尽的规定,但当一个案件有数个量刑情节时,数个情节便有多种可能的组合。以交通肇事罪为例,相关的法定量刑情节至少有:致死人数,重伤人数,负事故全部责任、主要责任还是同等责任,财产损失大小,行为人是否逃逸,以及有关的刑法总则量刑情节。理论上,即使不考虑酌定情节,交通肇事罪法定量刑情节在具体案件中就会有较多种可能的排列组合。而法律只能对单个情节从轻、减轻或者从重、加重处罚及其幅度、范围作出规定,不可能对每种情节组合如何量刑均作出具体规定。这时,面对这么多可能的组合,司法人员也只能大概估算量刑结果。如果基于司法大数据全样本建立常见犯罪量刑预测数据库,无疑会提高量刑建议的科学性。
我们曾以交通肇事罪全样本为数据基础,以该罪法定情节为自变量,以刑期为因变量进行回归分析,得到交通肇事罪刑期与法定情节之间关系的统计模型,并在此基础上对模型进行优化处理。有了这一模型,将任何一个未决案件的实际情节依次代入模型,便可得到该案的预测刑期。既然交通肇事罪可以实现量刑确定性的量化描述与预测,对于其他多情节犯罪也应当可以尝试类似建模。实际上,如果将上述模型中交通肇事罪的特有情节替换为其他某种犯罪的法定情节,如是否入户抢劫、盗窃数额、是否故意杀人既遂等等,便可基于相应犯罪的量刑大样本进行建模和量刑预测。大数据量刑预测的法治意义绝不仅限于提高办案效率,还可能提高量刑建议的公正性,实现同案同判。
第四,结合具体检察业务开发各类算法模型,也是检察大数据战略的必然要求。与检察业务有关的算法模型至少有两类:一类是基于海量真实经验数据计算而来的模型,如上述量刑预测模型,以及犯罪实际状况的评估模型等等。另一类就是基于大量司法专家、学者的集体智慧编制的算法模型。公平公正是检察监督权行使的基本要求。然而,即使在法律、司法解释日趋完善的今天,仍然可能存在人情案、关系案。尤其是对新型检察业务而言,既无具体的法律规定,也无成熟的实践经验,只有相关政策导向。这时,同案不同处理的可能性就会增加。对此,在实施检察大数据战略背景下,研发相应的算法模型,既是检察权行使公正性的要求,也与检察权行使的科学性要求相符。
比如,涉案企业合规改革试点工作是新时期检察机关推出的重点改革举措。2021年4月,最高检发布了《关于开展企业合规改革试点工作方案》,启动了第二期企业合规改革试点工作。企业涉嫌触犯刑法后,如何在依法打击刑事犯罪的同时,促进经济发展、保护民营企业,目前还没有成熟完善的法律规定和统一的判断标准。在这方面,我们已经着手探索编制企业刑事合规的指数模型。该指数模型力求彰显两个基本原则:一是法治原则,即涉案企业涉嫌犯罪事实本身的性质、严重程度在指数模型中必须被分配足够大的权重系数。否则,不论事情大小,一律“一合了之”,有悖法治的统一性和严肃性。二是保护原则,即根据涉案企业事前事后依法合规整改的制度安排、实施情况、实施效果,尽可能控制、减缓企业因触犯刑法给企业生存、经营带来的负面影响,保护企业正当权益,积极促进社会经济稳定发展。要实现这两个原则的统一且具有可操作性,就需要一种综合的量化算法模型:“合规指数=100-刑事风险合规风险”。按照该模型,一个涉案企业的刑事风险越大,犯罪事实越严重,则指数得分越低;合规风险越低,整改效果越好,则指数得分越高。最终,将根据企业的指数总得分,考虑如何处理。我们采用德尔菲法,经过几轮反复修正,得到专家们对各项风险权重大小专业意见的平均值,再结合相关罪名量刑大样本的统计结果,最终确定指数模型。这类集法治原则、政策导向和实际操作为一身的指数模型,既能为检察机关涉案企业合规工作提供统一的量化标准、尺度,又能减少治理成本,进一步提升国家治理体系和治理能力现代化。

作者系北京大学法学院教授