APP下载

数据驱动下的检察机关业务管理改革初探

2021-11-29邱灵褚韵

中国检察官·司法务实 2021年9期
关键词:司法改革数据

邱灵 褚韵

摘 要:数据作为第五类生产要素,在司法管理中的价值日益得到重视。数据赋能为检察业务决策提供有力支撑,为业务发展带来新的动力。但当前在运用数据开展检察业务管理的实践中,数据质量不稳定、检索应对不精准、价值判断难度大以及数据管理人才少等问题亟待解决。今后应立足统一业务系统,加强融合性设计,突出自动与人工配合,完善检索功能,确保数据安全稳定,促进检察业务管理改革迈向纵深发展。

关键词:数据 检察业务管理 司法改革 司法统计

数据驱动可以理解为运用数据寻找内部因果关系的一种问题求解方法。随着对数据的价值了解更深入,利用数据驱动和改进司法管理的讨论持续升温。有效挖掘业务数据“富矿”,提升检察业务管理效能,不仅是检察机关提升综合管理方式、提升工作质效的必然,也是规范数据质量及标准,避免司法数据违规泄露及不当应用的关键所在。

一、数据驱动检察业务管理改革的价值

近年来,数据被纳入生产要素的范畴,并参与分配,这被认为是一个重大的理念创新[1]。检察机关参与诉讼过程所体现出的贯穿性特点与其诉讼任务由各部门分解承担的现状,使得其整合数据资源,综合提升管理效能的功能性需求更加彰显,迫切需要在保护好数据安全的基础上,最大化挖掘数据价值,提升自身管理能力。同时,作为我国的法律监督机关,“四大检察”参与的各类诉讼环节众多,检察机关有着更强烈的通过大数据综合应用,拓展诉讼监督范围、丰富诉讼监督手段的发展需求。

在基层检察机关,有一个流行甚广的“上热中温下冷”的说法,指业务管理的强度和效用在四级检察机关之间呈现层层递减的态势。深入研究以数据驱动案件管理和业务决策新型工作体系,有助于打破检察机关管理“冷热不均”现象,挖掘数据资源的乘数级作用,描述和揭示在新一輪司法改革下,检察业务发展的现象和规律,预判并调整业务运行模式,充分发挥案件管理效能,使办案更顺畅、工作更便捷、人力更高效,提高执法司法质量、效率与效果。

二、数据驱动的改革实践观察

(一)公安、法院系统实践

公安机关依据法定职责,在执法数据的研判分析中更注重基于不同警种的信息系统,细分违法及犯罪行为的具体表现[2],充分发挥对异常行为的预警监控作用,强调对犯罪嫌疑人的“行为画像”[3],以及对犯罪线索排查、快速推演、破解侦查僵局等工作进行模型构建等[4]。难点在于现有公安信息平台系统复杂多样(包括全国经侦信息系统、派出所人口管理综合系统、案件管理系统、资金查控系统等),且未能实现数据接口的联通共享。此种现状,导致数据清洗标准化处理工作的难度加大,同时对数据准确分析研判的工作量也增加。

2016年智慧法院列入国家信息化发展的战略后,以类案检索、量刑辅助为核心的审判智能化成为法院司法数据管理应用领域的先行军。如上海市法院系统建立了大数据分析系统,进行案件审判态势专项分析、审判人力配置分析及社会治理风险预判等[5];贵州省法院系统则在全国率先建设司法智能辅助办案系统,提供决策辅助、审判辅助、公众咨询等功能,重点发挥证据抽取、犯罪行为链构建和法律条文推荐等方面的应用效果。[6]

作为审判终局裁定者,法院系统在收集诉讼全过程信息方面具有天然优势,数据公开的社会关注度高,发展势头向好。但也存在一些不足。一是目前为止全国法院尚未形成统一办案系统,数据采集的渠道复杂,容易存在遗漏或偏差,容易产生统计信效度[7]偏差,难以验证。二是主要侧重审判结果分析,但目前的司法数据运用仍属于“弱智能”水平[8],同案同判的追求前提在于案件确属相同或足以构成一致的采信基础,如果过度追求判决的“平均数”,容易导致司法动态性和发展性不足,司法实践僵化。三是数据公开不当风险偶有发生。特别是部分数据分析结果被异化为对司法裁判的刻板预测,或将裁判结果与法官性别、年龄、职业经历等刻意加以关联,很可能导致错误却极具煽动性的评价,造成舆论对司法活动的冲击。

(二)检察数据具体实践的正向观察

相较于公安和法院系统,检察机关的业务数据应用具有较好的开发基础,除了基于检察机关的监督职能,其在司法管理改革中具有较强的动力以外,检察机关具有良好的“一体化”业务数据采集及统计基础是关键所在。早在2013年,最高人民检察院(以下简称“最高检”)就成功牵头组织开发全国检察机关统一业务系统,通过设置案卡,由办案人员对案件信息进行录入,使案件关键信息转化为结构化数据。系统正式上线后,在全国层面统一了检察数据的标准,有效提升业务数据采集和管理的效率。

在《检察大数据行动指南》(2017-2020)中,最高检提出要“统筹利用以司法办案数据为核心的检察数据资源,建立检察大数据总体架构,营造大数据应用良好生态”。经过不断探索,以统一业务系统为基础,检察机关相继规划、部署、实施了涵盖数据统计、业务研判、分析预测、指挥决策等多功能、多视角、多类别的业务数据应用规划及实践。2019年起,最高检对以“案-件比”为核心的案件质量主要评价指标等进行创新性的数据化研发,用数率反映案件办理质效中存在的问题。2020年11月,最高检正式出台《检察业务数据管理办法》,明确检察数据管理规范及责任落实。各层级检察院主要由案件管理部门牵头组织开展数据质量核查与业务研判管理工作,以业务数据服务检务管理,提升整体办案效能。检察机关数据驱动业务管理的框架基本建立。

在统一数据管理的基础之上,各地检察机关不断探索符合本地需求的业务管理改革路径。例如,北京市检察机关开发了“检立方”辅助系统,管理指标能够细化到每一位检察办案人员[9]。贵州省检察机关建立了案件智能研判系统,通过构建犯罪构成知识图谱,对案件进行数据解构,借助案件复杂度分析模块,分析案件的工作量和疑难程度。广东省检察机关建立了刑事诉讼全流程大数据分析系统,广州市人民检察院建成上线了基于数据可视化的智慧案管系统2.0,具备智能化分析工具、人性化智慧监管、可视化考评管理、全景化实时展示等功能。江苏省检察院建立了案管大数据应用平台与行政执法检察监督管理平台[10],无锡市锡山区人民检察院创新推出“检察民情APP”,对接社会治理公共服务管理平台,挖掘热点民生需求,有效拓展监督案源。

(三)检察数据应用于检察业务管理的反向审视

近年来,通过更加丰富的技术手段,检察数据已具有较好的大统一基础,管理应用价值不断提升,但现存的局限也相当明显。

1.服务需求多变,数据采集不精准。从实务运用来看,案卡的设置及其填录规范,远远跟不上数据更新的速率,数据应用深度融合与解决问题的能力仍有局限。虽然检察机关基于大统一平台,已经在内部尽可能降低了数据资源的区域性分割和垄断,填录案卡的模式也使得结构化数据更容易被计算机程序以成熟的技术加以分析,但案卡功能的设置本身,以及在具体应用中如何衔接好供需关系,长期以来备受诟病。一方面是真正核心的业务数据、对办案有价值的新信息可能无法进入采集和挖掘的數据池中,另一方面是大量的信息在反复修改、刷新却不能产生应有的效用。在法律语义分析技术尚不发达的背景下,很容易产生:越强的服务需求——越多的检索词设置需要——越多的人工填录成本——越多的案例匹配难度——越难满足服务需求的数据黑洞,或说是陷入一种需求循环中。

此外,目前检察机关的业务分析研判集中于统计系统中的报表数据信息,对办案活动中的非文字、数字类信息、系统应用过程中产生的活动痕迹数据、以及检察外部环境的数据整合,报表统计能力还十分有限,这使得报表数据未能全面直观地展现办案活动,甚至发生偏离。例如,最高检的业务分析会商报告中曾经提到过因对填录标准理解偏差,数据出现异常变动,如果不能够正确应对这种数据质量偏差,就会导致在分析研判时进行错误评价,甚至因此对该类业务进行了错误的指导,而即便是及时发现了这种数据问题,也需要投入大量成本进行验证、核对。

2.信息整合复杂,检索不高效。如果我们把数据理解为一种新时代能源,其与传统能源的重要差异在于,数据的价值往往是根据应用需求而确定的,对于海量数据如何及时有效地针对使用需求进行定制化的检索开发,成为数据资源开采的核心难题。

检索的关键在于定位,即找到符合统计需要的信息内容。如果统计数据自动抓取的效果更快更强,那么不仅仅工作量得以降低,数据的准确性也能够提升,更多的人力也可以被用于数据深度分析和挖掘中。借助“大数据+”来提升用户体验,强化信息采集的智能化水平,将更好服务于司法改革和办案活动,但这一点在现有的检察机关业务系统中还难以实现。目前检察人员时常会遇到无法针对具体需求和分析内容来确定数据的情况。特别是由于检察机关参与诉讼监督的业务种类繁多,“四大检察”办案程序和内容差异显著,对办案信息的理解很难标准化,需要持续探索。

3.专业人员缺乏,应用技术待提升。有效应用数据发挥检察业务管理效能是一项需要整合资源经费、人员能力乃至地方发展环境的创新、复杂命题。最高检提出了“消除标准化管理与人性化管理之间的隔阂,推进科学化、合理化管理”[11]的要求。但司法领域的“算法统计”本就是世界级的难题,需要投入大量的学习成本,数据管理及运用者才能兼具检察专业素养与司法统计能力,提出创新并可靠的数据管理方案。

正是由于专业人才特别是对司法统计领域有专长的人才的稀缺,现有检察业务管理的数据工具运用较为落后。计算方法以平均值、中位数、比例分析等基础类为主。对报表数据的核对及应用,很大程度还依赖于人工计数,未能实现趋势性分析,也难以对具有内部联系的数据进行集约化、一体化对比,乃至延伸到司法行为分析、效率推演预测等深层领域。传统的数据分析方式,虽然运用便利,但存在有以下弱项:一是易受极端数的影响,二是较少考虑数据相关性,三是规范性和延伸性不强,且可能造成用“数据逻辑”代替“价值判断”的情况。

面对现状,一些检察机关也在探索尝试与技术厂商共同研发专业算法模型,但目前研发的机器自主学习及技术强化路径,很难起到立竿见影的效果,甚至会导致一线办案人员产生反感,认为过多的精力放在了技术开发方面,未对办案本身提供好处,缺乏参与的内驱力,最终也影响数据采集质量和管理效果。

4.司法语言特殊,价值判断易偏差。正所谓,对业务理解的深度决定了大数据分析功能的应用实效。法律语言具有独特性,这种独特不仅仅在于其所具有的大量专业术语,更在于它的应用过程并不完全与一般的社会沟通相一致,在日常语言的分析成效,未必能匹配司法管理环节。法律应用是一个“眼光在规范与事实之间不断往返”的过程,对于司法者而言,通过价值判断和事实判断进行分析的同时,也在基于自身的道德标准、政治立场去进行识别,但计算机几乎无法对抽象的立场和标准进行直观分析。在司法判断的角度,纯粹客观的推理是不存在的,但基于形式逻辑的有效计算,恰恰是运用大数据进行分析和描绘的关键所在。

然而,考虑到对办案保障,我们又必然要给与检察官不接受这种计算分析后得出的归纳结论的空间,否则其所做出判断将可能异化为统计平均值,这也是为什么近代的法理学对形式逻辑对司法活动的效用表现得颇为审慎,正如博登海姆所说:“形式逻辑在解决法律问题时只具有相对有限的作用”。波森纳甚至认为,类比推理绝不应该作为证实的手段,而仅仅提供了一种内心的说服力[12]。

更进一步,当人工智能进化到自主学习的水平时,不仅仅是人们在使用数据工具,工具也在勾勒着甚至反向控制着使用者,被管理的对象本身,也会试图跳脱出原有数据分析的格局,制造假象,或者过分追求片面的数据优化。这必然降低检察业务数据管理的有效性。司法活动的试错成本极高,甚至会动摇社会对于法律规则的信任。而当前的司法技术开发往往高度依赖于外包技术公司,在技术手段上通常只考虑某些具体功能的实现方法,很难真实用法律逻辑进行论证,也无法体现“价值判断”。这在一定程度上解释了为什么一些国家及学者始终对大数据在司法活动的分析中持有保留的态度,认为以算法挖掘来刻画司法行为,可能直接导致诉讼投机行为,甚至导致对判决的不当干预,影响司法权威及独立判断[13]。

三、检察数据赋能改革升级路径探索

数据赋能简而言之就是利用数据隐藏的价值功能。就检察工作方面,其核心价值是在系统内部形成既流动又协作的良性生态系统。随着法治大环境的数字化变革,检察业务精细化管理中所面临的种种挑战,迫切需要通过数据赋能加以应对和破解。要通过解决数据采集规范、算法设计及网络安全等问题,积极开展数据管理,强化对检察数据定制化需求和全过程管理的运用效能提升,有效释放数据价值,通过数据协同完成对原有工作流程的再造及优化,提供更优质的业务管理方案,为检察工作发展打造新引擎,使检察业务全面进入数据时代。

(一)注重公式科学与用户友好的数据采集

检察数据应用和管理中,应当强调从实际应用场景出发,准确分类和确定结构化案卡数据,减轻案卡人工填录的工作量,同时在运用过程中不断提升非结构化数据的深度处理能力,将两者有机结合,提升数据抓取效能,以便于整理及有效运用数据信息,不断丰富数据开发效能。

要解决数据质量这一基础性问题,有两大关键思路。(1)降低人工录入结构性数据的比例,将人力作用更多发挥在核验而非记录中。2020年启用的全国检察业务应用系统2.0版本升级后的系统智能回填功能,就较好地避免以往从文书复制到案卡粘贴的繁琐及错漏,这一功能仍可以持续完善和强化。(2)提高非结构化语言的归纳和检索能力。将传统的法律文本转化为逻辑关系,根据转化得出的数据规律进行碰撞,并不断地进行核验与论证。这两个思路中,后者可以将前者在填录中节省的人力,运用于数据分析的开发中,再将分析所得出的采集建议加以转化,循环往复,使得数据质量成果能够快速显现在具体业务中,提升一线检察人员在办案中确保数据质量的直接动力。

(二)注重标准化与本地化的算法设计

司法数据的应用,比拼的实际上是基于如何深入理解所处的工作领域及其创新需求。近年来,最高检率先垂范,创新推出了“案-件比”这一在研判分析和行为管理领域具有独创性和领先性的指标模型,将个案本身与司法活动环节中所产生的“件”数进行比较,考虑司法参与者的体验感与获得感,实际上也具有统计建模的前瞻意义。

因此,在当前学术界社会科学研究普遍引入新型统计分析技术的背景下,检察业务管理同样需要引入专业化人才,构建设计更多能够辅助办案决策、论证司法改革变化以及服务社会治理的算法模型。这种模型和工具的研发,并不一定需要一次性投入巨大的成本。一个基层检察院的数据管理和应用实践,虽然在采集样本总数上可能远不及最高检或省级院的资源,但其在本地区的犯罪预防、治安管理以及普法宣传等方面的效用,却更具有针对性和匹配性,也更易实现分析的实际转化效能。我国幅员辽阔,各地的经济发展水平也不尽相同,要一次性将全部应用系统或者设备配置到位的难度较大。因此可以采取多试点、分阶段的方式,有条件的地区和单位可以组织先行先试,不断完善。同时,考虑到数据的完整性,在系统应用和设备更新过程中,要考虑到数据端口的贯通和匹配,方便进行数据间的迁移。

强化数据赋能在检察改革中的本地化特征,能够增强数据应用的广度和深度。例如,广州市越秀区人民检察院针对“认罪认罚适用率”数据呈现问题,不简单地做一刀切,而是分别进行了月度、季度、半年度的研判分析,结合办理案件类型及复杂程度,与“案-件比”“不捕不诉率”“审前羁押率”等指标进行综合分析,并列明每位检察官的具體捕、诉工作效能图,通过“认罪认罚工作模型”所展现的强、弱项,进一步运用系统培训、专题讨论、人员调整等管理手段,对案卡填录规范、积存案件清理、新型案件应对等问题进行针对性破解,2021年上半年该项指标的全市排名显著提升,检察官的办案能力也得到了强化。

值得注意的是,由于指标的标准性需要,这种本地化设计,仍然离不开基础性的统一标准。标准化强调的统计具体公式和标准的规范性,实现算法统一和科学,避免人为地进行排名控制。而本地化更应当突出的是这些标准公式的组合型、针对性评价,实现对不同办案活动的全面动态评价。两者综合运用,更有利于数据管理应用的信效度提升,确保结果具备可重复验证的科学价值。

(三)注重科技系统与人工优化的综合运用

充分发挥智能技术的应用效果,检察人员的数据应用意识和能力提升才具有重要意义。“代码规制”对司法活动引发的风险正若隐若现,与其因噎废食,倒不如积极迎接挑战。提升数据分析的处理能力,在实际解读中加入价值化判断,以确保数据安全为基础,推动跨应用系统、跨业务部门、跨区域层级的分类数据体系,有效剔除同质化的信息,强化指标的多维度运用和数据的自动化输出,实现检察数据资源、知识库体系和支撑平台共享,更加有效开发和丰富检察数据资源。同时理性对待数据应用于业务管理中的优劣,并与其他的管理方法和评估手段综合运用。

例如,广州市人民检察院结合在个案审查中发现的食品药品案件漏判禁止令,因数据分散难以发现监督线索的问题,依托“互联网+”模式,利用大数据整合处理公检法及行政执法机关数据,利用该院人员的办案经验和监管智慧,制定数据抓取规则,深入挖掘对食品药品类案件从审判监督、刑罚执行监督、行政执法监督到公益诉讼的全链条式监管,自主设计研发“食品药品安全案件监管平台”,现已汇聚市场监管部门的经营企业700余万条,社会保障部门信息1亿余条,通过数据对比、碰撞,发现可能违反禁止令的线索30余条,对外公布典型案例15件。这一系统还开发了对外查询渠道,为行政单位、食药企业及广大视频提供了查询便利,成为拓展检察数据应用和智慧检务的生动实践。

(四)注重数据运用与信息安全的技术完善

虚拟的数据构架在实体的设备之上,如果不能保证设备应用的安全,数据的采集必然成为空中楼阁。面对日益增长的检察海量数据,以及与其他司法机关、行政机关进行数据交互的工作需求,2020年起,全国检察机关由传统的独立网络部署转变为非涉密工作专网。这一改变有利于实现外部网络的数据共享、业务协同,但也对通信网络、应用数据的云端安全及跨网交互、网络信任等方面提出了更高要求。需要根据保密规范及等级保护的要求,强化安全设备日志、网络访问流量分析等自动化监测能力,对异常行为进行跟踪溯源,防止出现信息泄露、未经授权非法使用、模型篡改以及数据意外丢失等问题,完善检察数据应用的日常备案、风险预警与快速响应机制,进一步明确数据应用及监管的责任落实。

动态化、全面化的数据监督,在有效开展司法管理、提升司法监督效力的同时,某种意义上造成对检察官的监控。因此,在对检察办案数据进行归类和模拟时,要通过入口管理和前期筛选等方式,根据情况进行匿名处理、类化归纳等方式,明确数据运用的范围和模式,并对数据应用行为进行有效管理。要注意对于检察官及诉讼参与人的隐私保护,既要发挥好数据赋能给检察履职能力现代化所带来的突破性功效,也要关注大数据技术对传统检察司法理念带来的冲击,明确数据研判在司法场景中的应用限度,预防检察数据滥用可能对检察权独立行使所带来的潜在风险。

猜你喜欢

司法改革数据
浅谈司法改革形势下的法院财务工作
新形势下行政公益诉讼制度发展剖析
公路工程试验检测存在的问题及措施
人民监督员制度的法理渊源与制度功能
一种借助数据处理构建的智能食堂管理系统
现实语境下司法体制改革过程中的问题与思考
制度构建抑或价值培育:中国语境下司法独立的逻辑定位
浅谈计量自动化系统实现预购电管理应用
论我国新一轮司法改革:职业化还是民主化