人民网上海4月1日电 (记者王文娟)3月31日,上海市检察院召开新闻发布会,介绍数字检察建设新一轮三年规划,并发布上海检察辅助办案多智能体和上海检察语料库情况。

据介绍,上海检察辅助办案多智能体,在检察办案行为全面线上化的基础上,深度推进专业垂直领域中通用大模型的应用,通过对检察办案电子卷宗的全量智能识别、提取和分析,提供案情速览、证据审查、视频分析、出庭示证、3D展示、智能语控等11个智能体功能。

一方面,智能体可以对案件进行智能解析与脉络梳理,以思维导图形式实现案件主要内容和核心关键点“一屏全览”,辅助检察官显著提升阅卷效率。

另一方面,可以对证据链进行智能校验,明确提示案件中存在罪与非罪、此罪彼罪的可能性,以及矛盾冲突的可疑点。以故意伤害案件辅助审查为例,在遇到复杂情节时,智能体能自动识别是否系亲友、邻里之间轻伤害的案件,提取正当防卫中防卫时间、防卫对象和防卫限度等关键定罪量刑的要素,提醒检察官注意相应处理结果,并附以相应的法律依据和类案参考。智能体提供3D伤情展示功能,可视化呈现故意伤害案件中伤势详情。结合上海数字政法建设成果,依托多模态大模型能力,实现政法协同多来源视频智能分析,与言辞证据、伤情鉴定报告进行交叉验证。

此外,智能体还能通过法律文书比对,有效发现侦查、起诉和审判结果在事实认定、罪名适用、量刑建议等方面的差异,有效提升办案和监督效能。

目前,上海检察机关已梯次上线了涵盖32个刑事罪名智能辅助模型,累计为全市1.3万余起案件提供了智能辅助,相关罪名案件的办理效率均得到了提升。其中,危险驾驶罪等智能辅助模型已经由最高检推广到全国试点检察机关应用。

大规模、高质量、安全合规的数据,是垂直领域模型落地效果的关键变量。检察专属语料库是检察智能体的知识原料,为数智检察提供底座支撑。语料库围绕“法律法规、名词解释、量刑意见、业务规则、检察案例”五大维度,搭建了基石语料库、监督微调语料库(SFT)、思维链语料库(CoT)和测试数据集的四层架构,将审查案件的过程拆解成点、串联成线、汇聚成面,一方面丰富高质量数据集,通过开发让智能体分析更加精准,另一方面可以为检察垂类大模型训练和辅助决策提供充足支撑。

基石语料库以生效的法律法规、司法解释、法学理论著作、司法实务指南等原始数据为主体。监督微调语料库(SFT)、思维链语料库(CoT)是由一线业务骨干收集或撰写,主要用于模型微调和智能体建设。

以故意伤害罪相关语料为例,资深检察官在收集故意伤害罪名相关的30余部法律、司法解释等规范性文件的基础上,对“故意”“伤害”“轻伤”等重要法律名词进行专门性解释,并根据法学理论和实务办案经验,梳理出“伤害行为”“正当防卫”“因果关系”等多个矛盾点分析的决策树,及一套完整的包含“证据分析—事实认定—犯罪构成—违法阻却事由—定罪量刑”的故意伤害案件审查规则,再选取50余个典型性案例撰写形成个案审查思维链,将抽象的审查规则进一步具象化。

为更好地明确检察语料的数据资源、质量管控、价值对齐及数据安全等核心要求,上海市检察机关联合多家高校、科研单位,产学研联动同步开展上海检察语料相关标准的研制工作,统一上海检察语料库建设的行业共识,形成《人工智能 检察语料库建设导则》(以下简称“《导则》”)作为上海检察专属语料库建设的基础性标准文件,明确了检察语料库数据资源、数据加工处理要求和系统管理机制,为检察语料库建设提供原则性指引与理论框架。

目前《导则》已由上海市人工智能行业协会正式发布,这也是全国检察系统内首个语料库建设的团体标准,为相关机构或组织构建检察语料库提供了技术标杆、规范体系和方向指导。