东方网记者马鑫洋3月31日报道:今天(3月31日),市检察院召开新闻发布会,介绍数字检察建设新一轮三年规划,并发布上海检察辅助办案多智能体和上海检察语料库情况。上海市检察机关自2022年首次发布上海数字检察建设规划以来,全流程在线总门户集成71个系统,开发上线刑事、民事、行政、公益诉讼“四大检察”39类案件个案全景地图;研发完成以证据审查为核心的全流程辅助办案多智能体,覆盖85%以上常见办案类型,实现全量电子卷宗的证据审查;编制首个检察专属语料库并形成团体标准,涵盖常见罪名的业务规则、思维链等,全市检察机关基本完成数字化转型。2025年,上海检察智能化成果获评中央网信办“人工智能+政务”规范应用案例,检察辅助办案智能体入选上海政务智能“两场一中心”首批典型案例。近日,市检察院发布新一轮三年规划——《上海市检察机关数字检察建设规划(2026-2028年)》(以下简称“三年规划”),标志着上海数字检察将迈入数智化迭代阶段。

实现多智能体智能解析和校验

此次发布的上海检察辅助办案多智能体,在检察办案行为全面线上化的基础上,深度推进专业垂直领域中通用大模型的应用,通过对检察办案电子卷宗的全量智能识别、提取和分析,提供案情速览、证据审查、视频分析、出庭示证、3D展示、智能语控等11个智能体功能。

一方面,智能体可以对案件进行智能解析与脉络梳理,以思维导图形式实现案件主要内容和核心关键点“一屏全览”,辅助检察官显著提升阅卷效率。

另一方面,可以对证据链进行智能校验,明确提示案件中存在罪与非罪、此罪彼罪的可能性,以及矛盾冲突的可疑点。以故意伤害案件辅助审查为例,在遇到复杂情节时,智能体能自动识别是否系亲友、邻里之间轻伤害的案件,提取正当防卫中防卫时间、防卫对象和防卫限度等关键定罪量刑的要素,提醒检察官注意相应处理结果,并附以相应的法律依据和类案参考。智能体提供3D伤情展示功能,可视化呈现故意伤害案件中伤势详情。结合上海数字政法建设成果,依托多模态大模型能力,实现政法协同多来源视频智能分析,与言辞证据、伤情鉴定报告进行交叉验证。

此外,智能体还能通过法律文书比对,有效发现侦查、起诉和审判结果在事实认定、罪名适用、量刑建议等方面的差异,有效提升办案和监督效能。

目前,上海检察机关已梯次上线了涵盖32个刑事罪名智能辅助模型,累计为全市1.3万余起案件提供了智能辅助,相关罪名案件的办理效率均得到了提升。其中,危险驾驶罪等智能辅助模型已经由最高检推广到全国试点检察机关应用。

形成全国检察系统首个语料库建设团体标准

大规模、高质量、安全合规的数据,是垂直领域模型落地效果的关键变量。检察专属语料库是检察智能体的知识原料,为数智检察提供底座支撑。语料库围绕“法律法规、名词解释、量刑意见、业务规则、检察案例”五大维度,搭建了基石语料库、监督微调语料库(SFT)、思维链语料库(CoT)和测试数据集的四层架构,将审查案件的过程拆解成点、串联成线、汇聚成面,一方面丰富高质量数据集,通过开发让智能体分析更加精准,另一方面可以为检察垂类大模型训练和辅助决策提供充足支撑。

基石语料库以生效的法律法规、司法解释、法学理论著作、司法实务指南等原始数据为主体。监督微调语料库(SFT)、思维链语料库(CoT)是由一线业务骨干收集或撰写,主要用于模型微调和智能体建设。

以故意伤害罪相关语料为例,资深检察官在收集故意伤害罪名相关的30余部法律、司法解释等规范性文件的基础上,对“故意”“伤害”“轻伤”等重要法律名词进行专门性解释,并根据法学理论和实务办案经验,梳理出“伤害行为”“正当防卫”“因果关系”等多个矛盾点分析的决策树,及一套完整的包含“证据分析—事实认定—犯罪构成—违法阻却事由—定罪量刑”的故意伤害案件审查规则,再选取50余个典型性案例撰写形成个案审查思维链,将抽象的审查规则进一步具象化。

为更好地明确检察语料的数据资源、质量管控、价值对齐及数据安全等核心要求,上海市检察机关联合多家高校、科研单位,产学研联动同步开展上海检察语料相关标准的研制工作,统一上海检察语料库建设的行业共识,形成《人工智能 检察语料库建设导则》(以下简称“《导则》”)作为上海检察专属语料库建设的基础性标准文件,明确了检察语料库数据资源、数据加工处理要求和系统管理机制,为检察语料库建设提供原则性指引与理论框架。

目前《导则》已由上海市人工智能行业协会正式发布,这也是全国检察系统内首个语料库建设的团体标准,为相关机构或组织构建检察语料库提供了技术标杆、规范体系和方向指导。

构建业务与技术深度融合发展生态

未来三年,全市检察机关将围绕“大模型深度应用、智能体体系化建设、全维度数据资源”三大核心,紧扣前沿领域技术,构建业务与技术深度融合的发展生态。三年规划总体目标是:围绕“构建一个中枢、打造一个基座,丰富N个多智能体应用、推进X项机制的支撑体系”的“1 + 1 + N + X”总体架构,着力推动从单维度向多模态、从浅层推理向深度智能、从以人为主向人机协同的智能化演进升级,实现涵盖“四大检察”以及党务、政务、队伍等在内的检察工作全方位、立体式智能化转型。

其中,“一个中枢”为新型数智检察人机协同总枢纽,围绕总门户、个案全景地图、数据驾驶舱、政法协同等方面开展。比如,基于大语言模型优化人机协同接口,将全流程全息在线办案总门户迭代升级为上海数智检察总门户,从全面线上化、数字化阶段升级为实现所有人员所有检察工作在“一张网”上智能交互、通行通办。

“一个基座”,即通过数据的自动化采集和安全高效汇集,进一步整合各类数据资源,构建涵盖资源、技术、服务与安全“四维驱动”的高质量数据底座。包括构建“法律—业务—实务”分层标注的检察专属语料库,并将检察高质量数据集与通用大模型深度融合,探索打造检察垂直领域大模型,探索智能体与区块链的融合应用,以技术创新强化法律监督质效、提升司法公信力。

“N个多智能体应用”将覆盖办案、监督、管理、保障、公众服务等场景。如,进一步丰富智能化辅助办案模型的应用场景,实现全量电子卷宗的全要素解析,对已建成的22个“一件事大应用”进行全面升级改造,着重强化文书送达、讯(询)问、庭前准备等智能体,为承办人提供更多赋能工具。与此同时,深度融入上海“两网”建设,研发并优化检察诉讼服务等智能体,便利电子阅卷,主动对接综治中心系统,进一步提升公众获得感和满意度。

“X项机制”的支撑体系,通过动态敏捷的机制建设,建立健全政策法规知识库的动态更新机制、科学技术迭代的适应机制、业务需求的响应机制、组织人员的保障机制、算力资源的调配机制以及风险防控与网络安全的平稳长效机制等支撑体系,以适应技术发展、业务需求的快速变化,为检察机关的数字化、智能化提供坚实保障。