律新社编者按

随着AI技术的飞速发展,法律服务领域正迎来一场深刻的变革。AI技术不仅为法律服务带来了更高的效率和准确性,还为法律从业者提供了全新的工具和视角,帮助他们更好地理解和应用法律知识,为客户提供更优质的服务。如何在AI时代把握机遇、应对挑战,实现法律服务行业的高质量发展,已成为每一个法律人必须深入思考的重要课题。

打开网易新闻 查看精彩图片

2025年6月29日,“法律AI的黎明——第九届新兴法律服务业发展论坛”召开,阿里巴巴通义实验室·通义法睿算法负责人林君作“AI时代,通义法睿大模型在法律行业的探索”主题分享。阿里巴巴通义实验室作为法律大模型领域的先行者,林君对技术路径的深入解析,为我们拓展了理解法律人工智能底层逻辑的视野。林君的主题分享整理如下:

人工智能领域,我已是一名“老兵”。自2013年加入阿里巴巴以来,一直从事算法相关工作,亲身经历了算法从规则系统到深度学习小模型,再到如今大模型的相对完整的技术迭代历程。

01

AI技术的发展历程

人工智能的概念最早可以追溯到1956年,距今不过短短70年左右的时间。1960年,世界上第一个聊天机器人问世;1979年,世界上第一个卷积神经网络被发明。此后,人工智能领域不断取得重大突破,例如IBM的“深蓝”击败国际象棋世界冠军,IBM的“沃森”赢得智力竞赛冠军,以及“阿尔法狗”战胜围棋世界冠军等。在短短70年的发展历程中,人工智能领域不断涌现出新的技术与产品,引发了公众对其极大的热情与期待。然而,在应用过程中,人工智能也面临着诸多问题,导致其发展经历了数次低谷。最近一次热潮,从ChatGPT到GPT-4,再到DeepSeek,人工智能首次深入到各个行业以及大众的认知领域。

打开网易新闻 查看精彩图片

法律人工智能产品的出现最早可追溯至20世纪70年代,至今已有约50年的历史。那么,为什么我们今天将主题定为“法律AI的黎明”?我认为,过去人工智能在法律领域仅能解决一些简单的事务性问题,例如对法律文档进行分类或提取要素。然而,如今人工智能已经深入到法律领域的核心区域。它能够通过与用户的深度交流,生成复杂的法律意见书;能够阅读完整的案件卷宗,分析其中的诉求、事实和证据,并最终作出法律判决书。可以说,人工智能如今首次真正深入到法律领域的“深水区”。

这一切都归功于大模型技术,它将人工智能带入了认知智能的新时代。大模型是一种具有超大规模参数和复杂结构的神经网络,具备类似人类的强大表达能力和学习能力。在大模型的训练过程中,从技术角度可以划分为三个阶段:预训练、微调和强化学习。如果将其类比于人类的学习过程,可以这样理解:预训练类似于大量背诵书籍的过程,微调则类似于大量做题的过程,而强化学习则类似于参加考试并由老师打分的过程。实际上,整个AI的训练过程与人类的学习过程颇为相似。

大模型重构了知识的应用方式。如今,人们越来越习惯借助AI完成各类任务,例如撰写新闻稿、创作小说、编写代码、整理会议纪要、进行信息抽取,或者通过AI搜索引擎直接获取问题的答案。

02

通义法睿的探索实践

阿里巴巴自2018年起便大规模投入AI研发工作,并陆续发布了通义千问1.0、2.0、3.0版本。尤其是2024年4月发布的通义千问3.0,堪称开源模型中效果最佳的模型之一。目前基于通义系列全球开发者进行二次开发的模型已超过13万个。通义实际上是一个模型家族,涵盖通义千问系列和通义万相系列。其中,通义万相系列专注于多模态领域,包括文生图、文生视频等模型。在两个基座模型的基础上,我们还开发了一系列针对垂直领域和特定场景的模型,例如语音、图像、数学等领域,以及针对法律领域的通义法睿模型。

通义在法律行业的技术积累

通义法睿与法律领域的结缘可以追溯到2018年。当时,浙江省高级人民法院启动了平台化与智能化建设,阿里巴巴与浙江大学共同参与了这一项目,并投身于“凤凰智审”产品的开发。“凤凰智审”在金融案件审理领域取得了显著成效,最终当庭宣判率达到了90%以上,案件平均审理时间缩短了36%。2022年,“凤凰智审”被中国社会科学院纳入经典案例;2023年,通义法睿被工业和信息化部评为领航型典型案例。2024年,上海市律师协会会长邵万权为通义法睿颁发了“最受上海律协欢迎的法律科技产品”奖项。此外,今年我们与浙江大学联合申报的项目还获得了“吴文俊人工智能科学技术进步奖”一等奖。近年来,通义法睿通过主导和参与多项国家司法科技项目,成功发表了20多篇国际顶级会议论文。

专注法律领域的特点

通义法睿是结合法律领域的特点进行的二次开发。法律领域的特点可以总结为准确性、专业性、复杂性以及长文档和多文档的处理需求。

打开网易新闻 查看精彩图片

准确性是法律领域的基石,至关重要。我们不能引用编造的案例,也不能引用不存在的法条。然而,大模型的“幻觉”现象是其固有特性之一。从本质上讲,大模型是一种基于统计概率的模型,它会从概率角度尽可能地给出一个结果。但在法律领域,这种不确定性是难以被接受的,尤其是在涉及判决时。因此,为了解决准确性问题,我们需要在大模型的基础上开展大量额外工作。例如,通过强化学习来缓解大模型的“幻觉”现象;引入外部知识库,以增强其生成结果的准确性;在产品层面,赋予其溯源能力,使用户能够更快速、更便捷地核验生成结果。

其次是专业性。法律领域存在大量专业术语和独特的法律解读,而这些与普通公众在互联网上获取的信息可能存在显著差异。例如,“轻伤”这一概念,普通民众的理解与法律定义中的“轻伤”在内涵上存在很大差别。

第三是复杂性。我们在开发法律领域产品时,深刻体会到这种复杂性。法律体系中不仅有实体法、程序法,还有海量的地方性法规,法条本身也存在时效性问题。此外,面对律师、法官、法务等不同角色,他们各自有不同的视角、要求和需求,这也给我们的产品建设带来了巨大挑战。

最后是长文档和多文档问题,这主要是面向技术领域的挑战。我见过数百页的判决书,也见过十几万字的超长合同。平均每个案件可能涉及70多份相关材料。在技术上,这无疑是一个巨大的挑战。通义法睿大模型的构建路径实际上与通用模型的构建路径相似,但它是基于法律数据所进行的进一步强化。我们会基于海量的判决书、全量的法律法规、司法解释、书籍、期刊论文等进行预训练、微调和强化学习。

通义法睿的应用场景

在产品层面,通义法睿重点建设的几个应用场景包括法律咨询、法律检索、文本阅读、文书生成和合同审查等。以下我将重点介绍其中的三个产品。

打开网易新闻 查看精彩图片

首先是合同审查。用户可以上传一份合同,并选择甲方、乙方或中立立场,进而选择合同审查规则或自动审查规则。大模型会自动识别合同中的风险,并在识别到风险时给出修改建议。目前,我们已将风险判断的准确率提升至96%,修改建议的准确率提升至85%。

第二个产品是法律检索。通义法睿支持案例检索和法规检索。用户可以输入关键词、法律问题或一段复杂的法律案情,大模型会结合检索技术,给出相似案例和匹配的法律法规条文。从效果评估来看,我们对业界多个产品进行了横向对比,在Top 10案例检索效果上,通义法睿具有较为显著的优势。

最后一个产品是多文档阅读。我认为这是AI深入法律领域“深水区”最具代表性的产品之一,该产品的主要功能是让大模型深度阅读案件的完整卷宗,梳理清楚原告的诉请、被告的答辩,以及双方主张的事实和证据,归纳争议焦点,并将事实与诉请、证据进行关联。此外,它还会站在法官的角度,给出判决预测,供法官进行最终确认。在刑事领域,该产品还会进一步分析证据链,审查证据的三性,以及证据链的必要性、充分性、完备性和排他性,最终为法官提供事实认定的角度。

03

展望

在未来,我们将继续深耕法律人工智能领域,致力于深度融合人工智能技术的特点与法律行业的独特需求,努力将法律AI做深、做强,为法律人工智能的发展贡献自己的一份绵薄之力。

通义法睿官网链接:https://tongyi.aliyun.com/farui/home