林君：AI时代，通义法睿大模型在法律行业的探索|人工智能|大模型|林君|法律行业|法睿|算法|通义

律新社编者按

随着AI技术的飞速发展，法律服务领域正迎来一场深刻的变革。AI技术不仅为法律服务带来了更高的效率和准确性，还为法律从业者提供了全新的工具和视角，帮助他们更好地理解和应用法律知识，为客户提供更优质的服务。如何在AI时代把握机遇、应对挑战，实现法律服务行业的高质量发展，已成为每一个法律人必须深入思考的重要课题。

2025年6月29日，“法律AI的黎明——第九届新兴法律服务业发展论坛”召开，阿里巴巴通义实验室·通义法睿算法负责人林君作“AI时代，通义法睿大模型在法律行业的探索”主题分享。阿里巴巴通义实验室作为法律大模型领域的先行者，林君对技术路径的深入解析，为我们拓展了理解法律人工智能底层逻辑的视野。林君的主题分享整理如下：

在人工智能领域，我已是一名“老兵”。自2013年加入阿里巴巴以来，一直从事算法相关工作，亲身经历了算法从规则系统到深度学习小模型，再到如今大模型的相对完整的技术迭代历程。

AI技术的发展历程

人工智能的概念最早可以追溯到1956年，距今不过短短70年左右的时间。1960年，世界上第一个聊天机器人问世；1979年，世界上第一个卷积神经网络被发明。此后，人工智能领域不断取得重大突破，例如IBM的“深蓝”击败国际象棋世界冠军，IBM的“沃森”赢得智力竞赛冠军，以及“阿尔法狗”战胜围棋世界冠军等。在短短70年的发展历程中，人工智能领域不断涌现出新的技术与产品，引发了公众对其极大的热情与期待。然而，在应用过程中，人工智能也面临着诸多问题，导致其发展经历了数次低谷。最近一次热潮，从ChatGPT到GPT-4，再到DeepSeek，人工智能首次深入到各个行业以及大众的认知领域。

法律人工智能产品的出现最早可追溯至20世纪70年代，至今已有约50年的历史。那么，为什么我们今天将主题定为“法律AI的黎明”？我认为，过去人工智能在法律领域仅能解决一些简单的事务性问题，例如对法律文档进行分类或提取要素。然而，如今人工智能已经深入到法律领域的核心区域。它能够通过与用户的深度交流，生成复杂的法律意见书；能够阅读完整的案件卷宗，分析其中的诉求、事实和证据，并最终作出法律判决书。可以说，人工智能如今首次真正深入到法律领域的“深水区”。

这一切都归功于大模型技术，它将人工智能带入了认知智能的新时代。大模型是一种具有超大规模参数和复杂结构的神经网络，具备类似人类的强大表达能力和学习能力。在大模型的训练过程中，从技术角度可以划分为三个阶段：预训练、微调和强化学习。如果将其类比于人类的学习过程，可以这样理解：预训练类似于大量背诵书籍的过程，微调则类似于大量做题的过程，而强化学习则类似于参加考试并由老师打分的过程。实际上，整个AI的训练过程与人类的学习过程颇为相似。

大模型重构了知识的应用方式。如今，人们越来越习惯借助AI完成各类任务，例如撰写新闻稿、创作小说、编写代码、整理会议纪要、进行信息抽取，或者通过AI搜索引擎直接获取问题的答案。

通义法睿的探索实践

阿里巴巴自2018年起便大规模投入AI研发工作，并陆续发布了通义千问1.0、2.0、3.0版本。尤其是2024年4月发布的通义千问3.0，堪称开源模型中效果最佳的模型之一。目前基于通义系列全球开发者进行二次开发的模型已超过13万个。通义实际上是一个模型家族，涵盖通义千问系列和通义万相系列。其中，通义万相系列专注于多模态领域，包括文生图、文生视频等模型。在两个基座模型的基础上，我们还开发了一系列针对垂直领域和特定场景的模型，例如语音、图像、数学等领域，以及针对法律领域的通义法睿模型。

通义在法律行业的技术积累

通义法睿与法律领域的结缘可以追溯到2018年。当时，浙江省高级人民法院启动了平台化与智能化建设，阿里巴巴与浙江大学共同参与了这一项目，并投身于“凤凰智审”产品的开发。“凤凰智审”在金融案件审理领域取得了显著成效，最终当庭宣判率达到了90%以上，案件平均审理时间缩短了36%。2022年，“凤凰智审”被中国社会科学院纳入经典案例；2023年，通义法睿被工业和信息化部评为领航型典型案例。2024年，上海市律师协会会长邵万权为通义法睿颁发了“最受上海律协欢迎的法律科技产品”奖项。此外，今年我们与浙江大学联合申报的项目还获得了“吴文俊人工智能科学技术进步奖”一等奖。近年来，通义法睿通过主导和参与多项国家司法科技项目，成功发表了20多篇国际顶级会议论文。

专注法律领域的特点

通义法睿是结合法律领域的特点进行的二次开发。法律领域的特点可以总结为准确性、专业性、复杂性以及长文档和多文档的处理需求。

准确性是法律领域的基石，至关重要。我们不能引用编造的案例，也不能引用不存在的法条。然而，大模型的“幻觉”现象是其固有特性之一。从本质上讲，大模型是一种基于统计概率的模型，它会从概率角度尽可能地给出一个结果。但在法律领域，这种不确定性是难以被接受的，尤其是在涉及判决时。因此，为了解决准确性问题，我们需要在大模型的基础上开展大量额外工作。例如，通过强化学习来缓解大模型的“幻觉”现象；引入外部知识库，以增强其生成结果的准确性；在产品层面，赋予其溯源能力，使用户能够更快速、更便捷地核验生成结果。

其次是专业性。法律领域存在大量专业术语和独特的法律解读，而这些与普通公众在互联网上获取的信息可能存在显著差异。例如，“轻伤”这一概念，普通民众的理解与法律定义中的“轻伤”在内涵上存在很大差别。

第三是复杂性。我们在开发法律领域产品时，深刻体会到这种复杂性。法律体系中不仅有实体法、程序法，还有海量的地方性法规，法条本身也存在时效性问题。此外，面对律师、法官、法务等不同角色，他们各自有不同的视角、要求和需求，这也给我们的产品建设带来了巨大挑战。

最后是长文档和多文档问题，这主要是面向技术领域的挑战。我见过数百页的判决书，也见过十几万字的超长合同。平均每个案件可能涉及70多份相关材料。在技术上，这无疑是一个巨大的挑战。通义法睿大模型的构建路径实际上与通用模型的构建路径相似，但它是基于法律数据所进行的进一步强化。我们会基于海量的判决书、全量的法律法规、司法解释、书籍、期刊论文等进行预训练、微调和强化学习。

通义法睿的应用场景

在产品层面，通义法睿重点建设的几个应用场景包括法律咨询、法律检索、文本阅读、文书生成和合同审查等。以下我将重点介绍其中的三个产品。

首先是合同审查。用户可以上传一份合同，并选择甲方、乙方或中立立场，进而选择合同审查规则或自动审查规则。大模型会自动识别合同中的风险，并在识别到风险时给出修改建议。目前，我们已将风险判断的准确率提升至96%，修改建议的准确率提升至85%。

第二个产品是法律检索。通义法睿支持案例检索和法规检索。用户可以输入关键词、法律问题或一段复杂的法律案情，大模型会结合检索技术，给出相似案例和匹配的法律法规条文。从效果评估来看，我们对业界多个产品进行了横向对比，在Top 10案例检索效果上，通义法睿具有较为显著的优势。

最后一个产品是多文档阅读。我认为这是AI深入法律领域“深水区”最具代表性的产品之一，该产品的主要功能是让大模型深度阅读案件的完整卷宗，梳理清楚原告的诉请、被告的答辩，以及双方主张的事实和证据，归纳争议焦点，并将事实与诉请、证据进行关联。此外，它还会站在法官的角度，给出判决预测，供法官进行最终确认。在刑事领域，该产品还会进一步分析证据链，审查证据的三性，以及证据链的必要性、充分性、完备性和排他性，最终为法官提供事实认定的角度。

展望

在未来，我们将继续深耕法律人工智能领域，致力于深度融合人工智能技术的特点与法律行业的独特需求，努力将法律AI做深、做强，为法律人工智能的发展贡献自己的一份绵薄之力。

通义法睿官网链接：https://tongyi.aliyun.com/farui/home