【作者】江海洋(山东大学法学院副教授、法学博士)

【来源】北大法宝法学期刊库《交大法学》2025年第3期(文末附本期期刊目录)。因篇幅较长,已略去原文注释。

打开网易新闻 查看精彩图片

内容提要:刑法的法典化或者再法典化必须贯彻罪刑法定之刑法明确性原则,核心刑法条文一般应以非专业人士能够理解的语言进行表达,也即刑法典设置构成要件使用的字句所表达文义须符合该字句的“通常含义”。同时,司法解释不能跳出刑法条文文义设定的框架。关于刑法文义之内涵界定,应区分“可能含义”与“通常含义”。司法解释一般情况下不应突破刑法条文的“通常含义”,即使存在惩罚必要性,也不能突破“可能含义”。鉴于对“可能含义”与“通常含义”的判定存在固有的障碍,为了提升刑法典条文的可理解性以及刑法典条文“文义”对司法解释限制的透明度,在确定“可能含义”与“通常含义”时,应适时地引入法律语料库语言学技术,增强“可能含义”与“通常含义”判断过程中的可视化说理,以此提升立法的科学性以及司法解释创设过程中的说理性与客观性。

关键词:刑法法典化;司法解释;可能含义;通常含义;法律语料库技术

目次 一、问题之提出 二、刑法文义的几种学说 三、可能含义与通常含义之内涵界定与判定障碍 四、可能含义与通常含义之判定方法 五、引入法律语料库作为解释工具之提倡 六、结语

问题之提出

2020年11月,习近平总书记在中央全面依法治国工作会议上明确提出,要总结编纂民法典的经验,适时推动条件成熟的立法领域的法典编纂工作。随着民法典的颁布,作为重要部门法的刑法,其法典化或者再法典化也成为热门话题。法典化作为一种制定体系化的法典的过程,对刑法而言,“全面修订刑法典既不是制定全新的法律,也不是简单地进行法律汇编,而是对现行有关法律规范的系统整合、编订纂修”。法典化既是一种立法形式,更是一种立法技术。作为法的体系化存在,法典具有高度的普遍性、确定性和完整性,需要有较高的立法技术予以支持。没有符合刑法立法要求的立法技术,就难于有合理的刑法立法。与其他部门法立法略有不同的是,针对刑法立法,在全面修订刑法典的过程中,必须落实罪刑法定原则。

于全面修订刑法典的过程中如何落实罪刑法定原则,其中最重要的就是要贯彻刑法明确性原则。一般认为,刑法明确性要求约束的对象为立法者,主要是针对刑法立法的限制与要求。在刑法明确性的约束下,立法者有义务通过法律形式确定行为的可罚性,使得规范的接收者必须能够在没有特殊知识的情况下足够肯定地确定规范的内容。只有规范清晰易懂,才能使受规范影响者预见到法律决定、识别法律并能够以此调整其行为。事实上,法典化无非是把人的意向用文字予以充分表达,以方便人们检索、理解、解释、推理等运用,立法往往被设想为立法机构与公众之间的对话。

同时,在我国,鉴于司法解释的独特地位,不仅刑法立法需要满足刑法明确性之要求,而且司法解释与判决亦需要满足明确性之要求。对刑法的解释者而言,其对刑法中构成要件的解释或者精确化亦不能突破刑法文义。刑法典条文既是司法解释不能跨越的终点,也是司法解释的形式逻辑起点。根据《立法法》第119条规定,最高人民法院、最高人民检察院作出的属于审判、检察工作中具体应用法律的解释,应当主要针对具体的法律条文。司法解释须以刑法文义射程作为边界,解释受字面界限的约束绝非任意,而是源自罪刑法定原则的国家法和刑法基础:超出法律条文的刑法适用缺乏必要的民主正当性。有鉴于此,最高司法机关在解释刑法的过程中,自然亦不能忽视刑法的文义。

然而,关于何为刑法文义?对立法者与解释者,刑法文义的限制是否相同?刑法立法者采用字句所表达的文义能够为一般公民所理解、预测之要求,是否与刑法条文对解释者限制之要求等同?一直以来学界对此缺乏深入探讨,未能对相关概念进行厘清,进而导致未能发挥刑法文义对立法以及司法解释制定的限制作用。更为重要的是,对刑法文义的判定方法一直以来都为学界所忽视,使得过往的讨论多集中在何为刑法文义的抽象层面,对刑法立法以及司法实践来说,可操作性并不强。因此,有必要对何为刑法文义进行更为系统地梳理分类。同时,对刑法文义内涵的判定方法进行比较,以试图发现一种更为客观、可视的判定方法。

刑法文义的几种学说

(一)可能的文义说

正如上述,在全面修订刑法典过程中,一般情况下,核心刑法必须以非专业人士能够理解的语言进行表达。与之稍有不同的是,根据通说,法律文本解释的边界在于“被解释规范的可能字面含义”,而“可能字面含义”既可能具有一般的语言使用习惯,也可能具有特殊的法律语言表达习惯。根据罪刑法定原则,解释只要在文本可能的含义范畴内,是否有利于被告人的扩张解释都是允许的。根据德国联邦宪法法院一贯的判例,“文字可能的含义”构成了“解释的最终边界”。虽然现在对文义限制作为解释的边界几乎达成了共识,但对这一限制的具体化仍有不同的观点,其范围从“日常语言”到“自然词义、词义关联和句义”,再到“作为语词最外层的可能含义”。针对不同观点的争论,人们往往缺乏对字句限制进行更仔细的描述。

何为“文字可能的含义”?从客观视角出发,代表观点有立足于语言的客观可能意义的“纯粹语义说”。“纯粹语义说”认为,法律条文的可能含义应基于语言意义的立场。刑法允许的最大程度解释——扩张解释——必须限于刑法条文语言可能意义的范围。相反,刑法禁止的类推解释则超出了可能意义的限制。虽然在目的论方法中,扩张解释和类比解释是类似的,它们之间的疆界在不断变化。但是,如果我们超出了文本语言的可能含义的限度,它们之间就会有质的区别。所谓语言的可能含义不是由解释者的主观决定的,而是必须由客观的语言可能含义决定。允许的扩张解释可以从法规规定的语言的客观可能含义来解释,而类推解释则以超出法规规定的语言客观可能含义为前提。

针对以“可能含义”作为解释的边界,以考夫曼为代表的学者认为,此种区分难以成立,因为根本不会有准确单一含义的文字,文字的含义必定会伴随着模糊性。类推是解释法律时必然存在的思考工具,区分禁止的类推与许可的解释根本没有必要。为应对批评,许乃曼教授借鉴分析哲学关于区分客体语言与元语言的语言层次理论,区分了两个语言级别:客体语言和后设语言,主张刑法的法律适用体系可以通过自然的语言用法,亦即一个外在的体系来划定出界线。其中,客体语言(Objektsprache)指命题所涉及的是特定客体对象;后设语言(Metasprache)中,命题指涉的则是客体语言的语句。客体语言与法律专业用语颇为相似,法律专业用语虽沿用日常用语的词汇,却赋予其特定含义,这一含义的形成,先是通过历史、诠释维度的考察,继而从目的、价值层面进行探究,因此具备独特内涵。立法者所运用的就是法律上的专业用语,对于此专业用语,依照法律上的标准所理解的意涵,将其转译为日常用语,此种日常用语即为后设语言。可以发现,许乃曼教授认为,法律的专业用语与日常生活所使用的语言,属于不同的语言层次,在不同的语言层次当中,自然语言对法律语言来说是一道外部的界线。面对“自然语言用法”的这个界线不够清晰、不够明确的质疑,许乃曼教授并未回避,再度提出维特根斯坦的见解为其理论辩护,其指出,不精确绝对不表示没用处。

(二)一般人预测可能性说

与此相对,对于法律文义的界定,还存在对法律条文的语言以一般人的理解或预测可能性为基准的立场。鲍曼(Baumann)指出,可能的文义作为解释的限制取决于“字句的自然意义”,否则就会产生一种“秘密法律”,也即在刑法解释学中,借由揭示大众所理解的自然字义形成一道解释界线,达成贯彻罪刑法定保障功能的目的。可以发现,鲍曼的立场并非仅仅基于法律的裁判规范属性,更是基于法律行为规范的立场,其更多地强调公民作为法律规范的接收者,会因法律之制定、颁布以及修改而调整其行为,安排其生活。以公民为出发点的解释观要求主张刑法构成要件的含义应该以被一般大众所认识者为准,而所谓在犯罪行为之前就应确立的可罚性范围,这个可罚性范围的确立要考虑大众的认识可能性。恩吉施(Engisch)亦赞同这一点,其认为,规范的接收者是普通公众,所以原则上,语言的一般可理解的自然意义必须是决定性的。哈塞默(Hassemer)则进一步指出,若不以字义而以法律目的为标准,将会使得类推禁止无法确立,故应以大多数民众的语感为依据判定刑法条文之“字义”。

事实上,无论是“一般公民所理解的自然字义”,抑或“大多数民众的语感”,都是立基于规范接收者之公民的信赖保护。持这种观点的学者认为,从宪法上确定允许的法律解释的界限是为了实现对作为规范接收者之公民的信赖保障,那么,其中处于决定性地位的就是公民对法律的理解视域。因而,如果相应的条文并非仅仅针对法学从业人员,则不得以法学专业术语对其加以解释。司法机关所作出的,并且被其视为是正确的解释的决定因素为是否仍处于相应条文表述根据日常用语所确定的可能含义之内。至于立法者通过这种表述所追求的目标, 则并不重要。因为“普通公民”无法直接推断出这种立法意图,而且其也无从得知。由于这一界限的存在,倘若法律条文由于超出普通公民理解范围的不恰当表述而无法将某一具体案件涵摄在内,那么,即便根据体系性的、主观历史的或者客观目的性的解释方法可以得出肯定结论,解释者也仍然不得将相应的法律条文适用于该案。

(三)折中说

罗克辛教授指出,由于立法者只能通过文字来表达规范性的命令,因此,将条文的解释限制在字面含义上是正确的,没有文本书面表述的内容不能成为刑法的内容。公民只能以阅读法律条文的方式,获得有关何为不法行为以及从事不法行为所涉及的风险。法律规范必须对规范的对象具有可理解性,由此可以看出,法律条文的解释应以“通俗的字面意义”为基础。如果解释标准是难以理解的法律职业语言,那么它就不能被非专业人士理解。罗克辛教授的此种观点某种程度与鲍曼的观点类似,都认为应该将可能含义从缥缈的云端拉回到日常生活用语上来,这当然是为了确保普通公民对法律的可预见性。罗克辛的见解一言以蔽之,就是要同时考量法律的可能文义与法律目的,也即应假设立法机构用条款的语词创建了一个监管框架,然后由法官来填补。框架由法律文本的可能的文义范围来界定,而法官在这个框架内,考虑到最切近的词义、历史上立法者的意图以及法律体系的关联性,依据法律的目的进行解释(目的解释)。可以发现,在罗克辛教授行文之中,虽然其还是有将“可能含义”与“可能的日常文义”两者混用的情形,但显然还是区分了两者,并将“可能含义”作为解释边界。

在我国,多数学者支持此种“通常(日常)含义”与“可能含义”区分的折中说。冯军教授指出,应进一步区分刑法条文用语“通常含义”与“可能具有的含义”,前者的范围要小于后者。允许的刑法扩张解释是指将刑法术语的“通常含义”扩展到刑法术语的“可能含义”范围内,赋予刑法术语比其“通常含义”更广泛的解释方法。关于刑法的解释边界的明确,我们应该首先根据刑法条款用语的日常使用来确定“通常含义”,对于普通公民能够理解的字面含义,往往需要根据刑法规范的目的和惩罚的必要性,将刑法条款的边际含义(“可能含义”)与“通常含义” 之间的界限予以反向限缩,从而使解释结论接近于刑法条文术语的通常含义。可以发现,冯军教授认为,“可能含义”应该是解释的底线,刑法的规范目的以及处罚必要性只能是单向限缩犯罪圈的动力。张明楷教授亦采取了折中说,其也区分了刑法条文字面的“通常含义”与“可能具有的含义”。其认为,允许的扩张解释是指刑法条款的字面“通常含义”比刑法的真实含义要窄,因此对字面含义进行引申、扩张,以使其契合刑法的真实含义。扩张解释是对词语通常意义的延伸,而不是超越它们可能有的含义。可以发现,就解释的边界而言,张明楷教授与冯军教授的观点并无本质区别,都是以刑法用语“通常含义”为起点、“可能含义”为终点边界,同时,两者都将处罚必要性作为偏离刑法条文“通常含义”的重要考量要素。

综上所述,刑法条文的“可能含义”与“通常含义”是两个不同的概念,一般认为,核心刑法的立法者必须以普通公民能够理解的语言创设、修订构成要件,也即立法者设置构成要件应以字句的“通常含义”为根据。在刑法解释领域,三种观点虽存在分歧,但均认同应以刑法条文的“可能含义”作为解释底线。法院虽可采纳偏离立法文本“通常含义”的解释方案,但必须确保该解释在文本承载范围内,并履行相应的论证义务。这三种观点的区分基础在于对“可能含义”与“通常含义”的界定差异,其中“通常含义”以一般人的预测可能性、民众理解的自然字义或多数人的语感为判断标准,实际上构成对“可能含义”的限制性解释。然而,无论采取何种解释立场——是将解释严格限定在广义的“可能含义”框架内,还是限缩至具有预测可能性的“通常含义”范畴,抑或主张根据处罚必要性在二者间灵活调整,都未能彻底解决核心问题:如何准确界定刑法条文“可能含义”与“通常含义”。

可能含义与通常含义之内涵界定与判定障碍

(一)可能含义与通常含义之内涵辨析

一般认为,核心刑法的立法者必须以普通公民能够理解的语言创设、修订构成要件,也即立法者设置构成要件应以字句的“通常含义”为根据。同时,对法典条文的每一项解释工作的出发点都是确定文本的“通常含义”,在实践中,“通常含义”被推定为立法机关所期望的含义,在没有理由拒绝的情况下,解释者应予以采纳。这一假设是解释的起点,因为它反映了读者对任何文本的反应过程。作为解释过程的第一步,语言的“通常含义”为司法机关的其他解释工具的应用提供了基础。正如弗雷德里克·鲍尔斯(Frederick Bowers)所言,我们在阅读任何文本的文字时的第一个假设是,作者是以其“通常含义”使用这些文字,只有当我们在阅读文本的某些部分后,越来越怀疑其使用的词语与“通常含义”不同,且每个词都系统地朝着同一方向时,我们才会回溯我们的步骤,开始重新解释这些词。即使是主张超越“通常含义”的法律理论家也承认,在解释中,一个人肯定是从文字(通常含义)开始。学界尽管对“通常含义”的法律相关性达成了广泛共识,但对于如何准确阐述“通常含义”的概念,仍存在着相当大的争论。

那么,什么是通常含义?一个共识的观点认为,文本的“通常含义”是其文字将传达给普通人的内容,也即通常语义是指语言在日常生活中的含义。在某些情况下,法律理论寻求文本的原始“通常含义”或“原始公共意义”,也即文本的文字在过去某个时间会传达给人们的信息。卡瓦诺指出:“解释法律,在‘最佳解读’调查下,问题只是(法律的)文字如何被语言的普通使用者解读。”虽然“通常含义”分析通常与文本主义和形式主义相关联,但各种各样的理论都认可“通常含义”的相关性是法律解释的一个标准。当然,强调“通常含义”并不是所有解释理论都认同,批评者质疑发现“通常含义”所需的经验假设:法官真的有能力、洞察力或工具来确定法律文本的“通常含义”吗?“通常含义”调查一般被理解为经验调查,旨在发现关于意义的描述性事实,认为法律文本必须与其“通常含义”保持一致的理论通常不会将其项目定性为规范性调查。这些理论不是讨论某个理性人应该如何理解文本,而是询问普通人实际上如何理解文本。

实际上,虽然“通常含义”“原始公共含义”和“明白含义”的关系模糊,但许多学者将两者视为同义词,因其共同指向普通人对法律文本的理解。“通常含义”的核心在于以公众普遍理解而非起草者意图为准,正如霍姆斯大法官所言,它关注的是普通人的认知而非作者本意。“通常含义”也不需要我们去关心一些更规范的意义概念——文本中的词语在理想情况下应该是什么意思。同样,“原始公共含义”的相关文献清楚地表明,“公共含义”是指法律向其实际受众传达的信息,“原始公共含义”则被概念化为“有能力的语言使用者在采用该文本时对其可能的最初理解”。因此,在大多数情况下,文本的沟通内容只是其“通常含义”。尽管关于“通常含义”的精确轮廓一直存在争议,但共识观点认为,“通常含义”一般是通过考虑文本读者实际理解文本的方式来确定的。换言之,无论“通常含义”的确定是法律问题还是事实问题,它都是由对语言的通常理解来决定的——无论是通过解释者的语言直觉,还是凭借其他的证据来源。

何为“可能的含义”?国内学者对此鲜有定义,布莱恩教授(Brian G. Slocum)指出,解释者在确定“通常含义”时考虑的来源往往倾向于不适当的广义,因为其捕捉的是“可能的”而不是“通常的”含义,这是由于语言的创造性可能导致无限的潜在含义造成的。换言之,许多解释者把词语的“通常含义”和词典上所包含的含义混淆了,词典中所列明的含义和“通常含义”并不一样,词典中所列明的含义是抽象的,它表示一个词在考虑到其可能被使用的许多可能语境后能够承载的含义范围。一个词或一组词的“通常含义”不是词典所包含的它们的含义,而是一个合格的语言使用者在直接语境中阅读这些词时能够理解的含义,也即植根于词语出现的特定语境的含义为“通常含义”,而“可能的含义”则是指词典中列明的该词语能够出现的所有可能语境中的含义。将“可能的含义”界定为词典中包含该词语的所有可能含义是恰当的,如耶塞克教授所言,条文词义构成解释的基本限制,因此“可能的含义”始终应作为解释的最宽边界,该标准具有不可替代性,它是确保刑法解释客观可检验的唯一标准。而词典显然可以为“可能含义”的客观可检验性提供一个坚实的基础。

(二)可能含义与通常含义之判定障碍

虽然“通常含义”“可能含义”的理论内涵已经某种程度得到澄清,但在全面修订刑法典的过程中以及司法实践中,如何实际判定何为“通常含义”“可能含义”仍存在很大障碍,这也是我国理论界很少对此予以着墨的原因。关于“通常含义”“可能含义”实际判定的障碍主要存在以下两点:

其一,解释者常误将“可能含义”当作“通常含义”。虽然语义学界对词义本质存在分歧,但都承认词语具有多重意义维度,需结合具体语境理解。实践中,解释者虽主张语境分析,但往往超出语境背景,转而依据法规目的或立法历史来确定含义,导致偏离词语的普通语义。确定“通常含义”是创造性解释过程,超越单纯语言规则运用。目的考量、结果预判及常识判断始终贯穿其中。当语言模糊时,这些非语言因素往往起决定性作用。“通常含义”的判定明确要求法院区分通常含义与边缘含义,但这种区别缺乏明确标准。文本清晰度判断具有高度主观性,法院亦无法确立“通常含义”的客观评定标准。在许多情况下,“通常”和“非通常”标签要么是任意的,要么是结果驱动的,缺乏一个客观的判断基准。因此,这就造成很难区分“通常含义”与“可能含义”。

其二,语言表达没有固定的含义。源于语言的多义性和语境依赖性,语言表达的含义来自使用它的语境(语境原则),也即必须在一个句子中,而不是孤立地询问词的含义。根据维特根斯坦的说法,句子是可以执行语言行为的最小语言单位,句子不只是一系列词的简单组合。反之,一个词只能在句子的语境中发挥作用,表达出内容。维特根斯坦将这一语境原则引入到更广泛的语境“语言游戏”中,句子通过在具体情况下的使用而获得意义,每个句子都有自己的情境。试图涵括一个语言符号全部意义的“词汇语义”只是描述了单个词语潜在的意思,而其具体的意思则只能从特定的语篇中获得。然而,词语的这种“语篇意思”也不能脱离于言语行为,因为只有通过言语行为才能形成语篇,其不能脱离于由交往参与者的意图和言谈情境所确定的、进行表达的具体社会行为。除了这种从进行实际表达的情境中可以得出的意思之外,再追问词语“通常文义”是没有意义的,追问可能的文义往往也是徒劳无益的。因此,如果我们要有一个“通常含义”的理论来追踪我们实际使用和解释语言的方式,我们就不能人为地将语义和语用考虑区分开来。如果不考虑语用语境,就看不出有任何依据来相信语义。然而,语用语境复杂多变,受文化、场景、交流双方背景等多重因素影响,难以精准把握,确定语境绝非易事。

可能含义与通常含义之判定方法

在全面修订刑法典以及解释法典条文的过程中,立法者与法律解释者如何找到、确定文本的“通常含义”?解释的边界——条文“可能含义”如何确定?在我国,学界对此论述不多。事实上,这个问题的答案与不同的解释性证据来源有关。当前存在三种最流行的解释性证据来源揭示词语的使用模式:个人直觉、词典定义以及法律语料库语言学。

(一)个人直觉

解释性证据的第一个共同来源是个人直觉。像任何其他文本一样,解释一项制定法最先是一次阅读一句话。在阅读每一个句子时,读者会根据词语及其在句子结构中的排列形成对其意思的印象,这种印象可能会受到紧接着之前或之后的句子的影响。读者了解到其正在阅读一项涉及特定主题并针对特定目的的法规,这也可能会对其产生影响。文本、语境和目的的互动通常是即时和直观的,且没有自我意识的分析。它们利用了读者的语言知识和大量事实、假设、价值观和信念,这些事实、假设、价值观和信念储存在读者个体的头脑中,有助于形成“共享智慧”或“常识”。因此,立法文本中一个词或一组词的“通常含义”是复杂解释过程的产物。有能力的读者会根据他们的个人知识和经验,尽可能多地考虑周围的文本和情况,从而理解文本,赋予这些词语以意义。为界定“通常含义”,司法裁判者作为解释主体,会凭借个人语言直觉展开判断。这些直觉或多或少能够准确反映给定文本所明示或暗示的内容。

值得注意的是,普通人对法律文本的集体理解与“通常含义”密切相关。但区分集体直觉和个人直觉是至关重要的。通常,当法官和学者在解释中运用直觉时,他们不会参考调查证据。相反,他们依靠自己的直觉。在简单的情况下,语言直觉通常是识别“通常含义”的有用来源。如法规禁止“车辆”进入公园的例子,大多数人都会明白,该法规不会禁止任何人用婴儿车将婴儿带进公园,因为每个人都明白,婴儿车不是一种交通工具。即使对某些情况存在一些分歧,语言直觉在许多其他情况下也提供了直接的指导。然而,在疑难案例复杂的情况下,语言直觉可能无法帮助识别通常含义,尤其是在存在重大分歧的情况下。事实上,研究表明,人们往往会受到错误的共识偏见的影响,(错误地)认为这些偏见是衡量人们共识的良好标准。这一担忧会因一个事实进一步加剧:对于独立的解释者而言,难以确定自己面对的究竟是简单案例,还是疑难案例。原旨主义者和非原旨主义者都认为,个人直觉是现代解释中容易出错的证据来源,也是历史解释中非常可疑的证据来源,而且直觉的错误在实践中也很难识别。因此,在法律解释中,依赖不可靠的语言直觉是一种危险的策略。

(二)词典作为辅助工具

在德国,法院判决有时会参考词典和百科全书来确定该词的含义,这种做法是允许的,有时甚至被要求,德国联邦最高法院在审理刑事案件时就经常参考一系列词典以及主要百科全书。词典作为解释的得力工具,表面上具有客观、中立和科学的特性。毕竟,当我们旨在探寻一个术语的“通常含义”时,了解词典对该术语的定义不失为有效途径。在制定法解释中,词典定义作为实用、确切的切入点,能有效验证解释者的直觉判断,减少解释的主观随意性。例如,关于人工养殖或者驯养的野生动物能否成为破坏野生动物资源犯罪的犯罪对象,一直存在争议。“两高”在2022年颁布的《关于办理破坏野生动物资源刑事案件适用法律若干问题的解释》第13条规定:“涉案动物系人工繁育,具有下列情形之一的,对所涉案件一般不作为犯罪处理;需要追究刑事责任的,应当依法从宽处理:(一)列入人工繁育国家重点保护野生动物名录的;(二)人工繁育技术成熟、已成规模,作为宠物买卖、运输的。”可以发现,司法解释某种程度上将部分人工养殖或者驯养的野生动物排除在刑法的规制范围之外,其中一个重要的理由就在于根据词典的解释,“野生,本意指野外自然生长”,因而从文义上看,野生动物与“人工驯养或培育”是相对的概念。

然而,词典亦存在一系列问题。首先,词典中的定义可能是规范性的。词典虽被视为理解概念的参考依据,但其提供的实为规范性定义而非实际使用中的“通常含义”。德国联邦最高法院就曾将“蘑菇”视为《麻醉剂法》(BIMG)意义上的“植物”,其放弃了专业百科全书的定义,这虽然与生物学上将蘑菇单独分类的做法相悖,但(法院认为)此时起决定作用的乃是日常语言习惯——蘑菇被当作是植物的一种。其次,解释中使用词典存在“词典购物”(dictionary shopping)的风险。同一概念在不同词典(甚至同一词典)中常有多种释义。由于缺乏系统的释义筛选标准,解释者可能选择性采用符合自身倾向的定义。最后,词典种类繁多,在编纂风格、收词范围和释义设置上都存在程度不一的差异,在探寻历史意义时,难以判断历史词典对其出版时实际使用语言的描述,是否准确、全面。

波斯纳法官在United States v. Costello案中拒绝采用基于词典的方法来理解“通常含义”,其指出,“词典的定义是文本的,而句子的意义在很大程度上取决于语境,包括各种背景理解。”出于这个原因,波斯纳法官借助谷歌,获取了关于“窝藏(harboring)使用频率的粗略指数”。波斯纳法官将“通常含义”分析引导到实证调查中,其使用谷歌搜索“窝藏逃犯”和“窝藏客人”(harboring fugitives and harboring guests)等短语的相对点击数,发现前者的命中率高于后者,所以得出结论,“窝藏(harboring)”这个词的实际用法“具有……故意保护特定群体的成员不受当局管辖或伤害的含义”,与提供住所(sheltering)存在明显不同。因此,本案中动词“窝藏”(harbor)的“通常含义”需要被告主观上必须有保护或隐藏该外国人,使其不受当局管辖的故意,仅仅为外国人提供住所是不够的。但是,正如有学者所言,波斯纳法官采用的谷歌搜索分析法虽具创新性,但存在明显缺陷:首先,谷歌算法的不透明性可能导致无法识别的排序偏差;其次,该工具存在功能局限,既不能限定搜索动词形态(如仅搜索“harbor”而非“harboring”),也无法按语言社区或时间段筛选结果;再者,网页点击量并不能准确反映词语的实际使用频率。这些方法论局限影响了实证分析的可靠性。

引入法律语料库作为解释工具之提倡

(一)法律语料库之优势

面对波斯纳法官测量方式的不足,有学者认为,“法律语料库语言学”某种程度上可以弥补。语料库是一组语言数据,包含来自书籍、报纸文章、在线出版物和其他来源的文本。近年来,法律语料库语言学已经从较小的搜索演变为“大数据”方法。语料库语言学的定义特征是:“声称有可能用文本语料库实际‘代表’一个语言使用领域,并且有可能通过对该语料库的分析来实证地描述语言使用模式。”通过语料库分析,我们能够基于可观察、可量化的数据开展严格实验,从而验证关于语言的各种假设。语料库数据可以告诉我们,在自然语言中,不同含义的相对频率,亦即一个词语或短语在给定的语境中有多个潜在含义。实际上,如果要寻找“通常含义”“可能含义”。就必须分析某一特定术语中相互竞争的意义的相对频率以及是否存在对术语的该种解释,那么,语料库语言学似乎是最有希望的工具。同时,语料库数据还有助于解决法律文本解释中不同类型的语言的模糊性问题,即“一个词或短语存在的边界情况”。当今,语言语料库存在很多不同的种类,每一种都是为了满足一组关于语言使用的特定实证问题的需要而定制的。

语言语料库的优势在于其可以完成人类语言直觉无法完成的各种任务,允许解释者通过一种不那么武断、更容易测量的方法来观察语言的使用方式。例如,语料库可用于测量给定语言社区和给定时间段内词语和词义的统计频率,也可以分析词语搭配,能够发现某类词在通常使用方式上存在的偏向性。正如上述, 词语通常是根据其所在的语义语境来解释的,搭配程序可以显示一个词通常出现的语言语境的可能范围,并可以提供关于可能含义范围以及含义划分的有用信息。同时,语料库还具有语境一致性或关键字(KWIC)功能,允许用户在数百种语境中查看特定词或短语,所有这些都在同一页的运行文本中,这使语料库用户能够系统地评估语境中的词语。通过语言语料库获得的数据使人们能够系统地进行此类查询,并对一个词的可能用法范围及其不同含义的频率获得有意义的、可量化的见解。在法律解释领域采用较多的研究方法是基于语料库的词典学研究范式,其通过整合大量的语言材料,分析统计词语在不同语境下出现的频率、搭配和含义等信息,进而来分析词语的用法和含义,此种方法是将词汇语法型式视为语义单位,被广泛运用在语义消歧过程中。

托马斯和莫里森教授(Thomas and Mouritsen)积极倡导在确定法律文本的“通常含义”时使用语料库语言学,并认为语料库语言学作为一种客观、科学、数据驱动的法律解释方法,作为一种跨学科的方法,其为当前许多解释理论提出的下述问题提供了答案:制定法文本的“通常含义”是什么以及何种解释不在“可能含义”之内。可以认为,语料库语言学代表着对当前解释理论的彻底突破,其吸引力在于其承诺增加可预测性,并减少解释者个人偏好在制定法解释中的作用。也即,语料库语言学认为应将制定法字句的“通常含义”“可能含义”视为一个经验问题,主张通过查阅语言学数据库中一个术语或概念以某种方式使用的频率来确定。这么做的原因在于,立法者与解释者有充分的理由以一种普通公众理解法规的方式来制定、解释法规(尤其是刑事法规),而各种非法律出版物中使用词语的频率可以告诉我们,当这些词语出现在法规中时,公众对这些词语含义的通常认知以及不可能认知。语料库语言学强调理性人并非经验频率问题的合适替代者,理性人标准只不过是“司法直觉”,不够客观,也不会产生可预测的结果。语料库语言学更关注非理性人的经验标准,唯有如此方可最大化公民对立法的预测可能性以及最小化司法自由裁量权。

值得注意的是,语料库语言学并非试图阻止解释者在制定法解释中依赖自己的判断,语料库语言学的使用,只是为了更好地使得解释者在解释的过程可视化,判断不再仅仅是“主观感觉”。无论是抽象的立法以及司法解释的制定,抑或司法判决,都必须得到解释和论证。这就是为什么,当法官解释一项法规的含义时,其不会在自己的意见中简单地写上“因为我这么说”。语料库语言学的吸引力在于其符合我们对科学和数据的尊重本性。人类判断具有主观性和不确定性,因此决策者倾向于借助客观事实来论证决定,以减轻争议性裁决的辩护压力。但是,正如有学者所言,正义可能只能由人来衡量。语料库语言学将根据解释者搜索的方式为其提供不同的答案,其不会给出一个最终的“正确答案”,从搜索策略到结果解读,每个环节都涉及解释者的主观判断和选择。因此,语料库语言学本身并不会直接决定解释结论,其只是旨在为我们判断一个词的“通常含义”提供一个强有力的参考,其作用在于修正、调试不太可靠的立法、司法直觉,进而为法典条文的创设增加可理解性、为司法解释的制定增强说服力。

(二)我国引入法律语料库作为解释工具的客观需求

法律语料库语言学虽没有词典使用那么普遍,但其在世界各国的使用频率和受尊重程度也在增加。美国最高法院早在1998年就通过报纸数据库检查词汇使用模式,实际上,语料库技术参与法律解释在美国已非常普遍,比如美国杨百翰大学开发的网络新闻语料库(NOW)和历史美语语料库(COHA)就得到了非常广泛的应用。例如,美国最高法院就通过查询法律语料库辅助判断“carries a firearm”(携带武器)的“通常含义”是否仅限于在身体上携带武器,而不包括将武器放于汽车的置物箱中,以及枪支的射击是否仅指开一枪。在德国,这些问题则可在“德国语言协会德语查询库”进行查询。

在我国,采取法律语料库语言学方法更具有紧迫性与优势,相较于其他国家,在刑法典的立法风格上,我国刑法条文较为粗疏,某种程度上难以满足规范接收者对构成要件规制范围可预见性的要求,这亟须在刑法典全面修订的过程中,立法者采用一种客观可视的方法选择构成要件字句。同时,就刑法典条文解释而言,最高司法机关承担很大一部分的解释任务,其颁布的具有立法外观的抽象司法解释经常遭受学界质疑,其中很大的原因就在于学界认为这些司法解释突破了“刑法条文”,缺乏一个明确可视的标准。实际上,面对学界对刑法司法解释突破刑法条文“通常含义”或者“可能含义”的质疑,最高司法机关往往选择沉默,几乎不将其解释过程予以客观展现,外界往往无法发现其思考推论过程。同时,最高司法机关也经常在解释的过程中过度增加法益保护或者其他刑事政策因素的考量比重,经常会不自觉地突破文义。

在当今大数据时代,为提升法典化时代普通公民对多数核心刑法条文规制范围的可预见性,以及解决司法解释“解释黑箱”的问题,刑法立法者在立法以及最高司法机关在制定司法解释时,有必要引入大数据语料库语言学技术,对刑法文本的“通常含义”或“可能含义”进行可视化的说理。例如,就司法解释而言,语言语料库技术可以使得最高司法机关解释某个刑法条文中“词、句”的过程变得明显,因为软件会在解释者面前的屏幕上显示问题。面对某一解释结果是否在刑法条文的“可能含义”范围内,最高司法机关可在由已经收集更新的所有正规词典、书籍、报纸文章、在线出版物以及其他相关来源的文本组成的法律语料库中直接查询。而关于某一解释是否属于“通常含义”,则可在考虑语境的情况下,通过统计词语和词义的频率予以客观辅助的判定。

(三)我国引入法律语料库作为解释工具的可行性

事实上,为应对法律语言的理解和使用中的不规范甚至混乱现象,早在2005年就有学者提出要加快中国法律语言规范化,并成立了“法律语言语料库”科研攻关课题组,此举得到了最高人民法院、最高人民检察院、司法部、教育部等相关机构的大力支持。经过两年的艰苦工作,2007年,在司法部司法研究所等相关部门的协助下,法律语言语料库的研究和建立工作初步宣告结束。但很可惜的是,限于当时的技术与资金局限,该法律语言语料库并未真正实现为法律解释提供快捷、有力分析工具的目标。数字技术与司法的结合,促使了智慧司法的发生发展。随着大数据、人工智能技术的快速发展,在当代建构法律语料库的时机已经到来。

以ChatGPT为代表的生成式人工智能产品在2022年底推出,此类大语言模型通过连接海量语料库来训练自身模型,以实现更好的自然语言理解。模型训练是否成熟直接取决于使用的语料库是否全面,交互结果的政治立场和倾向主要取决于训练语料库内容。可以预见,为促进生成式人工智能的发展,全球资本、技术都必然会集中于语料库的建构。对法律语料库来说,也是如此。当然,法律语料库作为语料库的一种,其也会出现一般语料库构建过程中通常出现的数据质量问题,其中语料库的数据质量通常会受到训练数据不足的影响。针对训练数据不足的挑战,我国目前完全有条件且有能力采取一系列方法保证数据质量。

一方面,虽然我国目前欠缺现成的系统化、优质的数字化中文语料,但是,我国国内的中文语料极为丰富。以期刊全文数据库为例,目前我国期刊数据库收录国内各类期刊7400种,我国国家图书馆是亚洲最大图书馆,藏书3700万册,且我国域名总数为3187万个,其中国家顶级域名“.CN”数量为1956万个,占域名总数的61.4%,连续十年位居全球第一。可以发现,这些载体上存在巨量的中文数据语料。面对巨量的中文数据语料,只需要集中技术力量专注于创建更多的注释,为数据集提供更多标签信息,即可以产生高质量的中文数据语料。事实上,通过半监督学习、迁移学习、生成对抗网络等技术自动标记数据集,已经可以极大提升数据语料的标注效率,为提升数据语料质量奠定坚实的基础。

另一方面,法律语料库作为专用的语料库,与一般语料库相比,往往因为建设经验有限,难以形成建库的共识和标准,从而存在更多的规范性问题。具体而言,语料库建设的规范可以分为编码规范和内容标注规范。编码规范由行业惯例和国际标准主导,国内语料库研究领域的语料标注多使用行业惯例;而在内容标注规范方面,尽管国家出台了《信息处理用现代汉语分词规范》《信息处理用现代汉语词类标记规范》等文本语料库标注标准,但作为推荐性标准,行业采用率并不是很高。对此,可采取由最高人民法院、最高人民检察院、司法部及公安部等官方机构牵头,组织学术机构广泛参与,在形成行业共识的基础上开展社会协商制定规范,并据此分领域分类别制定国家标准且定期更新的实施策略。同时,通过产业界和学术界的联合行动研究规范标准,并通过配套软件工具的开发和推广使用,建设规范标准的行业认同和生态环境。

结语

刑法明确性是罪刑法定的基本要求。法律规定若模糊不清,公民将难以辨识行为边界,进而抑制合法行为。为此,刑法典必须提供清晰的行为指引,使公众能基于条文语义形成稳定预期。这就要求在刑法再法典化过程中,对非技术条文应采用公众普遍理解的“通常含义”作为表述标准。同时,刑法解释必须恪守文义边界,即使存在处罚必要性,解释也不得突破“可能含义”的限度。立基于刑法的行为规范属性,刑法条文往往是公民确定其未来行为最重要的信息源之一,因而,对刑法条文“通常含义”的判定应更多地考量经验调查。故而,在确定“可能含义”与“通常含义”时,应适时地引入法律语料库技术,提升刑法典条文的可理解性以及增强对司法解释与刑法文本之间依附关系的可视化说理,并以此限制最高司法机关在解释的过程中过度增加法益保护或其他刑事政策因素考量比重之倾向。

-向上滑动,查看完整目录-

《交大法学》2025年第3期目录

【特稿】

1.养殖权制度的体系构建

——以养殖权的用益物权属性为中心

王利明

【法学原理与制度变革】

2.《南极条约》当事国实施南极考察活动的管理制度比较研究

吴慧、牛宇燕

3.论BBNJ协定视阈下国际法制度性话语权的构建

张磊

4.论“区域”环境补偿基金法律制度的完善

王勇、王逸贇

【法学交叉与跨学科】

5.实体与程序之维下的配偶财产利益保护

——以夫妻共同财产处分及夫妻债务清偿为例

汪洋、姜惠雯

6.强制执行程序中的动产让与担保

王立栋

7.论民事强制执行中的平等主义

史明洲

8.债权执行场域下次债务人抵销预期保护的实现路径

——以《民法典》第549条第1项规范意旨为基础

李春

9.数字虚拟财产权强制执行研究

王常阳

【科技创新与数字法治】

10.法律语料库技术与刑法文义的智能辅助判定

江海洋

【法学新锐与新知】

11.二审程序中认罪认罚案件的实践面相及其反思

崔玮

12.论法典化背景下会计法的体系化建构

张崇胜

《交大法学》于2010年以“以书代刊”形式创刊,2012年获批正式刊号,并于同年以季刊发行,2022年改为双月刊。期间历时整整12年,恰是地支一轮。作为卷帙浩繁法学期刊中的如米苔花,秉承“君子有所为,有所不为;知其可为而为之,知其不可为而不为”之理念,默默成长,希望以点滴努力,开辟言路,传达百家之言,给时代留下可供回望和审思的法学作品和思想。本刊改为双月刊后,每单月出版一期。在此之际,片刻驻足、冷静回望,如何提高学术品位,构建表里澄澈的学术公共场域,任重而道远,我们自当立意勤勉耕耘。

点击进入下方小程序

获取专属解决方案~

责任编辑 | 郭晴晴

审核人员 | 宋思婕 张文硕

本文声明 | 本文章仅限学习交流使用,如遇侵权,我们会及时删除。本文章不代表北大法律信息网(北大法宝)和北京北大英华科技有限公司的法律意见或对相关法规/案件/事件等的解读。