文 | 山东省潍坊滨海经济技术开发区人民法院 宫玉峰

《人民法院第五个五年改革纲要(2019-2023)》中指出,借用现代科技手段提高智慧法院建设水平,形成信息化建设与司法体制改革合力,共同推进审判体系和审判能力现代化。可以预见,在未来的一段时间内,人工智能等技术在“智慧法院”建设中将发挥重要作用。

计算能力、大数据、算法是构成人工智能的三个核心要件,而算法居于其中的核心地位。算法在人工智能运用中以各种计算机代码的形式决定着人工智能设备运行处理问题时的进路及实施。算法的作用在于认识、提炼、总结法律决策的规律,而采用何种算法是决定司法人工智能效果的关键。本文从算法的特性中选取出隐蔽这一特性,并对隐蔽性进行分条深入分析,探析算法决策隐蔽性与司法裁判公开性的冲突及其融合路径。

司法裁判领域算法决策的应用及挑战

KNN、朴素贝叶斯、C4.5、SVM等算法在司法智能领域应用广泛。从我国国内首款法律机器人“法小淘”的正式亮相,到后来陆续出现“法小宝”“法狗狗”等人工智能机器人,毋庸置疑,这些系统极大地提高了法律工作的效率。它通过先进的语音识别系统,用机器学习的相关算法建立了一套文本与案例之间的初始相似模型。由于大量人工智能法律产品的出现,部分媒体将2017年称为“科技司法元年”。

上海刑事案件智能辅助办案系统是法院系统内部运用算法较为成熟的应用之一。这一系统旨在将专家经验、模型算法和海量数据相结合,把统一适用的证据标准嵌入数据化程序中。该系统的应用得到肯定之后,上海法院又拓宽了算法在其他司法领域的运用。但当央视《法治在线》栏目曝光一起特斯拉因自动驾驶功能致人死亡的事件后,人们对算法的“威力”有了更深的认识。一名男子驾驶特斯拉在高速公路上行驶,与前方的道路清扫车发生追尾事故后身亡。据交警部门调查,在碰撞发生前,特斯拉车辆并没有进行任何躲避和减速。姑且不论驾驶者在驾驶车辆中是否精力集中,人们应该清楚认识到算法带来的汽车驾驶自动化虽然是未来的发展趋势,但自动辅助驾驶算法的安全性仍令人担忧。不管是法律机器人还是带有自动辅助驾驶功能的汽车,都离不开算法的重要支撑。从运用算法实现记录人们活动轨迹、心跳、脉搏的智能手环,到风靡一时的智能扫地机器人等各种各样的人工智能产品,在人工智能时代,享受方便的同时,我们的一举一动所留下的电子痕迹,都可能通过各种算法变成可供处理、分析和利用的数据。作为司法实践人员,在应用这些智能辅助软件时是否了解过该算法的原理和运作过程?各种算法中存在的风险或者缺点都将可能影响其在司法实践中的可靠性。

算法决策的隐蔽性对司法裁决造成的障碍

人工智能时代,人们将选择权和决策权直接让渡给算法,却忽略了算法本身并非中立。算法技术开发人员用机器学习的方式将法律编写成算法时,需要对数据库中的数据进行转化,使其成为算法可以进行识别并运算的符号。而转化过程、效果及形式语言转化方法并没有完全向司法审判人员公开。算法技术开发人员可能利用司法审判人员无法熟练掌握算法技术,改变算法编程或者留有一定的“后门”及漏洞,进而操控算法决策结果。除却上述算法技术开发人员有意为之的情况,还可能存在其受自身的阅历、教育经历以及主、客观各项因素的影响,导致算法本身存在偏见,从而影响决策的科学性及客观性的情况。通过模拟训练形成的算法建立在对海量文书学习、训练的基础上,可如何保证训练的样本文书全都绝对正确又是一个难题。上述问题从而引出了算法决策的不公开性、依赖性、偏见等问题,这些都是广义算法隐蔽性的范畴。

尽管司法人工智能在法院领域实现了多点开花的广泛应用,但据笔者观察及自身体验智能办案辅助系统的经历,目前在司法领域应用的人工智能产品大多只是封闭的“专家系统”,而不是有自主学习能力的“人工智能”。司法人工智能技术及产品在司法实践中的运用尚需进一步完善。例如,法院系统应用比较广泛的类案智能推送系统就存在一些不足,部分系统所推送的类案并不是法官所需的类案,内容也不够精准。推送的类案时间范围带有局限性,使得类案智能推送的应用效果大打折扣。上文提到的上海刑事案件智能辅助办案系统主要着眼于证据的合法性进行自动审查,侧重于形式审查方面,而在实质审查方面还存在一些障碍。此外,各个法院现在应用的人工智能办案辅助系统至少有两三套。以笔者所在的基层法院为例,在法院内网中安装的办案辅助软件就有智审2.0、一体化工作平台、电子卷宗随案生成系统,但在使用过程中各个系统之间的数据并不共享。在增加相应工作量的同时,由于各个系统中运用的算法原理及运行过程不同,导致同一案件形成的辅助参考结果可能也不尽相同。

最高人民法院最近几年先后建成的司法公开平台、一站式多元解纷机制、一站式诉讼服务中心网站、在线调解平台等机制,都是借助现代信息科技手段,使公民可以利用各种信息渠道及时实现对司法的需求和对裁判过程的监督,从而保障公民的权益,有效回应了新时代公民对司法公开的新需求。但是算法自身存在的隐蔽性与司法裁判要求的全过程的公开性会产生冲突,影响公开性的效果,进而可能影响人民法院新时期的建设。

司法实践中,一些司法机关将核心算法的编辑任务外包。而算法是决定系统运算结果的关键所在,不同的算法生成的结果存在不同。且算法技术的运行程序和原理只有算法技术开发人员能够获取,竞争性商业机密也往往成为算法决策不对外公开的主要“挡箭牌”。算法开发技术企业总是倾向于更有利于自身利益的算法,以更好地控制智能系统。近年来,各类挖掘主体与校准结果持有者垄断数据仓库与分析技术,通过篡改测评数据、运算法则或结论以干预第三方决策的事件时有发生。

除了保密性外,更重要的问题是,算法即使公开,司法裁判人员由于专业知识所限也可能无法理解其中的重点,无法从技术层面上对编辑工作进行有效监督。算法决策与司法裁判既需要一体化协作,也应当相互监督配合,只讲求司法裁判的公开透明,而忽略了对算法决策的公开性要求,司法裁判必然会单兵作战,不能很好地实现法院信息化建设应有效果。在对算法决策缺少监督的情况下,势必对司法裁判的公开性造成一定的冲击。

对人工智能进行模型训练是算法进入应用的必备程序,是最为关键的一步,也是体现各个算法开发技术企业核心竞争力的标志。但是,算法技术开发人员在现有技术条件下无法保证训练的样本文书全部绝对正确。如果文书本身错误或存在瑕疵,基于这些文书训练产生的模型与算法就可能遭遇精确性困境。进而,再遵循这些算法对法官办案进行辅助,可能的结果就是部分经验错误被不断放大,并形成、固化对错误的“路径依赖”。

司法裁判运用国家赋予的司法权解决纠纷和宣传法律意识、传播社会正能量,具有独立性、决断性。因而司法权必须是向全社会公开透明的权力,必须在公开的场景下运行。于当事人,司法裁判是公开的竞技场。如果司法机关在裁判过程中运用了基于错误或者存在瑕疵的文书训练产生的模型与算法,并将其结果公之于众,人民群众就有理由质疑司法裁判的公正性和判决的合法性。

司法是维护公平正义的最后一道防线,是人民群众维护自身权益的最坚实的保障。但裁判者运用带有偏见的算法必然会损害司法的权威。算法偏见的形成因素有多种。首先,算法开发技术企业与法院主体之间对实质需求的认知存在一定的偏差,法院作为甲方一般会向算法开发技术企业提出类似“公正、高效、服务”等宏观抽象的需求,二者对实质性需求的沟通一旦出现问题,结果便会存在偏差,最终会影响司法的公信力;其次,法律工具主义思维的盛行为司法偏见形成埋下了隐患。部分人工智能产品输出的结果之所以往往被法官和公众所质疑,是因为工具主义盛行下的“只讲方法不讲目的”割裂了法律和技术的关系,导致输出结果无法与司法需求相匹配。例如,在美国的刑事司法系统中运用较多的风险评估算法有助于法官预测审前保释人员的行为,帮助法官就被告保释相关问题作出决定。实践中也证明,该算法确实减少了在监狱中待审人员的数量,并缩短了监禁时间,降低了各项系统成本。但该算法在设计中直接建构了系统性偏见,用基于定量数据的歧视取代了法官的隐形歧视。因此,必须承认算法与法官的独立裁量权运行机制不同,造成算法的系统性偏见难以避免。

算法决策隐蔽性与司法裁判公开性

融合路径分析

法院的智慧依靠法官,而智慧的法院则需要技术。在智慧法院的建设中,我们必须强调以人为本,谨防陷入算法决策陷阱的泥淖,深入认识人工智能的算法决策与司法裁判之间的关系,尤其是理解算法决策中隐蔽性对司法裁判公开性所造成的影响,并逐一对算法隐蔽性中隐含的各种弊端加以规制,努力克服算法决策对司法裁判的负面影响,发挥算法决策在司法人工智能领域的各项功效。融合过程中可倒逼司法裁判者更加规范运用法律知识,打牢算法决策的基础,从而进一步有效开发法官办案智能辅助、裁判文书智能分析、法律文书自动生成及纠错系统、案件类型特点及成因自动分析等法律人工智能产品,以实际行动促进人工智能助力审判现代化。

强化司法裁判人员主体地位。智慧法院建设的最终目的是为司法裁判提供方便和服务。在建设过程中要充分考虑到司法裁判的固有属性,要在尊重其属性的前提下,将法院工作的法律逻辑和社会知识逻辑转化为数字化的算法。这是用算法决策为司法裁判进行服务的根本遵循路径。构建以法官为中心,人机合一的工作模式,人必须是算法的立法者和控制者。在强化司法裁判人员主体地位的前提下,对司法裁判人员作出必要的技术和制度安排,从而防范算法决策的隐蔽性及对其形成的“路径依赖”。

算法决策者承担公开义务。决策者承担公开义务是规制算法决策隐蔽性最直接有效的方式,不仅可以平衡算法开发技术企业与法院之间的信息不对称,而且相比于对算法决策的结果进行控制更加有效。具体公开路径应包括两方面。第一,算法开发技术企业应当依据外包合同的约定向司法裁判机关就产品中算法的运行原理履行详细说明义务;第二,司法裁判机关应当依据《关于司法公开的六项规定》等关于司法公开的相关文件规定要求,将除涉密外的算法内容以群众可理解的方式进行公开,以便接受群众监督。

注重培养复合型人才。既懂司法程序又懂算法运算的复合型人才能为算法在司法人工智能中的运用提供有力支撑。正如李彦宏等人在《智能革命》中所指出的那样:“人工智能技术可能不只是理工科专业人士的领域,法律人士以及其他治理者也需要学习人工智能知识。”国内的一些政法院校已经深刻认识到这点的重要性,西南政法大学、北京大学先后成立了人工智能法学院,通过与相关技术企业以及司法裁判部门合作,联合培养复合型法治人才,为人工智能时代背景下的法治建设提供服务。山东大学(威海)法学院设立了计算法学特色班,着力培养拥有法学专业基础并具有机器算法应用能力的文理交叉复合型人才。

提高算法训练数据的质量。如果使用了本身带有偏见的数据,再先进的算法也无济于事。提高质量的路径应包括两方面:第一,为预防抽取本身带有偏见的数据,首先应采用最大范围内的数据,避免因数据样本范围问题造成偏差;第二,确定要采用的训练数据后,有必要运用深度学习方法对即将采用的算法数据显示的价值观念与我国法律价值要求是否存在冲突加以审查,并对不符合法律价值要求的数据进行更正或剔除。

设立算法审查专门机构。信息披露并不是万灵药,可以考虑设立算法审查专门机构,构建“人工纠错”程序。机构人员应包括司法裁判机关人员、算法开发技术企业、法律专家等不同领域的人员。专门机构应对算法运用的全过程进行监管,除了应向司法裁判机关进行算法信息披露,还应向专门机构进行通报备案;对即将投入使用的司法人工智能产品进行审查检验,使其符合司法裁判规律;对已投入运行使用的司法人工智能产品进行运行效果评估,以便及时发现在后续的使用过程中违反裁判规律,影响司法裁判公开的算法运算规程;最后亦应建立一定的责任倒查机制,要求通过垄断技术、篡改算法干预决策的人员承担一定的法律责任。

本期封面及目录

《中国审判》杂志2021年第6期

中国审判新闻半月刊·总第268期

编辑/孙敏 实习编辑/衷烨晗