联邦法官乔恩·蒂加尔本周作出一项关键裁决,驳回了英伟达要求驳回人工智能版权侵权诉讼的大部分动议。据Torrentfreak报道,法院认定英伟达分发给客户的部分脚本除用于实施侵权行为外,并无其他合法用途。这一裁决意味着,即便在美国最高法院近期考克斯诉索尼案的严格框架下,针对这家芯片巨头的间接侵权指控仍可继续推进。

这起集体诉讼始于2024年初。作家阿卜迪·纳泽米尼安等人指控英伟达的人工智能模型使用Books3数据集进行训练,而该数据集收录了大量源自盗版网站Bibliotik的受版权保护作品。随着案件推进,原告还曝光了英伟达与安娜档案馆的关联,质疑其曾试图获取该影子图书馆海量盗版图书资源的高速访问权限。

打开网易新闻 查看精彩图片

今年1月,英伟达正式反击,提交全面驳回诉讼的动议,称原告指控纯属臆测、表述模糊且缺乏法律依据。具体而言,英伟达请求法院驳回涉及Bibliotik、Books3及The Pile数据集的直接著作权侵权指控,同时针对间接侵权指控展开抗辩。后者核心在于:英伟达涉嫌向企业客户分发专用脚本和工具,供其自动下载包含Books3数据集的The Pile数据集。

英伟达的辩护策略紧密围绕最高法院考克斯案裁决展开。该公司辩称,考克斯案收紧了侵权认定标准,要求必须存在"通过特定行为主动怂恿侵权"的行为;同时强调其NeMo Megatron框架整体具备大量非侵权合法用途,若要认定侵权,必须证明该公司将此框架宣传推广为盗版工具。

蒂加尔法官并未采纳这一逻辑。他未从整体层面评判Megatron框架,而是聚焦于英伟达分发给客户、用于自动下载并预处理The Pile数据集的专属脚本。法院最终认定,这些脚本除协助实施侵权行为外,没有任何其他用途。法官在裁决中写道:"涉案脚本据称唯一作用就是加快侵权流程,这与索尼案中的数字录像机系统、考克斯案中的互联网服务有着本质区别。"

这是首例适用考克斯案新标准的人工智能训练侵权案件。法院认定,英伟达提供的相关脚本同时满足了间接侵权判定所需的"诱导侵权"和"专为侵权设计"两项新标准。这一结果显然不符合英伟达预期。

英伟达还申请删除诉状中所有涉及BitTorrent协议的表述,同样遭到否决。蒂加尔法官指出,原告诉状中仅一处提及BitTorrent,且并未指控英伟达存在不当行为,只是客观描述Bibliotik网站通过该协议传播盗版作品。法官强调:"BitTorrent仅仅是一种工具,并非文库或数据集。"他援引《福尔肯斯诉怀兰环球公司案》做出生动类比:要求驳回BitTorrent相关指控,"无异于在海豚画作侵权案中,要求驳回所有与画笔相关的指控"。

结合Meta在另一桩同类诉讼中的困境,便能理解英伟达急于剔除BitTorrent内容的用意。Meta因使用BitTorrent做资源分发,被提起直接著作权侵权诉讼。英伟达显然希望在案件进入证据开示阶段前,杜绝此类追责可能性。

英伟达并非全无收获。蒂加尔法官驳回了针对其替代侵权的相关指控。构成替代侵权需满足两个条件:有合理证据证明英伟达有权管控直接侵权方,且从侵权行为中获取直接经济利益。法官认为原告目前诉状未能充分佐证这两点,但给予原告21天时间补充完善诉求并重新提交诉状。

作为人工智能热潮下最大的受益企业之一,英伟达营收因训练芯片与数据中心服务需求高涨而大幅飙升。除了销售市场最抢手的硬件,该公司还在自研人工智能模型,包括NeMo Megatron系列。和其他科技巨头类似,这些模型依托英伟达自有硬件,借助海量文本数据库完成训练。然而,训练数据的来源正成为越来越棘手的法律难题。

作家与英伟达之间的法律拉锯战远未结束。层出不穷的人工智能训练侵权诉讼亦是如此,每月都有新案件涌现。就在裁决作出前一日,各大主流出版商对Meta及其创始人马克·扎克伯格提起诉讼,指控其利用盗版书籍训练人工智能模型。芯片巨头与内容创作者之间的博弈,正在重塑人工智能行业的数据合规边界。