打开网易新闻 查看精彩图片

关键证据灰飞烟灭

纽约时报与 OpenAI 紧张关系日益加剧。纽约时报指责 OpenAI 不慎删除了其法律团队耗时超过 150 小时收集的关键证据,这一失误可能对案件产生深远影响。根据该报的法律团队表示, OpenAI 的工程师在处理数据时,意外丢失了一些至关重要的信息,这些信息是判断其报道内容是否被用作训练 OpenAI 旗下的 AI 模型的关键。

数据恢复

虽然 OpenAI 后来恢复了部分数据,但据《泰晤士报》报道,由于缺少原始的文件名和文件夹结构,已无法确定具体文章如何被纳入模型。在一份提交法庭的文件中,时报的律师詹妮弗 ·梅塞尔( Jennifer B. Maisel)强调,这些缺失的信息严重阻碍了对潜在侵权行为的查明。

版权战争的前线

《纽约时报》指控 OpenAI 和 Microsoft 在未获得许可的情况下,非法使用其文章训练 AI 工具。这起案件是多起围绕版权保护内容在 AI 训练中使用的法律纠纷之一。

打开网易新闻 查看精彩图片

由于 OpenAI 尚未公开披露训练模型的数据来源,时报的诉讼变得尤为关键。 在证据披露的过程中,法院要求 OpenAI 与《纽约时报》共享其训练数据,促成了一个 “ 沙盒 ” 环境的建立。

在这里,时报的法律团队可以审查 OpenAI 模型训练使用的数据。 然而,令人遗憾的是,本应由时报团队整理的数据却被误删。 尽管 OpenAI 已承认这一错误,但它始终未能完全恢复这些数据的原始形式,迫使时报的团队重新开始工作,导致了重大延误和额外费用的产生。

OpenAI 的应对策略

OpenAI 辩称数据丢失纯属技术故障,并无恶意。公司发言人也透露,对于《纽约时报》的指控,他们将很快发布正式回应。尽管 OpenAI 坚称误删数据非出于恶意,此事件仍加剧了与《纽约时报》间已经激烈的法律斗争。时报法律团队坚持认为, OpenAI 必须提供一套完整、有序的训练数据以便正确评估侵权行为。

打开网易新闻 查看精彩图片

责任的争议

此案也突显了有关谁应负责整理数据的争议。《纽约时报》认为,由于 OpenAI 掌握最多关于模型训练的信息,因此该公司应主导这一任务。时报还要求 OpenAI 提供进一步的文件,以加强其诉讼立场。

诉讼的推进让《纽约时报》和 OpenAI 在案件范围上的争议进一步升级,同时微软也被卷入其中。微软要求《纽约时报》提交与其使用生成式人工智能相关的文档,涉及其科技专栏作家的使用情况。

AI 法律影响与行业未来

此外, OpenAI 也在努力与其他大型出版商,如《大西洋月刊》、 Axel Springer 和康泰纳仕等寻求许可协议。这些法律争议和协议将对美国 AI 公司的运营模式产生深远影响,可能为内容许可及使用版权材料训练 AI 树立重要先例。这场法律斗争的结果有可能重塑 AI 监管的未来以及 AI 与媒体行业之间的关系。