OpenAI删除版权诉讼中《纽约时报》耗时150小时集的关键证据，《纽约时报》彻底不干了|openai|微软|版权诉讼|知名企业|美国|证据

关键证据灰飞烟灭

纽约时报与 OpenAI 紧张关系日益加剧。纽约时报指责 OpenAI 不慎删除了其法律团队耗时超过 150 小时收集的关键证据，这一失误可能对案件产生深远影响。根据该报的法律团队表示， OpenAI 的工程师在处理数据时，意外丢失了一些至关重要的信息，这些信息是判断其报道内容是否被用作训练 OpenAI 旗下的 AI 模型的关键。

数据恢复

虽然 OpenAI 后来恢复了部分数据，但据《泰晤士报》报道，由于缺少原始的文件名和文件夹结构，已无法确定具体文章如何被纳入模型。在一份提交法庭的文件中，时报的律师詹妮弗 ·梅塞尔（ Jennifer B. Maisel）强调，这些缺失的信息严重阻碍了对潜在侵权行为的查明。

版权战争的前线

《纽约时报》指控 OpenAI 和 Microsoft 在未获得许可的情况下，非法使用其文章训练 AI 工具。这起案件是多起围绕版权保护内容在 AI 训练中使用的法律纠纷之一。

由于 OpenAI 尚未公开披露训练模型的数据来源，时报的诉讼变得尤为关键。在证据披露的过程中，法院要求 OpenAI 与《纽约时报》共享其训练数据，促成了一个 “ 沙盒 ” 环境的建立。

在这里，时报的法律团队可以审查 OpenAI 模型训练使用的数据。然而，令人遗憾的是，本应由时报团队整理的数据却被误删。尽管 OpenAI 已承认这一错误，但它始终未能完全恢复这些数据的原始形式，迫使时报的团队重新开始工作，导致了重大延误和额外费用的产生。

OpenAI 的应对策略

OpenAI 辩称数据丢失纯属技术故障，并无恶意。公司发言人也透露，对于《纽约时报》的指控，他们将很快发布正式回应。尽管 OpenAI 坚称误删数据非出于恶意，此事件仍加剧了与《纽约时报》间已经激烈的法律斗争。时报法律团队坚持认为， OpenAI 必须提供一套完整、有序的训练数据以便正确评估侵权行为。

责任的争议

此案也突显了有关谁应负责整理数据的争议。《纽约时报》认为，由于 OpenAI 掌握最多关于模型训练的信息，因此该公司应主导这一任务。时报还要求 OpenAI 提供进一步的文件，以加强其诉讼立场。

诉讼的推进让《纽约时报》和 OpenAI 在案件范围上的争议进一步升级，同时微软也被卷入其中。微软要求《纽约时报》提交与其使用生成式人工智能相关的文档，涉及其科技专栏作家的使用情况。

AI 法律影响与行业未来

此外， OpenAI 也在努力与其他大型出版商，如《大西洋月刊》、 Axel Springer 和康泰纳仕等寻求许可协议。这些法律争议和协议将对美国 AI 公司的运营模式产生深远影响，可能为内容许可及使用版权材料训练 AI 树立重要先例。这场法律斗争的结果有可能重塑 AI 监管的未来以及 AI 与媒体行业之间的关系。