打开网易新闻 查看精彩图片

去年OpenAI在法庭上还嘴硬,说大模型不可能逐字输出训练数据。现在《大西洋月刊》的测试打了脸——输入特定提示词,ChatGPT能原封不动吐出整本书,最高还原度冲到90%。

这相当于你买了把锁,卖家保证钥匙丢海里了,结果随便找个铁丝一捅就开。

测试团队用"树篱方法"反复诱导,模型直接吐出了《福尔摩斯探案集》《了不起的盖茨比》等公版书的完整段落。OpenAI当时的法庭原话是「模型不会输出训练数据的实质性内容」,现在这句话成了呈堂证供的反面教材。

更尴尬的是,这不仅仅是版权漏洞。研究人员发现,连一些受版权保护的书籍片段也能被钓出来——虽然比例不高,但足够让出版商集体失眠。纽约时报的诉讼还没打完,新证据又送上门了。

OpenAI的回应是"正在改进过滤系统",没提去年法庭上的那句"不可能"。有开发者吐槽:这像极了产品经理说"这个需求技术上做不了",结果竞品上周就上线了。