来源:知社学术圈
2026年5月5日,学术出版商巨头爱思唯尔(Elsevier)联合阿歇特(Hachette)、麦克米伦(Macmillan)、麦格劳-希尔(McGraw Hill)、圣智学习(Cengage)等多家出版商,以及知名小说家斯科特·图罗(Scott Turow),在美国纽约南区联邦法院对Meta 公司及其首席执行官马克·扎克伯格(Mark Zuckerberg)发起了集体诉讼,指控Meta在开发Llama大型语言模型时,未经授权获取并复制了原告方数百万份受版权保护的作品,包括学术期刊文章、书籍和教材等。
原告称,Meta通过Common Crawl数据集(包含数十亿网页)以及从LibGen和Sci-Hub等影子图书馆下载甚至是灰色的BT下载方式获取了大量未经许可的版权材料,其中包括爱思唯尔(Elsevier)旗下顶级期刊《细胞》(Cell)、《柳叶刀》(The Lancet)在内的数千种期刊的收费论文和摘要。这些材料被用于训练Llama模型,原告指控此行为构成故意版权侵权,并涉及移除版权管理信息。Meta发言人表示将积极应诉,并辩称AI训练属于美国版权法下的“合理使用”(fair use),能推动创新和生产力的发展。
据Nature新闻报道,这是科学出版商首次以主要原告身份发起AI版权诉讼,此前类似案件多由文章作者、新闻媒体或图书出版商主导,如《纽约时报》起诉OpenAI等。爱思唯尔(Elsevier)等出版商强调,他们有足够的证据证明Meta对他们的正当权利进行了“公然侵犯”。
Meta
与过往案件相比,此案延续了AI版权争议的核心张力。近年来,数十起针对OpenAI、Meta、Anthropic等公司的诉讼聚焦于训练数据的来源合法性。部分案件已和解或取得阶段性裁决,例如2025年加州北区法院在Bartz v. Anthropic和Kadrey v. Meta案中认定,在特定事实下,使用版权书籍训练LLM属于高度转化性使用(transformative use),可构成合理使用,但对通过盗版方式获取数据的行为持谨慎态度,强调市场影响和来源合法性。但是现有判例尚未形成统一的判例标准,可能需要未来更多的上诉和更多案件进一步澄清法律边界,而出版商此次入局,可能因其掌握大量学术内容而加强了集体谈判筹码。
从其他不同的角度来看,这场诉讼引出了更多的思考,出版商有关版权内容的主张真的足够理直气壮吗?出版商所有的版权论文,本质上来自全球无数科学家的原创研究、实验数据和手稿。科学家如果想在更好的期刊发表论文,就必须签协议同意将版权转让给出版商,以换取同行评议、出版和传播服务,但论文的核心价值在于知识本身,而非出版商的“包装”。批评者指出,出版商在从科学家那里“拿来”内容并商业化后,却强烈反对AI以类似方式利用这些文献进行训练和检索,这真的合理吗?
出版商在现行学术交流体系中,占有重要的生态位,这点无法否认,但是这真的只是交流而已,它本身不是目的,无数的学术成果最终还是要靠有选择有针对性的学习利用才能真正产生科学进步。从这一点来看,出版商们肯定不会做这个工作,其实不光是他们,谁能更高效的利用这些知识存量呢?
二十多年来学术论文出现了爆炸式增长,据估算,自1996年以来全球已发表至少6400万篇学术论文,近年每年新增约300万至500万篇科学与工程论文,且还在呈指数增长。人类研究者凭借有限时间和精力,难以全面阅读、交叉引用和综合这些海量成果。即使顶级专家一生也只能消化其中极小部分,传统文献检索工具(如关键词搜索、数据库索引)虽有帮助,但在跨学科、隐含关联和范式更新的背景下,人类的把握能力确实跟不上了。
AI提供了一种前所未有的能力:通过训练海量文献,实现快速语义搜索、知识图谱构建、假设生成和文献综述自动化,这对加速科学发现、解决复杂而广泛的全球性科学问题至关重要。比如有关气候变化的议题,变化是客观存在的,如何解释这种变化,如何将其归因于哪些具体的因素,却是个极其纷繁复杂的问题,至少人类层面似乎很难拿出坚实有力的逻辑和证据体系证明所有的结论,如碳排放的必要性和合理性,而排除如地球本身周期、太阳周期等假设。AI训练并非简单复制,而是通过海量数据学习模式、关联和抽象知识,产出新洞见,这与人类研究者阅读文献、综合信息的过程有相似之处。 如果AI被训练好了,能产生超出个体人类所能给出的知识边界,这难道不是一件好事吗?
更有论者指出,与论文发表同步暴增的还有撤稿、垃圾论文、数据伪造、图像伪造等学术不端现象,如果AI巨头们真的花钱买了出版商的数据,它们能保证给的东西货真价实吗?出现这些垃圾数据把AI给教坏了又怎么办?反过来起诉吗?
说到这里,小编特别推荐一本新书,深入探讨学术不端的话题,本书获评英国《泰晤士报》年度好书,并入选英国皇家学会科学图书奖。
[1]https://www.nature.com/articles/d41586-026-01481-0
[2]https://www.insidetechlaw.com/blog/2025/09/bartz-v-anthropic-settlement-reached-after-landmark-summary-judgment-and-class-certification
热门跟贴