本文主张,应当建立这样一种标准,在人类的贡献与 AI 的辅助作用之间取得平衡,以适用于艺术、文学与音乐作品。
作者 | Danny Friedmann
翻译 | 王茜
作者介绍
AUTHOR
Danny Friedmann 博士是深圳北京大学国际法学院的副教授。他拥有香港中文大学法学博士学位、阿姆斯特丹大学法学硕士学位(包含法学学士学位)以及荷兰布鲁克伦尼恩罗德商学院工商管理学士学位。他教授人工智能与版权法、商标法、外观设计法等知识产权课程,并著有关于人工智能与版权法、商标法、专利法和地理标志等方面的文章。
Danny Friedmann, 创作和生成版权标准 (Creation and Generation Copyright Standards) (May 08, 2025). 14:1 N.Y.U. J. INTELL. PROP. & ENT. L. 51, 51–119 (2024) (中文翻译由王茜/Chinese translation edited by Wang Xi), Peking University School of Transnational Law Research Paper.
在版权适格性问题上,事实上存在一种双重标准。尽管美国版权局(以下简称“版权局”)坚称版权法对所有主体一视同仁,但在实践中,使用人工智能生成服务的用户却需要满足一个几乎无法达到的高标准。其中包括:作者在创作过程中具有完全成熟的构想和对作品创作的完全控制,甚至超越时间与空间的限制;本文作者将其称为版权法中的“柏拉图式(“platonic”)理想”。而传统作品,如绘画和摄影等,其创作者通常并不需要满足这一标准。
本文对比了美国版权局对 AI 生成图像的版权保护申请的拒绝与北京互联网法院对类似作品所作出的认可裁定,从而凸显出全球范围内关于 AI 生成内容与传统表达性作品版权适格性之间的争议。本文是首篇同时批评这两种立场的文章,指出它们均忽视了创作中创意本身的不可预测性、作者的即兴性,以及在某种程度上细致构思最终会转化为表达的这一事实。本文主张,应当建立这样一种标准,在人类的贡献与 AI 的辅助作用之间取得平衡,以适用于艺术、文学与音乐作品。
本文并不建议以一个统一标准取代“双重标准”,而是提出应当采用“双轨标准”:一套适用于人类创作的作品,另一套适用于 AI 协助生成的作品。因此,创作者应当披露作品中由AI 生成的部分。但同样重要的是,生成式人工智能(gAI)服务提供者应向版权局开放一个 AI 生成作品数据库,以便版权局在审核版权注册申请时,能够将申请内容与已知的 AI 生成作品进行比对,判断人类干预是否达到了“独创性”与“保护门槛”的要求。
在此机制建立之前,应暂停通过版权法或特别权利(sui generis right)对 AI 生成作品的保护。相反,为了在促进创新与鼓励创作之间取得平衡,版权局应开放已注册版权作品及其作者元数据(metadata),以供 AI 服务提供商用于训练数据,并以此为依据向人类作者支付补偿。本文作者建议,应当对人类作者给予优待性保护,以防止或至少延缓人类文化的稀释过程。
目 录
CONTENTS
引言
A. 从“版权归因性”(Copyrightable-Causation)到“platonic”标准
B. 数字尊严
C. 合成数据的来源可追溯性
D. 摆脱浪漫主义视角
E. 版权适格性的“platonic”构想
F. 版权公理与规则
G. 切断作者与作品之间的脐带连接
I. 版权局对 AI 生成图像施加“platonic”标准
A. “A Recent Entrance to Paradise”
B. “Zarya of the Dawn”
C. “Theatre D'opera Spatial”
D. “SURYAST”
II. 北京互联网法院接受了 AI 生成图像的版权保护
A. “音乐喷泉”
B. “菲林”
C. “Dreamwriter”
D. “热气球”
E. “春风送来了温柔”
III. 版权适格性的“Platonic”视角
A. 人类介入
B. 精神构想还是机械控制
C. 作品创作过程中的控制
D. 作者与作品之间不可切断的联系
E. 观点的表达
结论
前文回顾
接上篇
I. 版权局对 AI 生成图像施加“platonic”标准
版权局自 1870 年以来一直以其在区分可受版权保护和不可受版权保护的作品方面积累的经验为荣。124然而,生成式人工智能带来了前所未有的新挑战。125版权局进行了广泛的咨询126,并要求公众提供意见。2023 年 3 月 16 日,版权局发布了《含有 AI 生成内容的作品的版权登记指南》127。到 2023 年 12 月 6 日,版权局共收到约 10,370 条评论。讽刺的是,版权局可能不得不使用 AI 来分析这一庞大的评论数据。
版权局的立场是,任何含有超过最低限度的 AI 生成内容的作品申请将被排除在外。128版权局拒绝注册 Stephen Thaler 的“A Recent Entrance to Paradise”(“Entrance”)129的决定被哥伦比亚特区地方法院确认130(见第一部分 A);而审查委员会也拒绝了 Kristina Kashtanova 的“Zarya of the Dawn”(“Zarya”)131(见第一部分 B)、Jason Allen 的 Théâtre D’opéra Spatial(“Spatial”)132(见第一部分 C)以及 Ankit Sahni 的“SURYAST”133(见第一部分 D)等 AI生成图像的注册申请。
A.
“A Recent Entrance to Paradise”
《A Recent Entrance to Paradise》(来源:Wikipedia CC)
Stephen Thaler 发明了“创造力机器”(Creativity Machine),这是一种生成式人工智能,据称它自主生成了名为“A Recent Entrance to Paradise”的图像(版权局将其描述为“一幅二维艺术作品”)。134作为“创造力机器”的所有者,Thaler 先生请求版权局将该图像登记为“职务作品”135,但未能成功。Thaler 先生认为这一拒绝决定违宪且未得到案例法的支持136。然而,版权法只保护“知识劳动的成果”137,这些成果“源于[人类]大脑的创造性力量”138。版权局不会注册“由机器或单纯的机械过程产生”的作品,这些过程“没有任何来自作者的创造性输入或干预”,因为根据法律规定,“作品必须由人类创作”。139版权局还引用了 Burrow-Giles 案140中的描述,认为版权是“一个人对自己天才或智力产物的专有权利”。141哥伦比亚特区地方法院确认了这一理由。142
Thaler 先生辩称,版权局“目前依赖于镀金时代的非约束性司法意见来回答计算机生成作品是否可以获得保护的问题”。143“镀金时代”是马克·吐温所创的一个术语,通常指的是1865 年到 1904 年之间的时期,即重建时代和进步时代之间144,Thaler 认为这个词是对用这一时期的过时政策来拒绝自动生成作品的批评。Jyh-An Lee 教授明确指出,英国对计算机生成作品的保护方法存在问题,即将版权授予“为创作工作作出必要安排的人”145。因为这样的作品可能有多个“父母”或“母亲”,或者在开源软件的情况下,作品可能由衍生计算机模型生成。146程序员、数据提供者、训练师和操作者都可能在 AI 生成作品的创作中扮演不可或缺的角色。147
B.
“Zarya of the Dawn”
漫画书《Zarya of the Dawn》封面及第二页内容(来源:copyright.gov)
Kristina Kashtanova 在版权局注册了她的漫画/图画小说“Zarya of the Dawn”。148她在社交媒体上明确表示,她使用了 Midjourney,一种从文本到图像的生成式人工智能,来生成该专辑的图像。149当版权局得知此事后150,撤销了原来的注册证书,并声明 AI 生成的图像内容不受到保护。但版权局注册了 Kashtanova 女士创作的文字,因为她是“作品文本的作者,以及作品书面和视觉元素的选择、协调和排列者”。151
版权局描述了 Midjourney 如何在用户输入文本命令(“提示词”)后生成图像,并指出用户可以通过添加 URL、改变纵横比和提供功能性指令来影响结果。152生成式人工智能将生成四张图像,如果用户选择其中一张图像,还可以提供更高的分辨率或四张新图像作为替代选项。153
版权局根据 Midjourney 提供的信息认为,该系统“并不像人类那样理解语法、句子结构或单词”,而是将单词和短语“转化为更小的片段,称为符号(tokens),然后与其训练数据进行比对,并用于生成图像”。154随后,Midjourney 以“一片视觉噪声(类似电视雪花屏)”为起点,“生成初始图像网格”,再通过算法将这些噪声细化为人类可识别的图像。155版权局主张,通过该工具生成图像的过程,并不等同于人类艺术家、作家或摄影师的创作过程。156Kashtanova 女士则认为,她“引导”了每一张图像的结构和内容。157然而,版权局认定,这一生成过程以及图像中传统意义上的创作要素,均不足以构成受版权保护的原创性作品。158Kashtanova 女士主张,提示词(prompt)才是图像创作的核心创意输入。159她并未声称自己直接创作了任何视觉素材——在描述最终图像时,她使用了被动语态,称其图像是“被创作、被开发、被完善并被重新定位”的,同时结合了中间图像的元素,“汇聚成一个连贯的整体”。160她表示,最终图像是通过一个“试错过程”得到的,在此过程中,她向 Midjourney 输入了“数百甚至上千条描述性提示词”,直到“数百次迭代后,尽可能完美地呈现出她的设想”。161
版权局认为,Kashtanova 女士并未通过文本提示对 Midjourney 这一工具实现控制,而是 Midjourney 以一种不可预测的方式生成了图像。162根据版权局的观点,她的指令与最终生成结果之间的距离过大163,因此她未能作为图像的“发明性或主导性思维者”(the inventive or master mind)164,这是 Burrow-Giles 案所要求的标准165。版权局强调了 Midjourney 与基于计算机的工具(如 Adobe Photoshop)166之间的区别。在版权局看来,前者的结果具有不可预测性,而后者仅仅是在可预测范围内对图像进行修改。167关于 Kashtanova 女士使用Photoshop 进行的编辑,版权局认为无法确定这些改动是否具有足够的创造性以获得版权保护,因为这些修改据称“过于细微且难以察觉”。168不过版权局也指出,如果编辑内容具有实质性变化,那么是有可能获得版权保护的。169版权局将提示词的功能描述为更接近“建议”而非“指令”,类似于“客户雇佣艺术家创作图像时,只提供了一些关于内容的大致方向”的情形。170版权局写道:“由于 Midjourney 是从随机生成的噪声开始,逐步演变成最终图像,因此无法保证特定提示词能够生成特定的视觉结果。”171版权局并未质疑 Kashtanova 女士在创作过程中所付出的努力172,但正如 Feist 案所确认的,单纯的辛勤劳动(“汗水理论”)并不能获得版权保护。173
在作出这一决定后,版权局发布了关于含有 AI 生成内容作品的登记指南,要求申请人在提交版权登记申请时主动申报作品中包含的 AI 生成部分。174
C.
“Théâtre D’opéra Spatial”
二维艺术作品《Théâtre D’opéra Spatial》(中文多译为“太空歌剧院”。来源:copyright.gov)
Jason Allen 使用一系列提示词在 Midjourney 中生成了名为 Théâtre D’opéra Spatial(“Spatial”)的二维艺术作品175,并凭此作品获得了 2022 年科罗拉多州博览会年度美术竞赛的冠军。176当版权局得知此事后,要求 Allen 先生提供更多关于图像生成过程的信息。Allen先生表示,他“至少进行了 624 次文本提示的修改与输入,才得出了图像的初步版本”。177之后,他使用 Adobe Photoshop 对图像中的缺陷进行修复并创作了新的视觉内容178,随后又使用 Gigapixel AI 对图像进行了“放大”179,提升了分辨率和尺寸180。版权局要求 Allen 先生放弃对由 Midjourney 生成部分的版权主张,但他拒绝了。版权局认为,Allen 先生所主张的作者贡献与 Midjourney 生成的产物已不可分割地融合在一起。181根据版权局的认定,“由 Midjourney 生成、作为该作品初步基础的图像,并不是受版权保护的原创性作品。”182
与“Zarya”不同183,在“Spatial”一案中,版权局接受了 Allen 先生关于其使用 Adobe Photoshop 所进行的人为“视觉编辑”具有足够原创性、可以注册的主张。不过,审查委员会对此有所保留,指出他们并没有足够的信息来确定这些视觉编辑是否单独达到可注册的标准。184然而,Allen 先生仍然拒绝放弃对由 Midjourney 和 Gigapixel AI 分别生成的部分的版权主张。审查委员会认定,该图像包含了超过最小限度的 AI 生成内容,因此在注册申请中必须声明放弃这些部分,于是驳回了该图像的注册申请。185Allen 先生则主张,底层 AI 生成的图像只是原材料,他通过自己的艺术创作对其进行了转化。他认为,“如果拒绝为此类工具生成的产物提供版权保护,将导致所有权的真空。”186Allen 先生还表示,“如果要求创作者列出每一个使用的工具及其在作品中所占比例,并且严格执行,这将对创作者造成沉重负担。”187
版权局和审查委员会在评估过程中考察了该图像是否具备所需的原创性,和人类作者性,即:“AI 生成的内容是机械复制的结果,还是源自作者自身原创性精神构想并被赋予可见形式的产物。”188如果作品的所有“传统创作要素”均由机器生成,那么该作品就缺乏人类作者性。
与 “Entrance”一案类似,版权局和审查委员会在很大程度上依赖了 Midjourney 的说明,即“提示词‘影响’系统生成的内容,并由 Midjourney‘解释’并‘与其训练数据进行比对’。189”版权局指出,“Midjourney 不会将提示词解释为针对特定表现性结果的具体指令”,因为“Midjourney 不像人类那样理解语法、句子结构或单词。”190版权局认为,Midjourney 不会将文本提示视为直接指令,用户往往需要经过数百次迭代才能生成一张他们满意的图像。191换句话说,提示词与最终生成结果之间的距离过大,无法将其视为具体或直接的指令。版权局认为,“当一项 AI 技术仅接收来自人类的提示词,并据此生成复杂的文字、图像或音乐作品时,这些作品的‘传统创作要素’是由技术决定并执行的——而不是人类用户。”192
Allen 先生描述了他是如何使用 Midjourney 的,他“至少输入并修改了 624 次提示词”,通过迭代方式不断优化生成的图像,之后又使用 Adobe Photoshop 进行了编辑,并通过Gigapixel AI 对图像进行了放大。193Allen 先生一开始输入了一个“整体描述”的提示词,聚焦于作品的总体主题。194随后,他在提示文本中添加了第二个“整体描述”,以指示软件将两个想法结合起来。接着,他又添加了“图像的整体类型和类别”,“指导作品基调的专业艺术术语”,“希望作品呈现出的逼真度”,“色彩使用的描述”,“进一步细化构图的描述”,“作品应展现的风格/时代特征”,以及他经过大量测试总结出的“让图像更加突出”的写作技巧。195最后,他还“附加了各种参数,以进一步指示软件如何开发图像”,形成了一条最终文本提示词,并“输入 Midjourney 以完成整个生成过程”。196
简而言之,在 Allen 先生的文本指令引导下,Midjourney 根据他所表达的艺术性意图,不断生成更加精细的图像,直到生成出令 Allen 先生满意的最终结果。审查委员会承认,提示词的编写过程本身可以包含创造性,并且这些提示词本身如果足够具有创意,可能作为文学作品受到版权保护,197但使用这些提示词之后由 AI 生成的图像则不能获得保护198。Lemley 认为,如果提示词或一系列迭代提示词足够详细,可能有资格获得版权保护。199版权局则认为,真正构思图像的是生成式人工智能,而不是 Allen 先生本人。200
D.
“SURYAST”
二维艺术作品《SURYAST》(来源:copyright.gov)
根据 Ankit Sahni 的说法,Robust Artificially Intelligent Graphics and Art Visualizer(RAGHAV)是一个“由 AI 驱动的工具”,它利用机器学习执行“神经风格迁移”(Neural Style Transfer),即“生成一张在‘内容’上与基础图像相同,但在‘风格’上采用所选图片风格的图像”。201
Sahni 先生使用 RAGHAV,将他拍摄的一张照片与梵高的《星夜》(The Starry Night)作为风格参考图进行融合,并通过选择一个变量值来确定风格迁移的程度,从而在 2020 年创作了图像 SURYAST。202在图像生成后,Sahni 先生没有对其进行任何修改。203
Sahni拍摄的照片(左)和梵高的《星夜》(The Starry Night)(右)
在提交版权注册申请时,Sahni 先生将自己与 RAGHAV 列为共同作者。204他称 RAGHAV的贡献是与他自己的贡献“各自独立、互不重叠”的。205Sahni 先生主张,“构思、创作并选择一张原创[基础]图像”,“选择风格图像”,以及“选择一个具体的变量值来决定风格迁移的程度和方式”,这些因素“共同导向了该作品的产生,而作品正是[Sahni 先生]创造性表达和贡献的直接结果”。206作为其创作控制的证据,Sahni 先生指出,他的决策使得图像中包含了:1)“一轮落日”,2)“云彩”,3)“建筑物的轮廓”,4)“构图中天空占据了作品的上三分之二”,以及 5)“梵高《星夜》风格的精准且有意为之的再现”。207然而,审查委员会认为,图像中具有表现力的绘画要素并非由 Sahni 先生提供。这些要素是通过三个输入(基础图像、风格元素和风格迁移值)生成的,208而这些输入过于粗略,无法证明存在人类创作的构思与执行。209图像中的色彩和元素位置均由 RAGHAV 生成。审查委员会并未接受 Sahni 先生将RAGHAV 描述为“一个类似于相机、数位板或照片编辑软件的辅助工具”的说法。210版权局和审查委员会最终驳回了 Sahni 先生的注册申请,理由是他的人工创作贡献无法与 RAGHAV 生成的最终作品区分或分离开来。211然而,版权局表示,Sahni 先生的原始照片仍有可能单独申请注册。212
在重审中,审查委员会认定该图像不能获得注册,“因为所提交的作品是衍生作品,且不包含足够的具有原创性的人类创作以支持版权注册。”213
2024年2月23日,在版权局拒绝注册SURYAST之后,版权局局长兼署长Shira Perlmutter致信参议员 Coons 和 Tillis,以及众议员 Issa 和 Johnson,向他们通报版权局迄今为止在版权与生成式人工智能领域工作的进展。这封信中包含了一段颇有意思的正文内容,以及一个更加引人注目的脚注:
“自发布《注册指南》以来,版权局注册处已审查了数百件包含 AI 生成材料的作品,并已为其中一百多件作品核发了注册证书。”脚注进一步指出:
“美国版权局审查委员会,《确认拒绝注册 SURYAST 的决定》第 4 页第 3 脚注(2023 年12 月 11 日),https://www.copyright.gov/rulings-filings/review-board/docs/SURYAST.pdf。其他申请被拒绝,要么是因为申请人未遵循版权局的注册指南,要么是因为作品不包含足够的人类创作内容。”214
也就是说,版权局确实注册了超过 100 件“包含 AI 生成材料的作品”,但无论在这封信还是在其官网上,都没有给出任何一个具体注册成功的作品示例215。
II. 北京互联网法院接受了 AI 生成图像的版权保护
2023 年 11 月,北京互联网法院开创性地裁定216,一幅名为《春风送来了温柔》(“春风”)217的 AI 生成图像,可以在具备足够智力成果且经过充分人类干预的基础上,受到版权法保护。乍看之下,“春风”一案的裁决218似乎令人意外,但这一裁判并非毫无先例,之前已有若干具有指导意义的案件在先:包括 2018 年北京知识产权法院的“音乐喷泉”案219,2019 年北京互联网法院的“菲林”案220,2019 年深圳南山区法院的“Dreamwriter”案221,以及 2020 年北京互联网法院的“热气球”案222。最后,本部分将重点讨论北京互联网法院对“春风”的判决。223
A.
“音乐喷泉”
2018 年 6 月 26 日,北京知识产权法院224维持了海淀区人民法院的判决,认定由自动化音乐喷泉自主形成的水型、音乐与灯光效果的组合,能够提供审美体验,具备原创性,依据《中华人民共和国著作权法实施条例》(2002)第 2 条225,构成作品,因此符合版权保护资格。法院判令被告赔偿原告人民币 9 万元(约合 1.27 万美元)并公开道歉。226
B.
“菲林”
2019 年 4 月 25 日,北京互联网法院在“菲林”案中裁定,一份主要由威科先行法律信息库生成的分析报告,因包含了足够的人类创意,符合版权保护的要求。227尽管被告未经授权擅自复制、编辑并转载了该报告,且未注明出处228,法院仍认定作品享有版权保护。法院明确指出,纯粹由人工智能生成的内容本身不具有版权资格,但承认此类作品可能仍应获得某种形式的保护229。法院进一步指出,各类图表中的技术设计、地理要素以及客观事实不属于版权保护的对象。230虽然原告试图以图表美化工作为依据主张图表的原创性,但由于缺乏有力证据,该主张未获支持。231然而,法院认可了图表中部分构图因有人类贡献而具有原创性,从而使这些部分获得了版权保护。232
C.
“Dreamwriter”
2019 年 12 月 24 日,深圳市南山区人民法院裁定,腾讯“Dreamwriter”AI 生成的一篇文章具有版权资格。233自 2015 年以来,“Dreamwriter”每年在财经、天气和体育等领域生成约50万篇文章。腾讯在腾讯证券网站上发布了一篇财经报道文章,并在文末注明:“本文由腾讯机器人‘Dreamwriter’自动撰写。”234上海盈讯科技公司在同一天未经授权将该文章发布在其网站上,导致腾讯提起版权侵权诉讼并胜诉,法院判令盈讯赔偿人民币 1500 元(约合 211美元)。235法院认定,该文章内容体现了多个团队分工协作下的有意识选择、分析与判断,具有结构连贯性和原创性,驳斥了单纯自动化生成的观点。236法院特别强调了原告团队在塑造文章独特表达方面发挥的重要作用。2021 年,最高人民法院将该案认定为指导性案例,确认其在国家层面的重要性。237
D.
“热气球”
2020 年 4 月 2 日,北京知识产权法院审理了另一宗具有开创性的案件,即高阳诉优酷案。238在该案中,原告将一台运动相机固定在热气球上,在热气球升空过程中自动拍摄地球外表面的图像。239拍摄过程中,相机处于自主运行状态,原告随后从所拍摄的视频中提取出特定截图并进行后期处理。240法院认为,尽管相机在升空后的拍摄阶段脱离了人类直接控制,但在发射前存在明确的人为干预。241这些干预包括:相机型号的选择、拍摄角度的设定、录像模式的选择,以及显示格式、感光度等各项拍摄参数的设置。242法院认定,这些事先有意识地进行的准备行为,使得自动生成的截图具备了摄影作品的属性。243因此,任何未经授权使用这些图像的行为,均构成对原告作品著作权的侵害。
E.
“春风送来了温柔”
李先生原帖文(来源:红星新闻)
2023 年 2 月 24 日,李昀锴使用“Stable Diffusion Aki 4.2”生成了一些年轻亚洲女性的图像。244李先生将其中一张图像发布在流行的内容分享平台“小红书”上245,标题为《春风送来了温柔》(“春风”)246,并加上了“AI 图像”的标签,以符合《互联网信息服务深度合成管理规定》第 17 条的要求,即必须对 AI 生成的内容进行显著标识。247
李先生后来发现,博主刘元春在百度旗下的内容分享平台“百家号”上248,发表博文《三月里的爱情,在桃花盛开的地方》249,并配图使用了他生成的同一张图像。在使用该图像前,刘女士移除了李先生的用户 ID 以及“小红书”的水印250。随后,李先生以侵犯著作权及信息网络传播权为由251,将刘女士诉至北京互联网法院。法院判令刘女士赔偿人民币 500 元(约合 70 美元)、承担人民币 50 元(约合 7 美元)的诉讼费用,并公开道歉。252
李先生主张,他使用了大约 20 条正向提示词253和大约 120 条反向提示词生成了这张图像。254李先生使用的 Stable Diffusion 系统不仅可以基于文本提示生成图像,还可以基于图像提示生成图像。255该系统基于对比语言-图像预训练(CLIP)引导的扩散模型256,实际上是两个模型协作完成。CLIP 引导的扩散模型能够在一定程度上“复原”训练数据257,或通过数学方式对扩散图像进行插值融合,以生成新的衍生图像。258
北京互联网法院认为,李先生从构思到最终选定图像的过程中,进行了相当程度的智力投入,包括:设计人物呈现方式、选择提示词及其排列、确定提示词顺序、设定相关参数,以及挑选符合预期的图像等。259法院使用的“相当程度的智力投入”这一表述,听起来更像是一种“汗水理论”式的论证,但无论在美国还是中国,仅凭辛勤投入都不足以为作品授予版权。260不过,法院提到的“选择与安排”措辞,使其论证落入了 Burrow-Giles 案所确立的版权保护传统之中。261
如前所述,Lemley 曾主张,如果提示词或迭代的一系列提示词足够具体且具有创意,那么它们本身可以获得版权保护。262这也意味着,具有创意的提示词可以受到保护,但并不必然意味着通过提示词生成的最终作品本身也能获得版权。
关于独创性,北京互联网法院认为,原告通过提示词设计了人物、人物呈现方式及其他视觉元素,并通过设定参数完成了图像的布局与构图,这体现了原告的选择与安排。263法院还指出,调整与修改的过程“也反映了原告的审美选择和个人判断”。264因此,法院认为,本案涉案图像并非机械生成,而是“可以认定涉案图片由原告独立完成,体现出了原告的个性化表达”。265不过,如前文所述,可以主张 AI 生成图像从定义上说并非真正意义上的独立创作:它们是基于训练数据中的作品创作的,而训练数据中包括受版权保护的作品。另一方面,也有学者认为,在训练阶段复制作品,并不构成版权意义上的“复制”,因为这些作品并非以表达性的方式266被机器使用和欣赏,仅仅是以概率性方式处理;而另一些学者则认为,这确实构成版权意义上的复制,但可通过合理使用(fair use)原则加以正当化。267
法院还指出,图像的审美吸引力在判断其是否具有独创性时起到了作用:“原告在发布在小红书上后被众多用户观看、点赞,说明以一般社会公众的标准可以认定其为作品,具有独创性。”268这一观点与自 Bleistein 案以来在全球版权理论中确立的审美中立原则相悖,后者强调版权保护不应以作品的艺术价值或受欢迎程度作为判断依据。269
被告可以主张,原告输入的提示词(例如“户外环境”“日本偶像”“高度细致、对称且有吸引力的面孔”)只是“想法”,而非这些想法的表达。270然而,北京互联网法院认为,本案涉及的图像是由线条和色彩构成、具有审美意义的美术作品。271法院指出:“人们利用人工智能模型生成图片时,不存在两个主体之间确定谁为创作者的问题,本质上,仍然是人利用工具进行创作,即整个创作过程中进行智力投入的是人而非人工智能模型。”272法院依据人类创作需要激励的理论,包括对 AI 生成图像的创作激励,进一步指出:“鼓励创作,被公认为著作权制度的核心目的。……人工智能生成图片,只要能体现出人的独创性智力投入,就应当被认定为作品,受到著作权法保护。”273
本案庭审由中央电视台进行了报道,并在多个平台同步直播,吸引了超过 17 万名观众。274在庭审过程中,原告成功说服北京互联网法院相信,当输入相同的提示词时,AI 模型能够生成相同的结果。275不过一般而言,当使用相同提示词时,生成式人工智能通常会产生略有不同的结果,这是因为 AI 处理过程中融入了随机性。例如,一些模型在每次运行时会采用不同的初始条件或初始状态。276这种 AI 模型的动态特性导致了即便输入相同提示词,输出结果也可能变化。277尤其是采用深度学习的高级 AI 模型,具有极高的复杂性,参数量以百万计,因此即使输入相同,也可能产生广泛多样的输出结果。278此外,训练数据中细微的差异可能影响模型如何学习并解释信息,从而导致输出变化,特别是在文本生成图像(text-to-image)类型的生成式人工智能中尤为明显。279最终输出通常是通过采样过程生成的,AI模型的输出还可能受到计算资源(如内存、处理能力)限制、模型配置不同以及模型更新等因素的影响。280简言之,AI 算法的时间性与空间性元素是不断变化的。
然而,Stable Diffusion 具有一个名为“随机数种子”(seed)的功能,用于初始化图像生成过程。281随机数种子使得图像生成具有可重复性,同时也便于用户在不同参数或提示词变化下进行实验。282“春风”案中的图像是通过李先生下载到自己电脑上的 Stable Diffusion 版本生成的。283尽管本地下载版本相较于基于网页的版本可能更加稳定,但由于采样过程以及算法复杂性等因素,它也未必能够实现完全的稳定性。虽然原告向法院提交了一段视频,用以演示涉案图像的再现过程,284但录像只能证明李先生在特定时间、特定算法状态下通过其电脑生成了该图像,并不能证明该生成过程具有可重复性。
Tianxiang He 指出,借助像 Civitai 等网站上共享的现有检查点和生成数据,可能使得生成过程趋向机械化,从而潜在地削弱甚至否定了作品应具备的最基本的创造性要求,285同时也反驳了原创性中对独立创作的要求。
人类的智力创作不仅包含理性因素,还包含思想、情感与灵感。于雯雯认为,“即便人工智能生成的内容在外观上具有人类智力创作的特征,但由于其生成过程在本质上不同于人类的智力创作活动,因此不能被认定为现行著作权法意义下的‘作品’,难以享有著作权。”286不过,于雯雯也指出,AI 生成内容与作品市场有着密切的利益联系,主张应关注这种关系并对著作权法作出相应调整。287她似乎对将著作权授予为计算机生成内容作出必要安排的自然人持开放态度,这一观点与英国《1988 年著作权、外观设计和专利法》第 9 条规定一致。288
北京互联网法院对 AI 生成图像给予保护的判决在国际上引起了广泛关注。289那些希望推动国际统一 AI 版权框架(acquis)的人可能对中美在此问题上的分歧感到失望。对于在 AI 与版权领域内各方利益相关者而言,290一个公平竞争的平台似乎比以往更加遥远。291
未完待续
注释(上下滑动查看)
[124] 多家法院已表示尊重美国版权局的专业判断。参见,例如:Norris Industries, Inc. v. International Telephone & Telegraph Corp., 696 F.2d 918, 922 (11th Cir 1983);Varsity Brands, Inc. v. Star Athletica, LLC, 799 F.3d 468, 480 (6th Cir 2015)。”
[125] Copyright Registration Guidance: Works Containing Material Generated by Artificial Intelligence, 37 C.F.R. § 202 (2023) ,可在 美 国版权 局 网 站 查阅: https://www.copyright.gov/ai/ai_policy_guidance.pdf(https://perma.cc/6ADC-436N)。
[126] Artificial Intelligence Study, U.S. Copyright Office ,人工智能研究 专 页 :https://www.copyright.gov/policy/artificial-intelligence/(https://perma.cc/897F-9ETZ)(最后访问日期:2024 年11 月 29 日)。
[127] 37 C.F.R. § 202 (2023).
[128] 同上注。
[129] Letter from U.S. Copyright Office Review Board to Ryan Abbott, Brown, Neri, Smith & Khan, LLP (Feb. 14, 2022) , “A Recent Entrance to Paradise” 一 案 的版权 局 审 查 函 : https://www.copyright.gov/rulings-filings/review-board/docs/a-recent-entrance-to-paradise.pdf(https://perma.cc/857Y-F4HN)(下称“Entrance”)。
[130] Thaler v. Perlmutter, 687 F. Supp. 3d 140, 146 (D.D.C. 2023)。
[131] Letter from U.S. Copyright Office to Van Lindberg, Taylor English Duma LLP (Feb. 21, 2023),关于“Zarya of the Dawn”的回复函:https://www.copyright.gov/docs/zarya-of-the-dawn.pdf(https://perma.cc/SD2G-2JSK)(下称“Zarya”)。
[132] Letter from U.S. Copyright Office Review Board to Tamara Pester, Tamara S. Pester, LLC (Sept. 5, 2023),关于“Theatre D’opera Spatial” 的 复 审 意 见 函 : https://www.copyright.gov/rulings-filings/review-board/docs/Theatre-Dopera-Spatial.pdf(https://perma.cc/Y3Y9-LSEV)(下称“Spatial”)。
[133] Letter from U.S. Copyright Office Review Board to Alex P. Garens, Day Pitney, LLP (Dec. 11, 2023),关于 “SURYAST” 的版权 复 审 决 定书: https://copyright.gov/rulings-filings/review-board/docs/SURYAST.pdf(https://perma.cc/9QBD-ABR4)(下称“SURYAST”)。
[134] “Entrance,” 同上注 129,第 1-2 页。
[135] 同上注。
[136] 同上注,第 3 页。
[137] 美国版权局援引了洛克的劳动理论。John Locke, Two Treatises on Civil Government 204 (George Routledge & Sons 1884)。参见 Alexander D. Northover, “‘Enough and as Good’ in the Intellectual Commons: A Lockean Theory of Copyright and the Merger Doctrine,” 65 Emory L.J. 1363 (2016)(尝试将洛克的“剩余充足”原则应用于版权合并理论)。
[138] Compendium (Third),见前注 8,第 § 306 节(引自 Trade-Mark Cases, 100 U.S. 82, 94 (1879));另见 § 313.2 节。
[139] “Entrance”,见前注 129,第 3 页。Gervais 持相同观点:“机器若具备自主决策能力,其产物则归入公有领域,不享有版权。”见 Daniel Gervais, “The Machine as Author,” 105 Iowa L. Rev. 2053, 2099 (2020)(主张版权制度旨在促进人类创作,机器不具创造性判断能力,因而不具备原创性,不能获得版权)。
[140] “Entrance”,见前注 129,第 4 页。
[141] Burrow-Giles Lithographic Co. v. Sarony, 111 U.S. 53, 58 (1884)。Farley(见前注 60,第 389 页注释10)指出一则轶事:奥斯卡·王尔德在入境美国时被海关问是否有物品申报,他回答说:“我无可申报,只有我的天才。”
[142] Howell 法官认为“人类作者身份是版权的基石。”哥伦比亚特区联邦地区法院判决认为,版权局拒绝给予没有任何人类创意贡献的作品注册是适当的。Thaler v. Perlmutter, 687 F. Supp. 3d 140 (D.D.C. 2023)。
[143] “Entrance”,见前注 129,第 2 页。
[144] Mark Twain & Charles Dudley Warner, The Gilded Age: A Tale of Today (1873)(电子书),https://www.gutenberg.org/files/3178/old/orig3178-h/main.htm#contents(https://perma.cc/CH5H-ZWL7)。
[145] Copyright, Designs and Patents Act 1988, c. 48, § 9 (UK).
[146] Jyh-An Lee, Computer-Generated Works Under the CDPA 1988, in Artificial Intelligence and Intellectual Property 177, 194 (Jyh-An Lee, Reto M. Hilty & Kung-Chung Liu eds., 2021).
[147] 同上注。
[148] “Zarya,” 同上注 131。
[149] 同上注,第 2 页。
[150] “Zarya”,见前注 131,第 5 页注释 8。版权局明确表示,其通常不会对申请文件中所陈述事实进行实质核查,参见 Compendium (Third),前注 8,第 § 602.4(C) 节;但如果存在版权局自身或公众已知的事实,足以表明申请内容存在不准确或不完整的情况,版权局可以据此重新评估该申请。
[151] 同上注,第 1,4-5 页。
[152] 同上注,第 7 页。
[153] 同上注。
[154] 同上注。
[155] 同上注,第 7-8 页。
[156] 同上注,第 8 页。
[157] 同上注。
[158] 同上注。“版权局不会登记由机器或纯粹机械过程所生成的作品——若该过程随机或自动进行,且未包含任何人类作者的创意输入或干预。”(引自 Compendium (Third),前注 8,第 § 313.2 节)
[159] “Zarya”,见前注 131,第 8 页。
[160] 同上注。
[161] 同上注,第 8 页。
[162] 同上注,第 9 页。
[163] 同上注。
[164] 同上注。
[165] Burrow-Giles Lithographic Co. v. Sarony, 111 U.S. 53, 61 (1884).
[166] “Zarya”,见前注 131,第 9 页。
[167] 同上注。“当艺术家使用编辑或其他辅助工具时,他们会选择要修改的视觉素材,决定使用哪些工具以及进行哪些修改,并采取具体步骤控制最终图像,以使其成为艺术家本人原始精神构想的具象化表现。”
[168] 同上注,第 10-11 页。
[169] 同上注,第 12 页。
[170] 同上注,第 10 页。
[171] 同上注,第 9-10 页。
[172] 同上注,第 10 页。
[173] Feist Publ’ns, Inc. v. Rural Tele. Serv. Co., 499 U.S. 340, 352–53 (1991).
[174] 37 C.F.R. § 202 (2023).
[175] “Spatial”,见前注 132。
[176] Sarah Kuta, Art Made with Artificial Intelligence Wins at State Fair, Smithsonian Magazine(2022 年 9月 6 日),可查阅:https://www.smithsonianmag.com/smart-news/artificial-intelligence-art-wins-colorado-statefair-180980703/(https://perma.cc/2FZF-3Y45)。
[177] “Spatial”,见前注 132,第 2 页。
[178] 同上注,第 5 页,“对多种外观细节、缺陷或图像伪影等进行优化和修饰。”
[179] 同上注,第 5 页。
[180] 同上注,第 2 页。
[181] 同上注。
[182] 同上注。
[183] “Zarya”,见前注 131。
[184] “Spatial”,见前注 132,第 5 页。
[185] 同上注。
[186] 同上注,第 3 页。
[187] 同上注。
[188] Burrow-Giles Lithographic Co. v. Sarony, 111 U.S. 53, 60 (1884)
[189] “Spatial” ,见前注 132 , 第 6 页 。 ( 引 用 Prompts, Midjourney Documentation,https://docs.midjourney.com/docs/prompts [https://perma.cc/XJA5-W9LV) (最后访问日期 2024 年 10 月 11 日).
[190] 同上注,第 6-7 页。(引用“Zarya”,见前注 131,第 7 页)。
[191] 同上注,第 7 页。
[192] 同上注。(引用 Copyright Registration Guidance: Works Containing Material Generated by Artificial Intelligence, 88 Fed. Reg. 16190, 16192 (Mar. 16, 2023)).
[193] 同上注,第 2 页。(引用来自 Tamara Pester 的电邮, Tamara S. Pester, LLC, to U.S. Copyright Off. (Sept. 30, 2020))。
[194] 同上注,第 6 页。(引用来自 Tamara Pester 的电邮, Tamara S. Pester, LLC, to U.S. Copyright Off. (Sept. 30, 2020))。
[195] 同上注。(引用来自 Tamara Pester 的电邮, Tamara S. Pester, LLC, to U.S. Copyright Off. (Sept. 30,2020)).
[196] 同上注。(引用来自 Tamara Pester 的电邮, Tamara S. Pester, LLC, to U.S. Copyright Off. (Sept. 30,2020)).
[197] Copyright Registration Guidance: Works Containing Material Generated by Artificial Intelligence, 88 Fed. Reg. 16190, 16192 n.27 (2023 年 3 月 16 日)(将编入《联邦法规》37 C.F.R. 第 202 部分)。
[198] “Spatial”,见前注 132,第 7 页。
[199] Mark A. Lemley, How Generative AI Turns Copyright Law Upside Down, 25 Colum. Sci. & Tech. L. Rev. 190, 199–201 (2024) ,可查阅: https://journals.library.columbia.edu/index.php/stlr/article/view/12761/6285(https://perma.cc/3ED8-YDFF)。Copyright Registration Guidance: Works Containing Material Generated by Artificial Intelligence, 88 Fed. Reg. at 16192 n.27(指出:“提示词可能具有足够的创造性而获得著作权保护”,但由此生成的内容则不享有该保护);“Zarya,”见上注 131, 第 9 页(认为“Zarya of the Dawn”的提示词类似诗歌,因此具有著作权性,但申请人并未在著作权登记申请中提交这些提示词)。
[200] “Spatial”,见前注 132,第 1 页。
[201] “SURYAST”,见前注 133,第 5 页。(引自 Ankit Sahni 于 2022 年 4 月 14 日发送给美国版权局的电子邮件)。
[202] 同上注,第 5-8 页。
[203] 同上注,第 6 页。
[204] 同上注,第 2 页。
[205] 同上注。(引自 Ankit Sahni 于 2022 年 4 月 14 日发送给美国版权局的电子邮件)。
[206] 同上注。(引自 Ankit Sahni 于 2022 年 4 月 14 日发送给美国版权局的电子邮件)。
[207] 同上注。(引自 Ankit Sahni 于 2022 年 4 月 14 日发送给美国版权局的电子邮件)。
[208] 同上注。(引自 Ankit Sahni 于 2022 年 4 月 14 日发送给美国版权局的电子邮件)。
[209] 同上注,第 4 页。
[210] 同上注,第 8 页。
[211] 同上注,第 2 页。
[212] 同上注,第 8 页。
[213] 同上注,第 2 页。
[214] 美国版权局注册官兼局长 Shira Perlmutter 于 2024 年 2 月 23 日致参议员 Chris Coons、Thom Tillis、众议员 Darrell Issa 与 Henry C. Johnson 的函件,载于:https://copyright.gov/laws/hearings/USCO-Letter-on-AI-and-Copyright-Initiative-Update-Feb-23-2024.pdf?loclr=blogcop(https://perma.cc/RBC6-TW6G)。
[215] Andres Guadamuz, Linkedin (2024 年 7 月 22 日),可访问:https://www.linkedin.com/posts/andres-guadamuz-im-participating-in-a-workshop-on-ai-and-activity-7221139807035342848-ApAc(https://perma.cc/B8NZ-9HD8)。
[216] White Paper on Rule of Law in Cyberspace Governance, 北京互联网法院发布(2019 年 5 月 24 日),可访问:https://english.bjinternetcourt.gov.cn/2019-05/24/c_167.htm(https://perma.cc/Y5UJ-7WUL);另见该院“Jurisdiction” 页 面 ( 2019 年 3 月 25 日 ), https://english.bjinternetcourt.gov.cn/2019-03/25/c_23.htm(https://perma.cc/7LEW-BX2C)。
[217] 李昀锴诉刘元春侵害作品署名权、信息网络传播权纠纷案((2023)京 0491 民初 11279 号,北京互联网法院 2023 年 11 月 27 日 ), 英文译文由乔治 华 盛 顿 大学法律与技术中心提供:https://patentlyo.com/media/2023/12/Li-v-Liu-Beijing-Internet-Court-20231127-with-English-Translation.pdf(https://perma.cc/V2EH-39K8),下称“春风”。
[218] 同上注。另见 Tian Lu, Chinese Court Deems AI-Generated Image Has Copyright – Assessing the Possibly Over-Hasty ‘Spring Breeze’ Case, IP Kat (2023 年 12 月 27 日 ) ,https://ipkitten.blogspot.com/2023/12/chinese-court-deems-ai-generated-image.html ( https://perma.cc/4XK8-9GZG)。
[219] 见下文第二部分 A 节。
[220] 见下文第二部分 B 节。
[221] 见下文第二部分 C 节。
[222] 见下文第二部分 D 节。
[223] 见下文第二部分 E 节。
[224] “音乐喷泉”作品著作权侵权纠纷案,(2017)京73民终1404号(北京知识产权法院,2018 年 6 月26 日),可查阅于:https://bjgy.bjcourt.gov.cn/article/detail/2019/04/id/3850563.shtml(https://perma.cc/SML4-25UH)(下称“音乐喷泉”)。
[225] 同上注。
[226] 同上注。
[227]北京菲林律师事务所诉北京百度网讯科技有限公司著作权侵权纠纷案,(2018)京 0491 民初239号(北京互联网法院, 2019 年 4 月 25 日 ),英文译文可参见 ChinaDaily :https://www.chinadaily.com.cn/specials/BeijingInternetCourtCivilJudgment(2018)Jing0491MinChuNo.239.pdf(https://perma.cc/8PSG-HZZF)(下称“Feilin”)。
[228] 同上注。
[229] 同上注。
[230] 同上注。
[231] 同上注。
[232] 同上注。
[233]深圳市腾讯计算机系统有限公司诉上海盈讯科技有限公司侵害著作权及不正当竞争纠纷案),(2019)粤0305民初14010号(深圳市南山区人民法院2019 年 12 月 24 日 ), 可查阅:https://mp.weixin.qq.com/s/jjv7aYT5wDBIdTVWXV6rdQ(https://perma.cc/M7LQ-P8WF)(下称“Dreamwriter”)。
[234] Bo Zhou, Artificial Intelligence and Copyright Protection—Judicial Practice in Chinese Court 1 (2020),https://www.wipo.int/export/sites/www/aboutip/en/artificial_intelligence/conversation_ip_ai/pdf/ms_china_1_en.pdf(https://perma.cc/2C9K-F2FU)。
[235] “Dreamwriter”,见上注 233。
[236] 同上注。
[237] Andres Guadamuz, Chinese Court Declares that AI-Generated Image Has Copyright, TechnoLlama(2023年 12 月 9 日),可查阅于:https://www.technollama.co.uk/chinese-court-declares-that-ai-generated-image-has-copyright(https://perma.cc/X54T-ZMGU)。
[238] 高阳诉优酷信息技术(北京)有限公司侵害著作权纠纷案,(2017)京73民终797号(北京知识产权法院,2020 年 4 月 2 日),(下称“热气球”)。另见 Zhou,同上注 234,第 4 页。
[239] “热气球”,见上注 238。
[240] 同上注。
[241] 同上注。
[242] 同上注。
[243] 同上注。
[244] Stable Diffusion、Midjourney、DALL-E、ChatGPT 等西方生成式人工智能服务在中国大陆均被地理屏蔽,但可通过虚拟私人网络(VPN)访问。参见 Ben Wodecki, China Cracks Down on ChatGPT Access, AI Business(2023 年 2 月 24 日),可查阅:https://aibusiness.com/nlp/china-cracks-down-on-chatgpt-access(https://perma.cc/BUS8-R2BY);Benj Edwards, China Bans AI-Generated Media Without Watermarks, Ars Technica(2022 年 12 月 13 日),可查阅:https://arstechnica.com/information-technology/2022/12/china-bans-ai-generated-media-without-watermarks/(https://perma.cc/XT2G-NDY7)。根据 Josh Ye 报道,生成式 AI 服务的运营者须获得中国国家网信办的许可。见 Josh Ye, China Approves over 40 AI Models for Public Use in Past Six Months, Reuters(2024 年 1 月 29 日),可查阅:https://www.reuters.com/technology/china-approves-over-40-ai-models-public-use-past-six-months-2024-01-29/(https://perma.cc/PL89-HTUB)。
[245] 小红书,https://www.xiaohongshu.com/explore(https://perma.cc/8CB4-VK6Q)(最后访问时间:2024年 11 月 9 日)。
[246] “春风”,见上注 217。
[247] 《互联网信息服务深度合成管理规定(征求意见稿)》,中国国家互联网信息办公室,2022 年 1 月28 日发布,原文可查阅:http://www.cac.gov.cn/2022-01/28/c_1644970458520968.htm(https://perma.cc/MMW7-8AQ3)。
[248] “春风”,参见上注 217,第 2 页、第 18 页。
[249] 百家号,https://baijiahao.baidu.com(https://perma.cc/ZW3U-G5Q9)(最后访问时间:2024 年 11 月9 日)。
[250] Subhrajit Sinha Roy 等人,《图像的智能著作权保护》(2019 年),详述去水印过程。
[251] Lu,见上注 218,关于“信息网络传播权”。
[252] “春风”,参见上注 217。Lu,见上注 218。
[253] 正向提示词样例如下:(ultra photorealistic: 1.3), extremely high quality highdetail RAW color photo, in locations, japan idol, highly detailed symmetrical attractive face, angular simmetrical face, perfectskin, skin pores, dreamy black eyes, reddish-brown plaits hairs, uniform, long legs, thighhighs, soft focus, (film grain, vivid colors, film emulation, kodak gold portra 100, 35mm, canon50 f1. 2), Lens Flare, Golden Hour, HD, Cinematic, Beautiful Dynamic Lighting (“(超逼真照片 1:3),超高品质高细节的原始图像数据处理格式彩色照片,外景,日本偶像,高度细节对称且迷人的脸,棱角匀称的脸,完美的皮肤,皮肤毛孔,梦幻般的黑眼睛,红褐色的辫子,均匀,长腿,长筒袜,软对焦,(胶片纹理,生动的色彩,胶片仿真,柯达黄金肖像 100.35mm,佳能 50f1.2),镜头光晕,黄金时间,高清,电影,美丽的动态灯光。”)。参见 HFG, For the First Time AI Generated Photo Gets Copyright in China,2023 年 12 月 5 日,https://www.hfgip.com/news/first-time-ai-generated-photo-gets-copyright-china(https://perma.cc/MZH9-4B27)。
[254] 反向提示词样例如下:((3d, render, cg, painting, drawing, cartoon, anime, comic: 1.2)), bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, signature, watermark, username, blurry, artist name, (longbody), bad anatomy, liquid body, malformed, mutated, badproportions, uncoordinated body, unnaturalbody, disfigured, ugly, gross proportions, mutation, disfigured, deformed, (mutation), (child:1.2), b&w, fat, extra nipples, minimalistic, nsfw, lowres, badanatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, disfigured, kitsch, ugly, oversaturated, grain, low-res, Deformed, disfigured, poorly drawn face, mutation, mutated, extra limb, ugly, poorly drawn hands, missing limb, floating limbs, disconnected limbs, malformed hands, blur, out of focus, long neck, long body, ugly, disgusting, poorly drawn, childish, mutilated, mangled, old, surreal, text, b&w, monochrome, conjoined twins, multiple heads, extra legs, extra arms, meme, elongated, twisted, fingers, strabismus, heterochromia, closed eyes, blurred, watermark, wedding, group, dark skin, dark-skinned female, , tattoos, nude, lowres, badanatomy, badhands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry((3d,渲染,例如:绘画,素描,卡通,动漫,漫画 1.2)),糟糕的解剖结构,糟糕的手,文字,错误,缺失的手指,多余的数字,更少的数字,裁剪,最差的质量,签名,水印,用户名,模糊,艺术家的名字,(长体),糟糕的解剖结构,液体,畸形,突变,糟糕的比例,不协调的身体,不自然的身体,毁损,丑陋,粗大的比例。突变,毁损,变形,(突变),(儿童:1.2),黑与白,脂肪,多余的乳头,极简主义,不适宜工作场所,低分辨率,糟糕的解剖结构,糟糕的手,文字,错误,缺失的手指,多余的数字,更少的数字,裁剪,最差的质量、低质量,正常质量,jpeg 伪影,签名,水印,用户名,模糊,毁容,媚俗,丑陋。过饱和,纹理,低分辨率,变形,毁容,没画好的脸,突变,突变,多余的肢体,丑陋,没画好的手,缺失的肢体,漂浮的肢体,断开的肢体,畸形的手,模糊,失焦,长脖子,长身体,丑陋,恶心,画得不好,幼稚,残缺,支离破碎,显老。超现实的,文本。黑和白单色,连体双胞胎,多个头部,多余的腿,多余的手臂,模因,拉长,扭曲,手指,斜视,异色,闭上眼睛,模糊,水印,婚礼,团体,深色皮肤,深色皮肤的女性,纹身,裸体,低分辨率,糟糕的解剖结构,糟糕的手,文字,错误,缺失的手指,多余的数字,少的数字,裁剪,最差的质量,低质量,正常质量,Jpeg 伪影,签名,水印,用户名,模糊。)李先生进一步的设置和提示词:c) 将迭代步数修改为 33;d) 设置高度为:768;e) 提示词引导系数修改为 9;f) 随机数种子修改为 2692150200;g) 在“附加网络(Additional-Networks)”中为模型“land-hanfugirl-v1-5.safetensors”设置权重;h) 修改随机种子为:2692150199;i) 在提示词中添加多个关键词:“shy, elegent, cute, lust, cool pose, teen, viewing at camera, masterpiece, bestquality(害羞、优雅、可爱、情欲、酷姿势、青少年、机前浏览、杰作、最佳质量)”。
[255] How Does Stable Diffusion Work?,Stable Diffusion Art(2024 年 6 月 9 日),https://stable-diffusion-art.com/how-stable-diffusion-work/ [https://perma.cc/AF38-43MQ];Alec Radford 等,CLIP: Connecting Text and Images,OpenAI(2021 年 1 月 5 日),https://openai.com/index/clip/ [https://perma.cc/2AF2-4QPW]。
[256] CLIP 模型最初是在一个包含图像的数据集上进行训练,并通过一种称为 CLIP 嵌入的中间格式学习图像与其相关文本的语义联系。该方法从一个初始图像开始,对其添加噪声,然后利用 CLIP 模型根据文本提示引导去噪过程。当用户提交一个提示词(可以是文本、图像或两者结合)给 AI 图像生成产品时,CLIP 模型会将该提示转换为嵌入向量。该嵌入随后作为条件数据,在扩散模型逐步生成图像的去噪过程中被使用。在去噪过程结束时生成的图像即为最终呈现给用户的输出。见 Stable Diffusion Art,前注 255。
[257] Nicholas Carlini 等,Extracting Training Data From Diffusion Models 1,第 1 页(2023 年 1 月 30 日,未出版手稿),https://arxiv.org/pdf/2301.13188.pdf [https://perma.cc/B92T-JUCF]。
[258] Jonathan Ho 等,Denoising Diffusion Probabilistic Models 8,(2020 年 12 月 16 日,未出版手稿),https://arxiv.org/pdf/2006.11239.pdf [https://perma.cc/7XEY-QAZX]。
[259] “春风”,前注 217,第 13 页。
[260] 同上注,第 12 页;Feist Publ’ns, Inc. v. Rural Tele. Serv. Co., 499 U.S. 340, 352–53 (1991)。
[261] Burrow-Giles Lithographic Co. v. Sarony, 111 U.S. 53, 55, 60 (1884)。
[262] Lemley, 见上注 199, 第 200–01 页.
[263] “春风” 见上注 217, 第 14 页。
[264] 同上注。
[265] 同上注。
[266] Oren Bracha,The Work of Copyright in the Age of Machine Production 1,第 1 页(2023 年 9 月 24 日,未出版手稿),https://ssrn.com/abstract=4581738 [https://perma.cc/9EVA-2JGJ]。
[267] 参见 Mark A. Lemley 与 Bryan Casey,Fair Learning,Tex. L. Rev 99 卷 743 页,745(2021 年)。但参见 Jon Baumgarten,Former Copyright Office GC Warns Against Blanket Assertions That AI Ingestion of Copyrighted Works ‘Is Fair Use’,版权联盟(2023 年 5 月 23 日),https://copyrightalliance.org/warns-assertions-ai-ingestion-is-fair-use/ [https://perma.cc/4N9U-5CU7]。
[268] “春风” 见上注 217,第 10 页。
[269] Bleistein v. Donaldson Lithographing Co., 188 U.S. 239, 252 (1903) (Holmes 法官意见)。
[270] Keith Kelly,Computer Love: Beijing Court Finds AI-Generated Image is Copyrightable in Split with United States,Nat’l L. Rev(2023 年 12 月 20 日),https://natlawreview.com/article/computer-love-beijing-court-finds-ai-generated-image-copyrightable-split-united [https://perma.cc/G5UP-QPSF]。
[271] “春风” 见上注 217。
[272] 同上注。
[273] 同上注。但参见 Paul Goldstein,Goldstein on Copyright 第 2.2.2 节(第 3 版,2005 年及 2024 年增补):“在一个几乎只需电费成本即可电子创作新作品的环境中,计算机生成产品的创作者将几乎没有动机去复制他人创作的产品。”
[274] Du Qiongfang,Beijing court rules first case of infringement on a generative AI picture,Global Times(2023 年 11 月 30 日晚 9:08),https://www.globaltimes.cn/page/202311/1302805.shtml [https://perma.cc/ZPC2-44TQ]。案件庭审(中文)录像可在线查看,参见 冬青白萝,《庭审录播:国内首例 AI 绘画版权纠纷案》,bilibili(2023 年 8 月 24 日),https://www.bilibili.com/video/BV1iz4y1T7Q1/ [https://perma.cc/5QZK-A3XZ]。
[275] 参见 Seagull Song, China’s First Case on Copyrightability of AI-Generated Picture, King & Wood Mallesons (2023 年 12 月 7 日 ), https://www.kwm.com/cn/en/insights/latest-thinking/china-s-first-case-on-copyrightability-of-ai-generated-picture.html [https://perma.cc/N8H8-MHV3].
[276] Jason Brownlee, Why Do I Get Different Results Each Time in Machine Learning?, Machine Learning Mastery (2020 年 8 月 27 日), https://machinelearningmastery.com/different-results-each-time-in-machine-learning [https://perma.cc/743L-77QK].
[277] 同上注。
[278] What Are Large Language Model Settings: Temperature, Top P And Max Tokens, Novita AI(2024 年 4 月29 日 ), https://blogs.novita.ai/what-are-large-language-model-settings-temperature-top-p-and-max-tokens/ [https://perma.cc/7JGV-M9ZS]。有人认为,生成结果的多样性对社会具有积极意义。参见:Michal Shur-Ofry 等人,Growing a Tail: Increasing Output Diversity in Large Language Models,第 10 页(2024 年 11 月 5 日,未出版手稿),https://arxiv.org/abs/2411.02989v1 [https://perma.cc/SY3W-RLFT](“一些简单且低成本的手段,例如提高 temperature 值与使用引导多样性的提示词,可以‘提取’这些内容,并显著提升输出的多样性水平。”)
[279] Shervin Minaee 等人,Large Language Models: A Survey,第 1、36 页(2024 年 2 月 20 日,未出版手稿),https://arxiv.org/pdf/2402.06196v2 [https://perma.cc/HP4P-W8KT](大语言模型主要是指“基于Transformer 结构的神经语言模型,包含数百亿至数千亿个参数,并在海量文本数据上进行预训练。”不过,“未来的大语言模型预计将具备多模态能力,能够以统一的方式处理多种数据类型,如文本、图像、视频和
音频。”)
[280] 同上注,第 21 页。
[281] 参见 Guide to Using Seed in Stable Diffusion,getimg.ai,https://getimg.ai/guides/guide-to-seed-parameter-in-stable-diffusion [https://perma.cc/UN7H-VTHY](最后访问时间:2024 年 10 月 11 日)。
[282] 同上注。
[283] 参见 Lu,前注 218。
[284] 同上注。
[285] 参见 He,前注 32,第 301 页。
[286] 于雯雯,《人工智能生成内容的著作权问题》,中央网信办(2019 年 8 月 21 日),https://web.archive.org/web/20230511195349/http://www.cac.gov.cn/2019-08/21/c 1124902661.htm [https://perma.cc/88H9-FRM7]。
[287] 同上注。
[288] 《1988 年著作权、外观设计和专利法》,c. 48,第 9(3)条(英国):“在由计算机生成的文学、戏剧、音乐或艺术作品的情形中,应视为作者的是完成创作该作品所必需安排的人”;参见 Lee,前注 146,第 186–187 页(“尽管没有明确可辨的作者来完成创作所需的安排,但《1988 年著作权法》显然意在在作者与计算机生成作品之间建立一种个人关系或因果联系。”)。
[289] 北京互联网法院的判决引发了关于中美著作权制度是否由趋同转向分化的国际学术讨论。Yu 教授对“交汇分化”(即标准的部分趋同与部分分化同时发生)的可能性持开放态度。参见 Peter K. Yu,The Future Path of Artificial Intelligence and Copyright Law in the Asian Pacific,Comput. & L.第 96 卷(即刊,2024 年),手稿第 10 页,https://ssrn.com/abstract=4707592 [https://perma.cc/E7PY-DDAP]。
[290] 参见 Shira Perlmutter,Participation in the International Copyright System as a Means to Promote the Progress of Science and Useful Arts,Loy. L.A. L. Rev. 第 36 卷 323 页,330 及注 23(2002 年)(主张非歧视性的“国民待遇”原则,即对外国作品给予与本国作品同等的待遇,从而促使各国提高保护水平以保持一致性)。
[291] 是时候将《伯尔尼公约》更新至人工智能时代了,正如《世界知识产权组织互联网条约》(即《世界知识产权组织版权条约》和《世界知识产权组织表演与录音制品条约》)在 1996 年将《与贸易有关的知识产权协定》调整为适用于互联网时代一样。参见 Friedmann,前注 10,第 1 页;另参见 Yu,前注 289,第 4 页(指出目前似乎全球普遍认同人工智能系统不能成为著作权法意义上的作者,但在 AI 生成作品应具备多少人类创意以取得著作权方面,国际观点存在分歧)。
(本文仅代表作者观点,不代表知产力立场)
编辑 | 冯婉宁 布鲁斯 封面来源 | AI生成
热门跟贴