“别碰我的声音”：配音演员担心生成式人工智能会抢走自己饭碗|人工智能|克拉克|别碰我的声音|琼斯|配音演员

文 | Rashi Shrivastava

制作工作室和粉丝们都在使用生成人工智能工具，让配音演员说出他们从未说过的话——也让他们的饭碗岌岌可危。

图片来源：ANGELICA ALZONA FOR FORBES; PHOTOS BY PETER DAZELEY/GETTY IMAGES

配音演员阿利格拉·克拉克（Allegra Clark）在刷TikTok时，看到了一段视频，视频中的人物是她配音的电子游戏《原神》中的勇猛的船长北斗，但在克拉克看到的视频里，北斗正在参与一个具有性暗示的场景，并说了一些克拉克从未说过的话，尽管那粗犷的声音听起来和她一模一样。该视频的创作者使用了一种名为ElevenLabs的生成式人工智能工具克隆了克拉克的声音，然后他就可以让那个声音说任何他想说的话。

克拉克曾为100多个电子游戏角色和数十个广告配音，她说她把这个视频看作是一个笑话，但她担心她的客户可能也会看到它，并认为她参与了它的配音——而这可能违反了她的合同。

她在写给ElevenLabs的一封电子邮件中写道：“如果人们认为我们说了（这些话），这不仅会给我们带来很多麻烦，而且坦率地说，当你听到自己的声音，但那并不是你自己说的话，这种感觉也是非常冒犯的。”她要求该初创公司删除上传的音频片段，并禁止将来继续克隆她的声音，但该公司表示，尚未确定该视频片段是用其技术制作的。该公司声称，只有当视频片段是“仇恨言论或诽谤”时，他们才会立即采取行动，并表示不对任何侵犯版权的行为负责。对于克拉克的诉求，该公司从未跟进或采取任何行动。

“我们对自己的声音没有个人所有权，这种感觉很糟糕。我们所能做的就是对这种情况说不。”克拉克告诉《福布斯》。

针对克拉克的遭遇，ElevenLabs 的联合创始人兼首席执行官马蒂·斯坦尼谢夫斯基（Mati Staniszewski）在一封电子邮件中告诉《福布斯》，如果用户所创建的内容可能具有"破坏性或诽谤性"，那么他们需要得到被克隆人的"明确同意"。在克拉克的经历发生几个月后，该公司推出了一款“语音验证码”工具，要求人们录制一个随机生成的单词发音，该声音必须与他们想要克隆的声音相匹配。

该公司估值约为1亿美元，由安德森霍洛维茨基金（Andreessen Horowitz）和谷歌DeepMind联合创始人穆斯塔法·苏莱曼（Mustafa Suleyman）领投，是目前最热门的语音AI公司之一。它的技术只需要30秒到10分钟的音频，就能创造出几乎与原声完全相同的声音复制品。与FakeYou和Voice AI等提供免费数字语音库的网站一样，它也是生成式人工智能对配音演员造成影响的源头。

对10位配音演员的采访显示，随着雇主开始尝试使用这些文字转语音工具，这个本已岌岌可危的行业正处于大范围变革的边缘。

一位接受《福布斯》采访的配音演员说，一位雇主在宣布与ElevenLabs合作的第二天就告诉她，不会再聘用她完成一系列有声读物的解说工作，这让她担心自己会被人工智能取代。另一个人说，她的雇主告诉她，他们想用ElevenLabs的人工智能来加快重拍的速度，而重拍是配音演员录制音频的一个标准环节，参与其中的配音演员是有报酬的。当她告诉雇主她不同意将自己的声音上传到任何人工智能网站时，雇主同意了，但她说她还没有被叫去做任何重拍。

NAVA总裁蒂姆·弗里德兰德（Tim Friedlander）表示，在苹果图书公司（Apple Books）于2023年1月推出数字有声读物旁白，并提供一套女高音和男中音声音后，声优界首次注意到人工智能生成的声音涌入。他说，配音演员们开始发现，成千上万人们熟悉的声音的音频文件被上传到各个网站，其中大部分是粉丝上传的。最近，著名演员斯蒂芬·弗莱（Stephen Fry）表示，有人将他的声音从《哈利·波特》系列小说的旁白中提取出来，并用人工智能克隆了出来。在CogX峰会上的一次演讲中，弗莱表示这一经历让他“震惊”。

在一份公开的电子表格中，数百名配音演员要求将他们的声音从人工智能语音生成器Uberduck和FakeYou中清除。这些网站都表示，如果声音的主人联系他们，他们会从网站上删除这些声音。尽管FakeYou仍然提供成千上万受欢迎的声音，比如约翰·塞纳（John Cena）和坎耶·韦斯特（Kanye West）的声音，可供任何人使用，但Uberduck在7月份从其平台上删除了用户贡献的声音。Uberduck和FakeYou.ai没有回应我们的多次置评请求。

吉姆·卡明斯（Jim Cummings）是公开要求将自己的声音从声音生成器中删除的配音演员之一，他是《小熊维尼》（Winnie-the-Pooh）和《兔八哥》（Looney Tunes）中塔兹（Taz）等角色的配音。他告诉《福布斯》，只有在他和他的家人获得版税的情况下，他才会同意用户模仿他的声音。“把你的脏手从我的声音上拿开。”他说。

法律困境

与那些通过罢工对人工智能的到来以及人工智能可能如何影响他们的工作敲响了警钟的电影演员一样，配音演员也站在了这项技术变革的前沿。但与其他创意领域不同的是，在这些领域，作家和艺术家们正在联合起来发起集体诉讼，反对他们受版权保护的作品被用来训练人工智能模型，而配音演员却处于一个独特的弱势地位。尽管声音本质上是因人而异的，但它们并不作为知识产权受到保护。“声音不像你的脸或指纹那样受到法律保护，”多个电子游戏角色的声优詹妮弗·罗伯茨（Jennifer Roberts）表示。“我们对此束手无策。”

然而，声音的录制是受版权保护的，诺里斯·麦克劳恩律师事务所（Norris McLaughen）的律师珍妮·汉伯格（Jeanne Hamburg）表示，对声音出于商业目的使用可以受到“宣传权”的保护，这可以防止名人的肖像和声音被利用。不过，这仅仅是理论上的：大多数配音演员签署的合同并没有阻止他们录制的声音被用于训练人工智能系统。配音演员茜茜·琼斯（Cissy Jones）是新成立的配音演员工会全国配音演员协会（National Association of voice Actors, NAVA）创始团队的一员，她说，几十年来，配音合同都规定制作人“在已知的整个宇宙中，在任何现有或即将开发的技术中，永远拥有录音的所有权和版权。”

这些合同大多是在人工智能系统出现之前编写和签署的。NAVA的律师斯科特·莫特曼（Scott Mortman）说：“配音演员没有在合同中对未来使用他/她录制的声音提供知情同意，也没有得到公平的补偿。因此，在人工智能之后，保护措施需要得到显著加强。”

这就是为什么NAVA和演员工会SAG-AFTRA正在努力从合同中删除允许雇主使用演员的声音创建"数字替身"或通过机器学习"合成"其声音的条款。这些组织还制定了新的条款模板，用来加入到合同中，以保护配音演员免于失去对自己声音的权利。

多到数不清的滥用

像克拉克一样，许多配音演员都经历过粉丝使用生成式人工智能工具模拟他们的声音，来创造色情、种族主义和暴力内容的经历。即使粉丝们只是用人工智能语音制作无害的表情包或其他类型的粉丝内容，一些配音演员也会在社交媒体上发声，禁止人们伪造他们的声音。

NAVA成员琼斯的声音曾出现在迪士尼节目和Netflix纪录片中，她在TikTok视频中发现，粉丝们用Uberduck克隆了她的声音去说一些不恰当的话。琼斯在接受《福布斯》采访时表示：“我的声音不仅说了一些我永远不会说的话，而且这些东西已经在世界上流传开来了。如果潜在雇主听到我们这么说，会对我未来的工作产生什么影响?”琼斯说，在她联系对方以后，Uberduck从平台上删除了她的声音。

人工智能生成的声音也成为了一种新的骚扰媒介。曾为《原神》和《上古卷轴》等游戏配音的阿比·维弗（Abbey Veffer）表示，今年2月有人复制了她的声音，还人肉搜索了她。这个人用她的地址创建了一个Twitter账户，生成了一个人工智能克隆的维弗的声音，然后让克隆的声音说了一些包含种族主义和有暴力倾向的话。这位匿名用户直接把录音发给了维弗，并将这段录音放在那个推特账户的顶部。他们声称使用了ElevenLabs的技术。维弗告诉《福布斯》，这段经历让她“非常紧张”和“沮丧”。

但是，当维弗向ElevenLabs表达她的担忧时，该公司表示，对其声音的克隆不是使用其软件创建的，而是针对该初创公司的“有组织抹黑运动”的一部分。她说，在她联系Twitter 三天之后，该账户被封禁，视频也被撤下，但她的居住地址仍在推特上被保留了三个月。

今年1月，在推出了其文本转语音人工智能工具的测试版后，ElevenLabs这家初创公司宣布，它正在努力解决人们滥用其技术的问题。一天后，Vice的技术频道Motherboard发现4Chan上的匿名发帖者使用ElevenLabs当时免费的克隆工具，用乔·罗根（Joe Rogan）和艾玛·沃特森（Emma Watson）等名人的声音发表种族主义、恐跨性别和暴力言论。

人工智能模仿人类声音的能力也为骗子创造了机会。美国联邦贸易委员会今年曾发出警告称，犯罪分子正在利用人工智能语音克隆来冒充别人的亲人，以此说服目标给他们汇款。一位媒体记者也曾使用ElevenLabs的工具创建了一个人工智能生成的自己的声音版本，并用它成功解锁了自己的手机。

ElevenLabs没有对这些具体情况发表评论，但其首席执行官Staniszewski在一封电子邮件中表示：“如果有人使用我们的工具克隆他们未经许可的声音，并且违反了公平使用案例，我们将封禁该帐户，并阻止他们使用相同的信息建立新账户。”除了确保人们获得许可的“语音验证码”工具外，该公司还表示，它还开发了一种人工智能语音分类器，可以以90%以上的准确率检测出包含人工智能的音频片段是否是使用其工具制作的。

授权与控制

为了应对滥用，语音生成网站正在增加限制措施来监管他们的技术。为史努比狗（Snoop Dog）和格温妮丝·帕特洛（Gwyneth Paltrow）等名人配音提供授权的Speechify公司（获得了完全许可），不允许人们上传内容来创建定制的声音，除非用户希望声音的原主人积极参与其中。与ElevenLabs类似，它会呈现一段独特的文本，用户或与他们在一起的人必须用自己的声音大声朗读。“我认为走捷径是目光短浅的行为，我的目标是让内容所有者掌握主动权。”公司创始人克里夫·韦茨曼（Cliff Weitzman）说。2012年，他首次创办了Speechify，利用机器学习将他的教科书转化为有声读物。

在招揽了Netflix和世界银行集团（World Bank Group）等企业客户的Resemble AI公司，人们只有在用自己想要生成的声音录制同意声明后，才能创建定制的人工智能生成的声音。Resemble AI创始人兼首席执行官佐海布·艾哈迈德（Zohaib Ahmed）表示，实施安全的技术部署方式是他的创业公司不可或缺的一部分，因为在他看来，防止滥用的责任应该落在制造工具的供应商身上，而不是最终用户身上。

然而，这类验证检查并没有解决与同意有关的更高层次的道德问题。例如，演员并不能真正控制他们的声音在死后会如何被使用。当游戏工作室Hi-Rez Studios在与声优的合同里添加了一个条款，允许自己在声音所有者死亡后使用AI克隆该声音时，配音演员们被激怒了（该条款在引起轩然大波后被删）。配音演员克拉克说：“如果一个演员去世了，最好的做法是用另一个人来代替他们，而不是制造一些人工表演，因为那不是他们，也不能让他们复活。”

笼罩在这一切之上最大的担忧就是，配音演员这份工作是否还有未来。随着雇主和粉丝们开始使用人工合成的声音，许多配音演员都在担心是否能找到下一份工作，或是保住现有的工作。NAVA的弗里德兰德说：“对我们来说，控制语音的使用方式和使用地点，以及使用我们的声音能让我们拿到多少报酬是非常重要的。”

译自https：//www.forbes.com/sites/rashishrivastava/2023/10/09/keep-your-paws-off-my-voice-voice-actors-worry-generative-ai-will-steal-their-livelihoods/?sh=239df5a37b27