两年前,OpenAI的研究人员在博客中展示了一项技术:用AI完美复刻人类声音。他们当时选择了不公开——风险太高。但这家公司并没有停下,只是换了一种方式继续。

据两位知情人士透露,OpenAI今年悄悄买下了一家叫Weights.gg的初创公司。交易条款未披露,但OpenAI拿下了团队和技术资产。这家公司在今年3月宣布关闭服务。

打开网易新闻 查看精彩图片

Weights.gg的玩法很直接:它是一个AI算法的社交网络。用户用免费应用Replay,就能克隆任何人的声音。一位YouTube用户上传了用该技术克隆演员塞缪尔·杰克逊声音的视频。平台上热门的语音模型还包括泰勒·斯威夫特、坎耶·韦斯特,以及韩国女团Blackpink成员的声音。

政治人物的语音也在库中——特朗普和拜登的声音都被克隆过。卡通形象同样没能幸免,兔八哥、达菲鸭的版权声音也被复制。

这桩收购的微妙之处在于:OpenAI对外声称的谨慎立场,与私下收购一家以"人人都能克隆声音"为卖点的公司,形成了某种张力。Weights.gg的技术门槛极低,免费应用面向普通消费者,这与OpenAI当年"因过于先进而不发布"的叙事并不一致。

语音克隆的滥用场景显而易见。深度伪造电话诈骗、政治虚假信息、名人形象盗用——这些风险Weights.gg的用户生态几乎全都触碰过。OpenAI将其收入囊中,是打算彻底封禁这些能力,还是重新包装后推出合规版本?目前尚无公开表态。

一个值得注意的细节是时间点。OpenAI完成收购的2024年,恰逢全球多国收紧AI监管。欧盟《人工智能法案》将深度伪造列为高风险应用,美国多个州也在推进语音克隆相关的立法。在这个背景下,把一家"野生"的语音克隆公司买下来,既可以消除潜在竞争对手,也能将技术纳入可控的研发管线。

从商业逻辑看,这符合OpenAI近年来的收购策略:小团队、特定技术、快速整合。此前该公司已收购多家初创公司,覆盖从代码工具到硬件设计的不同领域。语音作为多模态AI的关键一环,显然是重点布局方向。

但技术收购容易,伦理边界难定。OpenAI当年不发布语音克隆技术的理由——" abundance of caution"(充分谨慎)——如今该如何解释这桩交易?是认为Weights.gg的技术不够先进、不构成同等风险,还是内部对发布策略已有新的判断?

对于普通用户而言,更实际的问题是:未来会在ChatGPT里用到官方版的语音克隆功能吗?OpenAI现有的语音模式已经能进行自然对话,但"克隆特定人物声音"是另一回事。这涉及身份认同、版权归属、同意机制等一系列尚未解决的难题。

Weights.gg的关闭声明写得很简短,没有提及收购方。它的用户社区曾经活跃,有人用克隆声音做音乐翻唱,有人做搞笑视频,也有人做政治讽刺内容。这个生态的多样性,恰恰说明了语音克隆技术的双面性:创作工具与造假工具,往往共享同一套技术底座。

OpenAI现在拥有了这套底座。如何处理它,将是一次比技术本身更复杂的测试。