上周在 TikTok 上,我看到一位女性在珠穆朗玛峰的雪中埋葬她的狗,因为它在艰苦的旅途中去世。评论者指责这位女性虐待动物,但这其实并不是一个关于狗死去的悲伤故事。这位女性、小狗和这座山都是由 AI 生成的,可能是由 OpenAI 的视频生成工具 Sora 2 制作的(尽管视频中的水印已被移除,账户的用户名是 Soralice)。整个场景可能仅仅是通过几行提示就生成的。

研究人员对逼真的生成 AI 图像和视频发出了警报,认为这会助长不法分子创造越来越多逼真的深度伪造视频以达到恶意目的。但随着大众掌握了这项革命性技术,许多人开始玩弄这项技术,得出了可能是最愚蠢的用法:恶作剧和愤怒诱饵。

青少年们正在搞“无家可归者”恶作剧,他们生成图像,通常是一个穿着污垢或破旧衣服、留着蓬乱胡须的男人,声称他闯进了他们的家。然后,青少年将照片发送给父母,并把这些图像和他们惊慌失措的父母的聊天记录一起发布。这个恶作剧已经变得非常普遍,以至于一些地方警察局发布了公告,其中一个称其为“愚蠢且潜在危险”。已故公众人物的子女,比如 马丁·路德·金 和 罗宾·威廉姆斯,正在恳求大家停止生成他们已故父母的视频(OpenAI 暂停了 MLK 的视频,并表示遗产可以请求选择退出使用已故者的图像)。TikTok 上充斥着 AI 生成的动物视频,从病毒式传播的假兔子在蹦床上跳,到狗狗拆掉吊灯或跳入蛋糕破坏婚礼。女性们给她们的男朋友和丈夫发 AI 生成的热辣、赤裸上身的水管工图片。很多内容看起来足够逼真,让观众开始怀疑自己看到的是否真实。

就在两年前,AI生成的视频还处于尴尬的青春期。凭借相当的技能和几种工具,恶意行为者可以制作出令人信服的深度伪造视频,模仿像弗拉基米尔·普京和唐纳德·特朗普这样的世界领导人,或者通过冒充他们或伪造文件来欺骗他人。但那种通过提示即时生成视频的功能却缺失。由ModelScope制作的病毒式视频,展示了威尔·史密斯将意大利面铲入嘴中的场景,比欺骗更让人感到不安——演员的面孔虽然可识别,但却显得超现实,他的动作生硬而古怪,手指看起来很多。那时的视频更像是翻页书,而不是实时录制,经过训练的眼睛仍然能识别出大多数合成图像。当我在2023年写关于AI视频的文章时,专家告诉我,这项技术很难推广,缺乏连贯性使得视频呈现出标志性的跳跃感,而且需要更多的计算能力才能提供流畅且令人信服的效果。

但对这项技术的投资带来了快速的变化,现在任何人都可以制作和发布视觉上令人印象深刻、且具有欺骗性内容。截至今年,AI视频生成已经迅速发展,已经不再像史密斯吃意大利面的那段时间那样容易辨认。这些视频和图像制作起来很简单,社交媒体算法也在奖励这些内容,因为人们纷纷分享。虽然这些内容大多出现在以AI为主的平台上,如OpenAI的Sora或Meta的Vibes动态,或在X上与xAI的Grok一起,但它并不总是停留在那里,而是流向人们已经习惯于看到的那些可能是真实的其他平台。“这是一个为新一代表情包提供完美引擎的绝佳工具,”AI和深度伪造专家亨利·阿杰德(Henry Ajder)说,他曾为Meta等公司提供建议。生成的AI图像能够混合制作定制内容和特定于你的内容,同时又保留一种风格。它快速实现这一点,让人们能更快跟上潮流。

人工智能可以模仿伟大的身体壮举或可爱的狗,但这些视频并不总是能建立情感联系。

这在某种程度上是长期以来社交媒体问题的最新演变——高度偏见和令人震惊的虚假信息,以及引发愤怒的剥削性内容可以浮出水面。“在某种程度上,这不是一个算法问题,而是一个人类问题,”加州大学伯克利分校信息学院的教授哈尼·法里德说。人们制作和观看低质量内容,结果训练算法向用户推送更多这样的内容。算法的作用在于迅速将垃圾内容、恶作剧或趋势传播给更多的人。尽管TikTok舞蹈迅速在信息流中传播,或者X可以迅速使新闻故事变得病毒式传播,但制作AI生成内容的门槛已经下降到如此惊人的程度。现在,制作这些视频的速度几乎和发一条糟糕的推文一样快。“使用AI生成的垃圾内容,你可以非常快速地适应,因为你并没有制作任何东西,因此这些算法的操控——以及在这些算法另一端的人类——可以更加戏剧化。”

这些无聊的视频趋势指向了生成AI的一个更大潜在问题:对生成AI的用途缺乏理解,AI伦理学家、书籍《负责任的AI》的作者奥利维亚·甘贝林表示。AI公司释放了这些视频,基本上让公众自行决定它们的优劣和价值。甘贝林说,这就像他们在对大家说,“‘你们自己想办法吧,’而不是,我们将提出一些实际的、基本的用途,你可以用来改变你的生活或根本改善你的生活。”OpenAI的山姆·阿尔特曼自己也表示,人们应该在某些边界内决定如何使用AI。“社会在多大程度上设定这些边界,而不是信任用户使用这些工具?”阿尔特曼在去年麻省理工学院的演讲中说。“并不是每个人都会以我们喜欢的方式使用它们,但这就是工具的本质。”

一些艺术家找到了引人注目的方法,将人工智能图像融入他们的作品中,推动了他们在有限预算或独自创作时的边界,但大多数人没有时间或想法去这样做。这导致人们使用生成的人工智能轻松模仿社交媒体趋势;这些内容只需几秒钟就能制作出来,既能吸引注意力,又能短暂娱乐。“这些傻乎乎的用法是我们最容易理解的,”甘贝林说,而围绕这项技术的更哲学性的问题是:“我们试图用人工智能生成的视频解决什么问题?”

这种类型的人工智能视频现在在社交媒体上随处可见,但它们的显著性可能会减退。“现在我们可能正处于新奇效应中,”法里德说。生成的人工智能视频引人注目,因为它们可以创造我们从未遇到过的场景。“我也能想象,当新奇感消退后,情况会变成这样,这不会花太长时间,你可能会想,‘好吧,这真的很傻。’”人工智能可以模仿伟大的身体壮举或可爱的狗,但这些视频并不总是建立情感联系。我们想看人们跳舞、做后空翻,还想看搞笑的动物,因为这些图像是真实生活的一部分,而我们没有机会体验:这就是“拍照才算发生”的精神,以及当我们看到一些令人惊叹的事物时,想要拿出手机的驱动力。“你能在一些华丽的东西上吸引我们的注意力的时间是有限的,而不是在一些真实的东西上,”甘贝林说。但在试图在线吸引我们的目光时,内容可能只会变得更糟。“在新奇性方面,这就像是一场向下的竞赛。”