一项针对梗图创作的新研究发现,在现有的知名梗图图片上,AI生成的字幕在幽默感、创造力和“可分享性”方面的平均得分高于人类创作的。然而,人类仍然创作出了最出色的个别案例。

这项研究将在2025年国际智能用户界面会议(International Conference on Intelligent User Interfaces)上发表,揭示了AI和人类在幽默创作任务中的不同表现。这一结果甚至让一位专家宣布机器已经胜出。

“我遗憾地宣布,梗图版图灵测试已被攻破。”沃顿商学院教授伊桑·莫里克(Ethan Mollick)在Bluesky上评论道。莫里克从学术角度研究人工智能,他提到的是计算机先驱艾伦·图灵(Alan Turing)在1950年提出的一项著名测试,该测试旨在判断人类是否能够区分AI生成的内容和人类创作的内容。

但也许现在给AI加冕还为时尚早。研究论文指出:“尽管AI可以提高生产力,并创作出符合大众口味的内容,但人类的创造力仍然在更深层次的内容联结中起着关键作用。”

研究方法:人类 vs. AI vs. 人机协作

该研究由瑞典皇家理工学院(KTH Royal Institute of Technology)、德国慕尼黑大学(LMU Munich)和德国达姆施塔特工业大学(TU Darmstadt)的国际研究团队合作完成。他们设计了三个实验场景来比较梗图创作的质量:

1.由人类单独创作

2.由人类与大型语言模型(LLM,如OpenAI的GPT-4o)协作创作

3.由GPT-4o独立创作

研究中使用的一些梗图图片模板

研究人员选取了三类常见的梗图主题——工作、食物和运动,以测试AI和人类在这些熟悉情境下的幽默表现。结果显示,不同主题的梗图表现各异,例如,与食物或运动相关的梗图相比,关于工作的话题更容易获得高幽默感和可分享性评分。这表明,无论是AI还是人类创作的梗图,其效果都受到具体语境的影响。

值得注意的是,本研究并未使用AI生成的图片,而是采用了互联网上流行的现成梗图模板。GPT-4o或人类参与者仅负责为这些图片编写字幕。

AI生成的梗图平均评分更高,但人类仍创作出最优秀的个例

研究人员对比了AI生成的梗图和人类创作的梗图,发现AI生成的梗图在幽默、创造力和可分享性这三个指标上的平均得分更高。研究团队将“可分享性”定义为梗图被广泛传播的潜力,该潜力受幽默感、共鸣度和与当前文化话题的相关性影响。这项研究是首批表明AI生成的梗图在多个维度上超过人类创作的研究之一。

然而,研究也揭示了重要的限制条件。虽然AI生成的梗图在整体上平均得分更高,但在最优秀的个例上,人类仍然创作出最搞笑的梗图,而人机协作创作的梗图则在创造力和可分享性方面得分最高。换句话说,AI可以稳定地产出符合大众口味的梗图,但人类(无论是否借助AI)仍然能创作出最优秀的个体案例。

梗图创作与评估流程的示意图

此外,研究还发现,使用AI辅助的参与者能够产生更多的梗图创意,并且普遍认为创作过程更轻松,所需的精力更少。然而,这种生产力的提升并没有使人机协作生成的梗图在整体评分上超过纯人类创作的作品。研究人员总结道:“人机团队的高产出并不意味着更好的质量,只是意味着数量更多。”

值得注意的是,使用AI协助的参与者在创作过程中对作品的“归属感”略低于独立创作的参与者。由于归属感在本研究中影响了创造力的动机和满意度,研究人员建议那些希望使用AI辅助创作的人,需谨慎平衡AI的介入程度,以免削弱个人的创作满足感。

“在幽默感、创造力和可分享性指标上,由 AI、人类和人机协作生成的前四个梗图。”

AI如何做到“幽默”?

研究人员认为,AI模型之所以能够在幽默感上取得平均更高的表现,主要归功于它们经过训练吸收了大量互联网数据,并能识别出广受欢迎的幽默模式。而人类创作的梗图往往更加个人化,虽然偶尔能创作出特别搞笑的内容,但整体评分却偏低。

对于这一结果,有网友在Bluesky上评论称,研究中AI生成的梗图“并不怎么样”。对此,莫里克回应道:“一个教训是,许多人会觉得‘烂’梗图也很有趣。”他的观点引发了一个关键问题:AI的成功究竟是因为它在统计上擅长复刻常见的幽默模式,还是因为它能够迎合互联网文化中“最低共识”的笑点?

局限性及未来方向

研究团队指出,本研究存在一些局限性。例如,梗图创作时间较短,参与者未必充分利用AI进行协作。未来的研究可以探讨,若延长AI工具的使用时间,并优化AI提示词,是否能进一步提升人机协作的创作质量。

此外,本研究采用了众包评估方法,这可能导致对主流或常规幽默的偏向,进而使AI生成的梗图更受青睐。未来的研究可以引入专家评审团或针对特定文化群体的评估,以更准确地衡量幽默和创造力的不同维度。

研究团队建议,未来的研究方向之一是让AI迅速生成多个创意,而人类则充当策展人,从中筛选和优化最佳内容。尽管AI在平均水平上表现突出,但在人类创造力的顶端表现上,人类仍然占据优势,依然是最具幽默感的梗图创作者。

注:
Bluesky是
一个社交媒体平台
。 该平台的功能与X(前Twitter)非常相似,允许用户与朋友和陌生人进行互动。

图片来源/ 网络