“我们讨论的可不是什么无名之辈,这是全英国最火的节目之一。”德国帕绍大学数据科学教授、AI工程系主任斯特芬·赫伯德在通话中显得很惊讶。让他意外的是一群普通人面对AI生成的政客发言时,竟一致觉得那玩意儿比真人现场的回答更靠谱、更连贯、更切题。
事情要从周三发表在《PLOS One》上的一项研究说起。研究者拉上GPT-4 Turbo,让它在2024年英国大选前夕模仿112位公众人物。训练素材取自BBC一台长寿节目《提问时间》,每集都是观众当面拷问各路名人,于是攒出了一个包含政客、商人、记者、医学专家、作家等“英国社会知名人士”的发言数据集。再用维基百科传记筛一轮,确认这些人确实算公众人物,AI就被指派用这些身份回答《提问时间》里观众的问题。
打开网易新闻 查看精彩图片
真正刺激的环节在后面:研究团队找来948名有代表性的英国参与者,把真人上节目时的原话和大语言模型生成的内容混在一起,让大家盲评。“结果明摆着,LLM生成的冒充内容被认为比实际的辩论回答更真实、更连贯、更切题,”研究报告写道,这直接点出一个后果——“它能在政治领域误导公众。”
赫伯德原本以为真实性这一项AI会吃亏,毕竟“真实性按理说是最难伪造的”。结果得分之高让他直呼意外。但他也承认实验设置“有点不公平”:真人政客在镜头前即兴发言,容易磕巴、不修边幅;而LLM是从现成文本里往外掏话,天生就有条理。这项模仿实验的兴趣来源,是2023年OpenAI、Google、Anthropic等公司推出的AI模型开始表现出与人类难辨真假的复杂应答能力。
研究警告说,公众迫切需要意识到这类技术可能给社会带来的伤害。当AI冒充名人发言比真人更像本人时,选举被操纵、诈骗得逞、错误信息泛滥就都不再只是纸面上的设想,而已有实验数据撑腰。
热门跟贴