说AI模仿名人比真人更可信？这项研究让112位公众人物栽了跟头|人物|传记|作家|名人|英国

“我们讨论的可不是什么无名之辈，这是全英国最火的节目之一。”德国帕绍大学数据科学教授、AI工程系主任斯特芬·赫伯德在通话中显得很惊讶。让他意外的是一群普通人面对AI生成的政客发言时，竟一致觉得那玩意儿比真人现场的回答更靠谱、更连贯、更切题。

事情要从周三发表在《PLOS One》上的一项研究说起。研究者拉上GPT-4 Turbo，让它在2024年英国大选前夕模仿112位公众人物。训练素材取自BBC一台长寿节目《提问时间》，每集都是观众当面拷问各路名人，于是攒出了一个包含政客、商人、记者、医学专家、作家等“英国社会知名人士”的发言数据集。再用维基百科传记筛一轮，确认这些人确实算公众人物，AI就被指派用这些身份回答《提问时间》里观众的问题。

真正刺激的环节在后面：研究团队找来948名有代表性的英国参与者，把真人上节目时的原话和大语言模型生成的内容混在一起，让大家盲评。“结果明摆着，LLM生成的冒充内容被认为比实际的辩论回答更真实、更连贯、更切题，”研究报告写道，这直接点出一个后果——“它能在政治领域误导公众。”

赫伯德原本以为真实性这一项AI会吃亏，毕竟“真实性按理说是最难伪造的”。结果得分之高让他直呼意外。但他也承认实验设置“有点不公平”：真人政客在镜头前即兴发言，容易磕巴、不修边幅；而LLM是从现成文本里往外掏话，天生就有条理。这项模仿实验的兴趣来源，是2023年OpenAI、Google、Anthropic等公司推出的AI模型开始表现出与人类难辨真假的复杂应答能力。

研究警告说，公众迫切需要意识到这类技术可能给社会带来的伤害。当AI冒充名人发言比真人更像本人时，选举被操纵、诈骗得逞、错误信息泛滥就都不再只是纸面上的设想，而已有实验数据撑腰。