全文 3,000字 | 阅读约13分钟

 AI 教父 Hinton:我每天用 GPT-4 做这三件事,却最怕它“装懂”骗我
打开网易新闻 查看更多视频
AI 教父 Hinton:我每天用 GPT-4 做这三件事,却最怕它“装懂”骗我

(CBS 独家专访Geoffrey Hinton片段)

2025 年 5 月 17 日 |CBS Saturday Morning

刚把 2024 年诺贝尔物理学奖奖章锁回抽屉,Geoffrey Hinton (杰弗里·辛顿)面对主持人 ,现场操作了 ChatGPT,并展示了他常见的一种使用方式:

  • 起草初稿:让 GPT-4 先写一版研究备忘;

  • 反向质询:要求 GPT-4 扮演“刁钻审稿人”,逐句挑错;

  • 数据补全:导入外部数据库与最新论文,补齐推理链与证据链。

“它几分钟能干我很多工作。”Hinton 摊开双手,“但我也最怕它哪天‘装懂’——把漏洞包成逻辑递进,还骗得我信以为真。”

短短一段演示中,Hinton 一口气指出 AI 使用中的三大核心风险:生成幻觉、推理黑箱、责任漂移——这恰恰印证了他“依赖中保持警惕”的工作方式。

本文将沿「3 招实战 → 3 大暗坑 → 安全阀清单」三段式展开,复盘 Hinton 的操作逻辑,提炼出一套适用于所有 AI 使用者的认知锚点,帮助你提速的同时,也不被“装懂式智能”带偏方向。

第一部分|我依赖 GPT-4,因为它“够用”

“我每天都在用 GPT-4。”

这是 Hinton 在采访中最先提到的一句话。没有科幻,没有危言耸听,只是一位研究者,平静地说出自己对一项工具的依赖。

这并不奇怪——GPT-4 足够强大,回答迅速,表达通顺,信息覆盖广。无论是写邮件、草拟论文摘要,还是和它探讨某个技术概念,它都能给出“像模像样”的回应。

而这类体验,其实不只属于 GPT 用户。无论你用的是 Claude、DeepSeek,还是豆包、Kimi、千问等等——只要它能听你说话、给你生成答案,底层使用逻辑是一致的:你抛出任务,它给出回应。

但 Hinton 接着说的,是另一句更重要的话:

我最怕它哪天‘装懂’骗我。

这不是在贬低 GPT,而是一种非常精准的提醒:它帮你完成任务没问题,但你别指望它判断对错、教你思考。

Hinton 用它,是因为他知道自己在问什么,也知道怎么判断回答有没有逻辑。

他把它当成一个“有用但不可托底的助手”,而不是一个有判断力的合作者,更不是一个可以学习人生哲学的老师。

他说:“助手可以加速,但不会纠正。老师才会告诉你哪错了。”

GPT-4 很强,但它不会说“我不确定”,不会标出自己的逻辑漏洞,也不会阻止你采纳一个看似正确、实则错误的答案。

这就是他的“依赖方式”:

用得越多,越清楚它靠不住。

而对很多普通用户来说,最容易踩坑的恰恰是——

你越觉得它说得流畅,就越容易误以为它说得正确。

Hinton 并没有否定这种依赖 AI ,而是坦白地示范了:“是的,我每天都用。但我清楚它不是智能,它只是一个生成器。”

他借此机会想提醒大家:

用,是为了效率;懂,是为了安全。 别把一个高效的语言工具,当成一个理解你的人。
第二部分|它装懂了,但我能看出来

——那不是“推理”,只是“像在推理”的表演

采访进行到一半,他们决定给 GPT 出一道“人类常见逻辑题”:

“Sally有三个兄弟,每个兄弟都有两个姐妹。 那Sally有几个姐妹?”

这类题目很常见,用来测试语言模型是否能处理简单的代数推理与主语关系。GPT 开始给出答案:

“Sally有两个姐妹。”

但这就是 Hinton 要指出的最大问题:

“它搞砸了。(It screws up)” “它没意识到Sally自己是其中之一。”

换句话说,它“答对了一半”。逻辑链条断在一个微小但关键的地方: GPT 并不理解“Sally自己也是那个群体的一部分”。

在我们看来,这只是一个小小的语义误差;但在 Hinton 看来,这代表着整套智能机制的“根本缺陷”:

它不是“推理”出来的答案,它只是“预测”你想听什么答案。

GPT 是怎么“装懂”的?

Hinton 没有用技术术语来讲解,而是打了个比喻:

“这就像一辆生锈的车,上面刷了一层厚漆。”

它的语句光鲜、逻辑顺滑、听起来什么都懂。 但实际上底层结构有很多漏洞,尤其在逻辑链条、常识判断、概念归纳这些领域:

  • 它不理解角色之间的 关系结构;

  • 它无法意识到“某个词可能指代自己”;

  • 它对结果过于自信,但缺乏“怀疑自己”的能力。

Hinton 补了一句意味深长的总结:

“它在各个领域都懂一点,但都不精通。 但是,不过最终它会在所有领域都变得非常专业。”

目前它看起来无所不知,其实只是善于“给出答案”。

但答案 ≠ 理解,

正如写一篇顺畅的文章 ≠ 明白文章的结构逻辑一样。

那我们该担心什么?

Hinton 的担忧不在于 GPT 错,而在于:

它错得太像对了。

对普通用户来说,越像人说的,越容易信以为真。尤其在 GPT 表达力越来越像人的当下,“装懂”反而比“不会”更危险:

  • 它不再暴露无知,而是在模仿有知;

  • 它不再只是生成,而是引导判断;

  • 你以为它推理了,其实它只是顺着语气说下去。

Hinton 没有反对用 GPT,他只是建议我们:

GPT 不知道它在说什么,问题在于你以为它知道。

第三部分|不能急停它,但你要装一个刹车

——GPT 不会说“我错了”,那就必须是你来踩刹车

Hinton 没有提出“停下使用 ”这种绝对论调。相反,他自己每天都在用 GPT-4,只不过,他的使用方式,和大多数人不一样:

把它当助手没问题,但你不能把它当老师。

这句话背后,是一个更深层的警告:GPT 没有“纠错机制”。它不会告诉你这句话可能不完整、这道题我没理解、这段逻辑我可能有问题。它不怀疑自己,也不会否定自己。

GPT 会继续生成,直到你信了为止。

三大风险|Hinton 警示的“幻觉—黑箱—责任”陷阱

在这场看似轻松的访谈里,Hinton 实际上抛出了三个深藏的系统风险:

1、幻觉生成

GPT 的最大问题不在于它错了,而在于它错得像对的。

它回答得流畅自然、逻辑通顺,但其中可能混入了编造的事实、拼凑的逻辑,甚至连它自己也无法分辨。

更关键的是,它不会提醒你“我不确定”——你只看到一个完整答案,很容易误以为它“理解了”,从而直接相信。

2、推理黑箱

GPT 看起来能回答所有问题,但它自己也说不清“为什么这么回答”。

它没有推理链,也没有透明的中间过程。我们无法看到它是如何选取信息、形成逻辑、得出结论的。

甚至连模型开发者,也很难解释它在某次对话中为什么选择某个词、某个句式,或者为什么会跳过某个逻辑环节。

3、责任悬空

当 AI 生成内容出了错,责任会漂向哪里?

你用它草拟报告、分析市场、辅助决策——看起来只是提速,但一旦结果出了问题,是你错了,还是模型错了?GPT 不会承担后果,但你可能要为它的失误买单。

这些问题,GPT 不会回答。但你可以提前设下一道“人工安全阀”。

安全阀使用建议(个人+组织)

给使用者的“刹车清单”:不是停用,而是明知不可全信

1、对个人:

AI 输出结果后,永远先问自己两个问题:

  • 它是否跳过了必要的逻辑链条?

  • 这个结论有没有“太顺了”?是不是你想听的?

2、对组织:

  • 不让 AI 直接影响结果,只允许影响过程。

  • 所有 AI 输出必须有“人类最后一审”:不是 AI 把关你,而是你最后把关 AI。

  • 在重要系统(教育、医疗、法律)中,不允许“默认相信 AI”。

不是技术该慢下来,而是你得先踩住刹车

Hinton 从没要求停下大模型,也没反对用 AI。他唯一做的,是把风险摆在你面前——

你当然可以提速,但请记得先“装刹车”。

结语|你以为它懂你,其实只是说得像懂而已

这不是 Geoffrey Hinton 第一次发出警告,但却是他第一次用这么生活化的方式,把“大模型”的问题讲得这么直白。

没有术语,没有宏大叙事,也没有对 AGI 的末日预言。

他只是拿出电脑,打开 ChatGPT,说了两句话:

“我每天都用 GPT-4。” “可我最怕它哪天‘装懂’骗我。”

就像他说的:它已经通过了图灵测试,但它不会告诉你哪错了,不会提醒你“这只是个预测”,不会帮你纠正逻辑跳跃。

你不小心把它当成“懂的人”,它就照着你的误解一路走下去。

所以真正危险的不是 AI 说错了什么, 而是你——没有意识到它其实不懂。

Hinton 这场专访留下的是一句提醒,也是一个提问:

“你得知道你在跟谁说话吗?”

他已经在用,但用得克制。

他已经怀疑,但没有拒绝。

这也许就是我们该有的 AI 使用态度:不是拒绝它,而是引导它。

本文由AI深度研究院出品,内容整理自CBS Saturday Morning人物专访系统。

星标公众号, 点这里 1. 点击右上角 2. 点击"设为星标" ← AI深度研究员 ⋮ ← 设为星标

参考资料:https://www.youtube.com/watch?v=ruGyp7N4f10&t=6s&ab_channel=CBSMornings

来源:官方媒体/网络新闻

排版:Atlas

编辑:深思

主编: 图灵