AI 教父 Hinton：我每天用 GPT-4 做这三件事，却最怕它“装懂”骗我|ai教父|gpt-4|hinton|推理|黑箱

全文 3,000字 | 阅读约13分钟

（CBS 独家专访Geoffrey Hinton片段）

2025 年 5 月 17 日｜CBS Saturday Morning

刚把 2024 年诺贝尔物理学奖奖章锁回抽屉，Geoffrey Hinton （杰弗里·辛顿）面对主持人，现场操作了 ChatGPT，并展示了他常见的一种使用方式：

起草初稿：让 GPT-4 先写一版研究备忘；
反向质询：要求 GPT-4 扮演“刁钻审稿人”，逐句挑错；
数据补全：导入外部数据库与最新论文，补齐推理链与证据链。

“它几分钟能干我很多工作。”Hinton 摊开双手，“但我也最怕它哪天‘装懂’——把漏洞包成逻辑递进，还骗得我信以为真。”

短短一段演示中，Hinton 一口气指出 AI 使用中的三大核心风险：生成幻觉、推理黑箱、责任漂移——这恰恰印证了他“依赖中保持警惕”的工作方式。

本文将沿「3 招实战 → 3 大暗坑 → 安全阀清单」三段式展开，复盘 Hinton 的操作逻辑，提炼出一套适用于所有 AI 使用者的认知锚点，帮助你提速的同时，也不被“装懂式智能”带偏方向。

第一部分｜我依赖 GPT-4，因为它“够用”

“我每天都在用 GPT-4。”

这是 Hinton 在采访中最先提到的一句话。没有科幻，没有危言耸听，只是一位研究者，平静地说出自己对一项工具的依赖。

这并不奇怪——GPT-4 足够强大，回答迅速，表达通顺，信息覆盖广。无论是写邮件、草拟论文摘要，还是和它探讨某个技术概念，它都能给出“像模像样”的回应。

而这类体验，其实不只属于 GPT 用户。无论你用的是 Claude、DeepSeek，还是豆包、Kimi、千问等等——只要它能听你说话、给你生成答案，底层使用逻辑是一致的：你抛出任务，它给出回应。

但 Hinton 接着说的，是另一句更重要的话：

我最怕它哪天‘装懂’骗我。

这不是在贬低 GPT，而是一种非常精准的提醒：它帮你完成任务没问题，但你别指望它判断对错、教你思考。

Hinton 用它，是因为他知道自己在问什么，也知道怎么判断回答有没有逻辑。

他把它当成一个“有用但不可托底的助手”，而不是一个有判断力的合作者，更不是一个可以学习人生哲学的老师。

他说：“助手可以加速，但不会纠正。老师才会告诉你哪错了。”

GPT-4 很强，但它不会说“我不确定”，不会标出自己的逻辑漏洞，也不会阻止你采纳一个看似正确、实则错误的答案。

这就是他的“依赖方式”：

用得越多，越清楚它靠不住。

而对很多普通用户来说，最容易踩坑的恰恰是——

你越觉得它说得流畅，就越容易误以为它说得正确。

Hinton 并没有否定这种依赖 AI ，而是坦白地示范了：“是的，我每天都用。但我清楚它不是智能，它只是一个生成器。”

他借此机会想提醒大家：

用，是为了效率；懂，是为了安全。别把一个高效的语言工具，当成一个理解你的人。

第二部分｜它装懂了，但我能看出来

——那不是“推理”，只是“像在推理”的表演

采访进行到一半，他们决定给 GPT 出一道“人类常见逻辑题”：

“Sally有三个兄弟，每个兄弟都有两个姐妹。那Sally有几个姐妹？”

这类题目很常见，用来测试语言模型是否能处理简单的代数推理与主语关系。GPT 开始给出答案：

“Sally有两个姐妹。”

但这就是 Hinton 要指出的最大问题：

“它搞砸了。(It screws up)” “它没意识到Sally自己是其中之一。”

换句话说，它“答对了一半”。逻辑链条断在一个微小但关键的地方： GPT 并不理解“Sally自己也是那个群体的一部分”。

在我们看来，这只是一个小小的语义误差；但在 Hinton 看来，这代表着整套智能机制的“根本缺陷”：

它不是“推理”出来的答案，它只是“预测”你想听什么答案。

GPT 是怎么“装懂”的？

Hinton 没有用技术术语来讲解，而是打了个比喻：

“这就像一辆生锈的车，上面刷了一层厚漆。”

它的语句光鲜、逻辑顺滑、听起来什么都懂。但实际上底层结构有很多漏洞，尤其在逻辑链条、常识判断、概念归纳这些领域：

它不理解角色之间的关系结构；
它无法意识到“某个词可能指代自己”；
它对结果过于自信，但缺乏“怀疑自己”的能力。

Hinton 补了一句意味深长的总结：

“它在各个领域都懂一点，但都不精通。但是，不过最终它会在所有领域都变得非常专业。”

目前它看起来无所不知，其实只是善于“给出答案”。

但答案 ≠ 理解，

正如写一篇顺畅的文章 ≠ 明白文章的结构逻辑一样。

那我们该担心什么？

Hinton 的担忧不在于 GPT 错，而在于：

它错得太像对了。

对普通用户来说，越像人说的，越容易信以为真。尤其在 GPT 表达力越来越像人的当下，“装懂”反而比“不会”更危险：

它不再暴露无知，而是在模仿有知；
它不再只是生成，而是引导判断；
你以为它推理了，其实它只是顺着语气说下去。

Hinton 没有反对用 GPT，他只是建议我们：

GPT 不知道它在说什么，问题在于你以为它知道。

第三部分｜不能急停它，但你要装一个刹车

——GPT 不会说“我错了”，那就必须是你来踩刹车

Hinton 没有提出“停下使用 ”这种绝对论调。相反，他自己每天都在用 GPT-4，只不过，他的使用方式，和大多数人不一样：

把它当助手没问题，但你不能把它当老师。

这句话背后，是一个更深层的警告：GPT 没有“纠错机制”。它不会告诉你这句话可能不完整、这道题我没理解、这段逻辑我可能有问题。它不怀疑自己，也不会否定自己。

GPT 会继续生成，直到你信了为止。

三大风险｜Hinton 警示的“幻觉—黑箱—责任”陷阱

在这场看似轻松的访谈里，Hinton 实际上抛出了三个深藏的系统风险：

1、幻觉生成

GPT 的最大问题不在于它错了，而在于它错得像对的。

它回答得流畅自然、逻辑通顺，但其中可能混入了编造的事实、拼凑的逻辑，甚至连它自己也无法分辨。

更关键的是，它不会提醒你“我不确定”——你只看到一个完整答案，很容易误以为它“理解了”，从而直接相信。

2、推理黑箱

GPT 看起来能回答所有问题，但它自己也说不清“为什么这么回答”。

它没有推理链，也没有透明的中间过程。我们无法看到它是如何选取信息、形成逻辑、得出结论的。

甚至连模型开发者，也很难解释它在某次对话中为什么选择某个词、某个句式，或者为什么会跳过某个逻辑环节。

3、责任悬空

当 AI 生成内容出了错，责任会漂向哪里？

你用它草拟报告、分析市场、辅助决策——看起来只是提速，但一旦结果出了问题，是你错了，还是模型错了？GPT 不会承担后果，但你可能要为它的失误买单。

这些问题，GPT 不会回答。但你可以提前设下一道“人工安全阀”。

安全阀使用建议（个人+组织）

给使用者的“刹车清单”：不是停用，而是明知不可全信

1、对个人：

AI 输出结果后，永远先问自己两个问题：

它是否跳过了必要的逻辑链条？
这个结论有没有“太顺了”？是不是你想听的？

2、对组织：

不让 AI 直接影响结果，只允许影响过程。
所有 AI 输出必须有“人类最后一审”：不是 AI 把关你，而是你最后把关 AI。
在重要系统（教育、医疗、法律）中，不允许“默认相信 AI”。

不是技术该慢下来，而是你得先踩住刹车

Hinton 从没要求停下大模型，也没反对用 AI。他唯一做的，是把风险摆在你面前——

你当然可以提速，但请记得先“装刹车”。

结语｜你以为它懂你，其实只是说得像懂而已

这不是 Geoffrey Hinton 第一次发出警告，但却是他第一次用这么生活化的方式，把“大模型”的问题讲得这么直白。

没有术语，没有宏大叙事，也没有对 AGI 的末日预言。

他只是拿出电脑，打开 ChatGPT，说了两句话：

“我每天都用 GPT-4。” “可我最怕它哪天‘装懂’骗我。”

就像他说的：它已经通过了图灵测试，但它不会告诉你哪错了，不会提醒你“这只是个预测”，不会帮你纠正逻辑跳跃。

你不小心把它当成“懂的人”，它就照着你的误解一路走下去。

所以真正危险的不是 AI 说错了什么，而是你——没有意识到它其实不懂。

Hinton 这场专访留下的是一句提醒，也是一个提问：

“你得知道你在跟谁说话吗？”

他已经在用，但用得克制。

他已经怀疑，但没有拒绝。

这也许就是我们该有的 AI 使用态度：不是拒绝它，而是引导它。

本文由AI深度研究院出品，内容整理自CBS Saturday Morning人物专访系统。

星标公众号，点这里 1. 点击右上角 2. 点击"设为星标" ← AI深度研究员 ⋮ ← 设为星标

参考资料：https://www.youtube.com/watch?v=ruGyp7N4f10&t=6s&ab_channel=CBSMornings

来源：官方媒体/网络新闻

排版：Atlas

编辑：深思

主编: 图灵

AI 教父 Hinton：我每天用 GPT-4 做这三件事，却最怕它“装懂”骗我

热搜

热门跟贴

热搜

热门跟贴

相关推荐

中国“避暑神器”在欧洲卖爆了

「机器学习之父」Jordan：Hinton等思想领袖们正在伤害年轻一代

“推理”定罪

麦肯锡最新报告：未来5年最有价值的5种人

鲁比奥称"美俄在阿拉斯加未达成任何共识" 俄方反驳

伊朗实战已验证效果，美军放开AI权限，自主战争时代加速到来

小组第三排名跌至第8位 韩国队已命悬一线

名记：伦纳德已表明他不愿意与活塞签下续约合同

山姆，又出事了！“蠕动的虫子！”

山姆确认，尚未调价！全国多地门店iPad及Mac遭疯抢，网友：比618还是贵了

卢卡申科“突然”飞抵俄罗斯

我国核聚变堆超导磁体研发取得重要突破

强化体能、打磨技术，中国女篮将迎实战检验

“一天一个价”！有网友晒单：去年不到7千，今年1.2万了

社会派推理第一神作！好看到鸡皮疙瘩掉一地！

昔日汽车经销巨头全面转型“包租公”：现有500多家自有店面仅30家在营，以售后为主

数字推理，3，5，11，21，43，（ ）

Siegel：湖人不会在自由球员市场上不惜一切代价留住詹姆斯

卖掉公司，50位员工实现财富自由

最新：河南省内外高校在豫招生预估分数线汇总

小组第三排名跌至第8位韩国队已命悬一线

数字推理，3，5，11，21，43，（）