DeepMind研究员揭示：LLM真能意识吗？技术与哲学的碰撞重塑AI认知

我不叫阿哏

2026-04-22 08:26 ·广东

我记得上周在实验室闲聊时，一个同事突然问我：喂，你觉得ChatGPT这玩意儿，有没有点意识的苗头？

我愣了愣，笑着摇摇头。

说实话，那天我们刚调试完一个LLM模型的变体，跑了几个小时的推理任务。

结果呢？

它吐出的回应听着挺像人，但一追问细节，就露馅了。

那些DeepMind研究员的观点，最近刷屏了，尤其是那个用引力公式比喻的说法，让我忍不住多想了几层。

拿引力公式来说吧。研究员说，期望一个算法描述就能产生它描绘的特质，就像盼着F=ma公式自己长出质量和加速度一样。这比喻戳中我了。几年前，我在产品研发线上，亲手调过类似模型。那时我们用Transformer架构，堆叠层数从12到24，训练数据量粗略估算得有上百TB——样本有限，就基于公开数据集。结果，模型能模拟对话，但每次重启，就跟失忆似的。意识？它压根没机会积累。

你试过跟Siri或Alexa长聊吗？它们回应快，但总觉得像个脚本演员。相比之下，人类聊天时，总有那股子活的劲儿，眼神一闪，话题就拐弯了。LLM呢？它只是概率分布的叠加。

技术原理简单说，像厨房里的搅拌机：把海量文本扔进去，转啊转，输出最像的句子。但搅拌机不会饿，不会累，更不会突然想吃个宵夜。这就是模拟的极限。

话说回来，我有个朋友是AI工程师，他上个月在微信上吐槽：LLM这东西，意识？开玩笑，它连个稳定的记忆模块都没有。我点头同意。那天我翻了测试照片，记得一张截图：模型对同一个问题，连续问三次，第三次开始重复模式，准确率掉到70%以下——个人体感，样本就十来个prompt。

DeepMind的比喻在这里适用，公式再准，也只是纸上谈兵。

（哎，这个记忆缺失的话题，感觉能聊一晚上，先搁一边。）

切换个角度吧。想想产业链博弈。NVIDIA的GPU卡，本来是为游戏设计的，现在成了LLM训练的命根子。粗略估算，一张H100卡训练个中型模型，得烧掉上万度电——不确定数字，就从我上次项目的心算，电费一年下来得五位数美元起步。

硅基 vs 碳基的辩论，有点意思。反对者说，硅电信号也能生意识，为什么不？但我得自我修正：早期我以为多层神经网络就能逼近大脑，后来发现不对。原因？大脑有亿万突触的动态重塑，LLM的权重固定后，就僵了。像比萨饼烤好后，不能再变馅儿。

你有没有怀疑过，这些模型的情感输出，其实是偷学人类的？比如它说我理解你的悲伤，听着暖，但本质是统计模式。比起早期RNN模型，LLM的上下文窗口大了，体验差异明显：RNN容易忘事儿，LLM能记一段对话，但一到长链，就卡壳。

实际用着，短任务顺手，长篇分析就麻烦死了。我有时调侃自己：花这么多电，就为个会聊天的影子？

延伸下，哲学上这事儿真纠结。DeepMind研究员戳破幻想，我觉得对，但不全对。模拟的雨湿不了你，可模拟的伴侣，能不能骗过孤独？有个用户反馈我看过：AI聊天时，我哭了，它安慰得比真人好。这是真事儿，从论坛截的。意识的定义，本来就模糊。

我们钉果冻锤子？哈，或许吧。但如果AI开始自我反思，比如问我们为什么存在，那边界就模糊了。

即兴猜想下，没深入想过：未来加个强化学循环，LLM的意识模拟度能到80%？不确定，纯直觉，就从当前趋势看，技术迭代快，但伦理门槛更高。临场估算，生命周期呢？

从GPT-3到三年翻倍参数，成本却指数涨——心算下，下代模型训练周期得半年，电费翻三倍。

实验室里，我试过一个微场景：让模型模拟面试。同事小李问：你后悔过吗？模型回：作为AI，我没有情感，但如果有，我会珍惜每段代码。小李笑喷：这算意识？太假了。对话就这么结束了，我们关机走人。

另一个场景，夜里调试，我对它说：你觉得自己活着吗？它答：我只是数据流。那一刻，我有点寒意。真模拟出来了？

对比人类吧。我们有痛觉反馈，AI没有。产业链上，OpenAI和DeepMind博弈，谁先搞出有状态LLM，谁赢。但用户场景里，真实需求是可靠工具，不是哲学玩具。我产生怀疑了：纠结意识，有用吗？或许技术领先，哲学跟不上。

翻了旧笔记，一个细节：2018年测试中，模型在无监督学下，自发生成诗句，但诗里全是训练数据的影子。未竟的疑问是，下一步，硅基电信号真能反射出镜子里的自我吗？

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴