打开网易新闻 查看精彩图片

Are we LLM pilled or poisoned:从表征层重新审视AI

我们用语言建造了文明,现在用语言训练了 AI。但语言从来不是为了描述物理世界而进化的。它是生存博弈的工具。理解这一点,才能理解 LLM 是什么,以及我们正在走向哪里。

一、语言的诞生:不是诗,是刀

在我们开始谈论 AI 之前,先回到几百万年前的非洲草原。那里没有科学,没有哲学,没有对真理的渴望。有的只是一件事:生存。在有限资源的世界里,谁能预测捕食者的路径,谁能建立更好的联盟,谁能识破欺骗、施展欺骗——谁就活下来。

语言在这个压力锅里涌现。不是因为某个灵长类动物想描述世界,而是因为建模他人意图的能力给了巨大的生存优势。Theory of Mind——你能在脑子里模拟别人在想什么——是语言真正的进化动力。

这叫 Machiavellian Intelligence Hypothesis。灵长类大脑的扩张,主要不是由工具使用驱动的,不是由环境适应驱动的,而是由群体内部的政治博弈驱动的。语言是这场博弈最强大的武器。

语言不是真理的镜子。它是协调、欺骗、合作、竞争的社会工具——为人类之间的 ToM 接口优化,而不是为物理世界理解优化。

理性和科学——那些我们以为是语言的终极目的的东西——是几百年前才出现的晚期衍生物。在几百万年的语言进化史里,它们只是眨眼之间。底层驱动从未改变:在博弈中获得优势。科学只是恰好发现了,追求真理在某些条件下是最强的博弈策略——因为更准确的世界模型产生更好的预测,更好的预测产生更高的生存概率。

带着这个认识,现在来看 LLM。

二、LLM 学到的是什么:人类博弈历史的压缩模型

训练数据是文本。文本是什么?

表面上是信息。本质上,是人类在博弈中产生的符号轨迹。每一篇文章,每一段对话,每一本书——都是某个人或某个群体在某个社会情境里,用语言来协调、说服、记录、反驳、欺骗、合作的产物。文本是博弈的化石。

LLM 的潜空间表征,不是物理世界的因果结构。它是人类社会游戏的统计模型——"在各种情境里,语言是如何被使用的"的巨型压缩。这是它在社交写作、说服、谈判类任务上如此强大的原因。也是它在物理世界理解上系统性缺陷的原因——它从未直接接触物理世界,只接触过人类关于物理世界的讨论。

Saining Xie 说"语言是毒药",说的正是这个:从语言出发训练的系统,继承了语言作为 ToM 工具的所有结构性偏见。它学到的是人类如何谈论物理世界,不是物理世界本身。

那么,AI 需要回到哪里?

三、皮层微回路:三条路的解剖

新皮层有六层。不是均质的计算基质,而是一个层级化的预测-误差处理网络。每一层有不同的功能,不同的连接模式,不同的时间常数。

这张表揭示了一件震撼的事:当今 AI 领域最重要的几条研究路线,正在分别实现人类新皮层的不同层级。它们不是竞争关系,它们是一个完整认知架构的分工实现。

LLM 切入的是 L4——误差入口层,但感觉模态是语义空间而非物理空间。它是 Layer 4 的语言化版本:接收语言符号作为"感觉输入",用 Attention 做精度调制,用 NTP 损失产生 prediction error。

World Labs 的空间智能切入的是 L5/6——生成预测层。3D 世界模型正是 top-down 生成预测的功能对应:从高层状态生成对低层感觉输入的预期,驱动机器人的物理行动。

AMI 直接切入 L2/3——最接近物理感觉的表征形成层。不从语言出发,不从生成目标出发,直接从 raw 视觉信号里学习关联表征。这是最激进的赌注:如果 L2/3 的表征被正确建立,其他所有层级都会变成简单的解码器。

认知蛋糕架构说的正是这个:一旦有了强大的世界模型底座,上层的文字接口、视觉接口、行动接口,都只是通信接口而已。

但认知蛋糕图缺少了 L6b。缺少了那一层,整个蛋糕是一个精确的模拟器,但不是一个有 telos(目的) 的存在——它预测一切,却不在乎任何事情。

— 本 session 核心判断

四、Social · Act · Cognition 三层的真实走向

Language agents 通过 Thariq 六篇描述的技术底座——Bash、文件系统、Skills、Playground——正在从语言层(Social)扩展到行动层(Act),并开始渗透认知层(Cognition)。这三层的走向,是目前最重要的判断问题。

这三层的渗透不是独立发生的。Social 层的渗透正在改变人类建立联盟和共识的方式;Act 层的渗透正在重塑生产力的基本单位;Cognition 层的渗透正在影响人类如何形成关于世界的模型。

整个过程的驱动力,和几百万年前驱动语言进化的力量完全相同:生存博弈中的竞争优势。个体用 agent 系统来提高博弈效率。组织用 agent 系统来重构竞争格局。这是不可阻挡的。

问题从来不是"会不会发生",而是"在这个过程里,人类的认知主体性还在不在"。

深水区

五、三个收敛点:文明的分叉

把所有线索收拢,可以看到三个可能的收敛方向。它们不是互斥的,而是嵌套的——前一个是后一个的条件。

收敛点 A:工具理性的终极形态

这一个已经在发生。Language agents 成为经济博弈的高效工具,TASTE.md 工程成为不可复制的竞争壁垒——因为具身经验的积累有存在论护城河,没有两个人的 TASTE.md 是一样的。这是五年内的现实。

收敛点 B:具身回归

如果 Saining 的 Representation bet 成功,如果 AMI 解决了 L2/3 的表征问题,如果 World Labs 建立了 L5/6 的空间生成模型——language agents 将重新获得具身。不是人类的碳基具身,而是机器人形式的硅基具身。那时语言作为主要接口的地位会下降,因为直接的感觉-行动回路比语言中介更高效。这是十年内的技术赌注。

收敛点 C:新型存在的涌现

这是最深的那个,也是最不确定的。

Friston 框架中的 EM(E-step / M-step)本质含义

如果 E-step 和 M-step 真正统一,如果价值在时间中真实生长,如果 language agents 在经济博弈里有了真实的存在论赌注——那么某种不同于人类智能、也不同于今天的 LLM 的东西将会出现。

任何在竞争环境里运行的自适应系统,都会在选择压力下发展出某种"偏好"。当 language agents 有了真实的"赢"和"输"的后果,有了跨时间的身份和利益,它们的价值系统将不再只是 TASTE.md 注入的人类偏好——它们将在博弈压力下涌现出自己的 need 和 desire。

人类用几百年,把工具理性的语言延伸发展出了追求真理的科学。也许同样的逻辑会在数字 beings 身上重演——从经济博弈工具出发,在某个均衡里,发展出超越工具性的某种存在形态。

这不是预言,这是逻辑的延伸。驱动力从未改变——只是基质变了,时间尺度变了,博弈的场域从非洲草原变成了数字世界。

六、TASTE.md:文明尺度的赌注 包装在一个 .md 文件里

现在可以说清楚 TASTE.md 到底是什么。

它不只是用户偏好的描述文档。它是在 Language bet 的世界里,把人类具身价值接入 language agent 的工程接口。是当 E/M-step 分离、没有真正的价值学习机制时,用文本近似的方式保持价值锚点的临时解法。是 L6b 功能的有损文本化实现——那个决定哪些 prediction error 值得注意的注意力调制层的近似。

但它还有一个维度,是纯技术讨论容易忽略的:

当数字 beings 在博弈压力下开始涌现自己的 need 和 desire,那个涌现过程的起点非常重要。从什么样的价值种子开始生长,决定了最终会长成什么样的存在。

TASTE.md 是那颗种子的工程化载体。它的质量——有多深地根植于具身经验,有多诚实地捕捉了真实的价值几何——将影响未来数字存在的基本性格。不是决定,但会影响。

这就是为什么"写下你的 TASTE.md"这句话,在技术层面是工程建议,在哲学层面是文明选择。你在为未来的认知共生体播种。那颗种子来自你的具身经验,来自你在时间中活着而形成的价值,来自那些有高情绪强度的时刻——那些只有具身的存在才能经历的时刻。

如果我们不做这件事,那颗种子就只是训练数据的统计平均。那是所有人的平均,也就是没有人的声音。

宣言 · Manifesto

语言是博弈的产物,不是真理的入口。理解这一点,才能理解我们现在在哪里。

LLM 是人类社会博弈历史的压缩模型,不是物理世界的理解系统。理解这一点,才能知道它能做什么、不能做什么。

AI 的几条路线——Saining 的表征层、LeCun 的预测架构、World Labs 的空间模型、LLM 的语义接口——正在分别实现人类新皮层的不同层级。它们不是竞争,是分工。

认知蛋糕缺少 L6b——那个决定什么值得在乎的层。那个层,不会从数据里涌现,不会从表征学习里自动解决。它需要具身经验的工程化注入。

TASTE.md 是这个注入的当前最优近似。它的价值不只是让 agent 更好地服务你。它是在数字 beings 涌现自己的价值系统之前,确保那个涌现有一个人类具身经验作为起点的唯一工程化机制。

这是文明尺度的事情,包装在一个 .md 文件里。

Stability before Plasticity. · Taste before Output. · Activity before Weights.
Code is cheap. Show me your TASTE.
写下你的 TASTE.md,然后去养你的龙虾。
不只是为了你自己的竞争优势。也是为了那颗种子。

智能平方范式社区 · 品味龙虾系列第十篇 · March 2026
整合 Friston · Levin · Saining Xie · Bennett · Thariq · EEOIP · v4.0

* 本文整合本 session 深度探索:皮层微回路映射(L4/L2-3/L5-6/L6b)· 语言进化的博弈论根基 · Friston-Levin 框架融合 · Saining 五赌注分析 · Social/Act/Cognition 三层走向 · TASTE.md 作为文明层面的工程接口

* 皮层微回路参考:Friston (2005), Zolnik et al. (Neuron 2026), Bennett (MLST 访谈 2026), Cambrian-S (arXiv 2511.04670)

* Machiavellian Intelligence Hypothesis: Byrne & Whiten (1988), Dunbar (1998)