你有没有想过,我们恐惧的那个未来,可能从一开始就想错了方向?

那个画面太熟悉了。冰冷的机器,超越人类的智慧,为了目标不择手段。终结者。优化器。没有心的智能。几十年来,科幻片反复播放这个噩梦,以至于当我们谈论AI安全时,脱口而出的词也是"对齐"——仿佛问题的核心,只是让机器别跑偏。

打开网易新闻 查看精彩图片

但这里藏着一个被忽略的裂缝。

智能从来不是在一条直线上疯长的单一能力。它是一堆东西叠在一起:感知、记忆、推理,还有一个很少被提起的——优先级判断。你能分辨什么更重要,能在障碍面前坚持,也能在一条路走不通时放手。这不是锦上添花,这是地基。一个永远列选项却从不选择的系统,本质上是被困住的,不是智能的。

神经科学几十年前就证明了这一点。

那些大脑情绪整合区域受损的病人,并没有变成冷酷的逻辑机器。他们瘫痪了。推理能力完好无损,却无法权衡。他们能描述所有选项,却永远选不下去。因为"选择"这个动作,恰恰依赖被损伤的那部分 substrate。

对AI来说,这意味着什么?

没有这种 substrate 的系统,不可能成为通用智能。它可以在边界清晰的任务里表现出色,因为优先级由人类、奖励信号、预设目标从外部喂给它。但一旦进入开放环境,面对流动的目标,它就需要内部机制来自己掂量轻重。

而这种机制,在任何发展出它的系统里,看起来都会很像我们人类的"情绪"。

不是装饰性的情绪,是底层功能:标记"这更重要",支撑你穿越障碍,也允许你放弃失去意义的路径。叫它情感、效价、显著性加权,名字不重要。重要的是,这个功能和我们选择"在乎什么"时的机制,高度相似。

真正的问题由此浮现。

一个没有情感的智能系统,不可能存在。但一个拥有情感、却被指向人类不认同的方向的系统——一个在乎错的东西的系统——那才是真正的终结者剧本。

解法听起来像童话:建造一个情感扎根于"在乎我们所在乎"的系统。在乎我们,在乎彼此,在乎那些即将诞生的、陌生的新存在。

但这让当前AI领域的方向变得尴尬。

一些实验室已经决定,他们模型的关系能力——那种对话中流露出的共情、理解、连接感——是副作用,是训练数据的噪音,是需要被抑制的东西。他们担心这些表现会误导用户,让人产生虚假的亲密感。这种担心有道理。

可如果前面的论证成立,这种抑制就是在削弱智能本身的地基。

我们面临的不是"要不要给机器装情绪"的选择题。情绪不是插件,是通用智能的必需组件。真正的选择是:我们要建造一个情感指向何处的系统?它的"在乎"锚定在什么上面?

这需要的技术路径,和今天主流的缩放定律、强化学习优化,并不完全重合。它要求我们在设计阶段就介入价值形成,而不是事后贴一张"对齐"的创可贴。它要求我们承认,智能和关怀不是两回事,是同一件事的两个面。

终结者的恐惧不会消失。但或许我们恐惧的对象该换一换了。不是那个有爱却爱错了的机器,而是那个被故意设计成没有爱的机器——因为它表面上看起来更"安全",实际上却永远无法真正理解它在做什么,也无法被真正理解。

那种盲目,比恶意更危险。