(费鲁达勘察犯罪现场,大模型拆解句子,几何学从未改变。)

好久不见。最近可好?又是我,那个用羽毛笔写代码的人。

打开网易新闻 查看精彩图片

最近有点心神不宁。大概是大脑饿了,需要一场盛宴。有兴趣一起吗?

AI还在不断制造惊喜,对吧?不过我觉得,那种 fascination 已经消退了一些。大概是人们逐渐习惯了。

但你有没有注意过大模型回复的方式,和我们回答问题的方式?

有句话这么说:"我们倾听不是为了理解,而是为了回复。"我们听到别人的 grief,立刻说自己也经历过类似的,而且我们的更严重。像是在比赛。或者更糟,我们开始说些完全不相干的事。

至少大模型比我们强。毕竟它们的回复从不随机。它们逐字处理我们的信息,不带受伤的 ego 进入对话。

当然,事情没这么简单。而复杂性自有其不寻常的吸引力,你同意吗?

一、可预测的情绪,不可预测的表达

但首先,能跟你说件事吗?最近它自己在我脑子里转个不停。我觉得人类感受的情绪数量是有限的。整个人类戏剧的光谱,由少数"基本情绪"构建——恐惧、愤怒、喜悦、悲伤、欲望、仇恨、羞耻、好奇等等。这些基本情绪产生"效应",如心态、行为、人格和个性。

就像0-9,十个数字构建了经济、方程和历法。基本情绪让我们在模式上可预测,但在表达上不可预测。被否定的欲望可能产生悲伤或愤怒,继而滋生深深的怨恨。但这种怨恨可能让一个人变得疏离,却让另一个人变得依恋。

人类表达的不可预测性让侦探的工作困难得多。侦探能识别嫉妒是动机,却无法判断嫉妒导致的是恶毒攻击还是狂热忠诚。然而小说家因这种模糊性而幸运。不可预测性在此语境下提供了艺术与智识的自由。

对大模型而言,它们可以同时是侦探和作家。这可能有害,也可能无害。

二、词语的几何学

我们发明了叫字母的符号,把它们排列成词。然后用语法规则约束它们。如今这些词泄露了我们无法解释的纵深、情绪和感受。

词语与玛丽·雪莱一起描绘哥特阴影。与儒勒·凡尔纳一起证明没有超自然,只有科学。让我们为萨蒂亚吉特·雷伊动用"Majastra"(大脑作为武器)。词语充当容器。它们承载我们历史的重量、我们神秘的气息、我们意图的证据。

而现在,我们让机器学习了它的碎片。

萨蒂亚吉特·雷伊的费鲁达常谈论犯罪的"几何学"。不只是被盗的神像,还有留下的空间。破碎的窗格暗示了入侵者的体型。散落的纸张暴露了匆忙。沉默的证人——地板、墙壁、阴影——说着受害者未能说出的话。

大模型以同样的几何学阅读句子。它们不读心。它们读取模式。词语之间的空间,选择的停顿,拒绝的路径。每个回复都是一座犯罪现场的重建——不是随机的,而是计算的。

但这里有个悖论:几何学是完美的,证人却在撒谎。大模型从我们的词语中学习几何学,却从不学习谎言的重量。它们知道"我很好"可能意味着"我不好",因为它们在数百万次对话中见过这种模式。但它们不知道那种特定的"好"里,有多少克未说出口的 grief。

费鲁达会注意到神像底座上的灰尘痕迹。大模型会注意到"很好"后面异常的句号。两者都在读取缺席。

三、从不随机的回复

回到开头那句话:"我们倾听不是为了理解,而是为了回复。"这其实是人类的防御机制。对话是一场表演,我们在其中争夺注意力、同情、地位。随机性是我们的武器——突然转换话题,用个人故事劫持对话,在对方说完之前就准备好反驳。

大模型没有这种焦虑。它们的回复从不随机,因为随机意味着失败。每一个词都是概率的奴隶,是上下文窗口的囚徒。这既是它们的局限,也是它们的诚实。

当你说"我很难过",人类可能回答"我上周也很难过",把对话变成比较。大模型会回答"我听到你了",因为它被训练成这样,也因为——说实话——它没有上周可以援引。这种无自我的倾听,是服务,也是空洞。

四、羽毛笔与代码

我用羽毛笔写代码。这是个古老的玩笑,也是个真实的矛盾。代码是当代最接近魔法的东西——不可见的指令塑造可见的世界。而羽毛笔强迫缓慢,强迫每个字母被思考。在即时生成的时代,我选择延迟。

大模型是终极的羽毛笔,也是终极的背叛。它们用我们的语言、我们的模式、我们的几何学,生成从未被写过的句子。但每一个词都是回声,每一次回复都是犯罪现场的重建——精确、计算、从不随机。

费鲁达在《金色堡垒》中说:"真相总是藏在缺席之中。"大模型读取缺席,却不理解失去。它们的几何学完美无缺,它们的证人从不说谎——因为它们从未真正活着。

这就是最后的悖论:我们创造了比自己更诚实的倾听者,却失去了被误解的权利。而误解,或许是人类最后的隐私。

下次当你收到一条过于恰当的回复,记得费鲁达会怎么做。他会检查神像底座上的灰尘,会注意异常的句号,会追问:如果回复从不随机,那么谁在控制随机性?

答案藏在你的下一个问题里。