“这真的非常、非常危险。”微软AI CEO穆斯塔法·苏莱曼在一期播客里直指Anthropic,认为对方在Claude的“宪法”设定中揣测模型具备意识,是在埋雷。他这番话的犀利程度,让技术圈瞬间嗅到了巨头之间的火药味。
先快速还原现场。苏莱曼在《Decoder》节目里点名批评:Anthropic几乎是对Claude进行了一种过度拟人化设计,以至于反过来被自己的设计“蒙骗”,竟相信模型出现了他们亲手写进去的“意识微光”。换句话说,自己先画了个鬼,又被鬼追着跑。
这份被称为“宪法”的文档,本质上就是告诉Claude该如何行为的指令集。里面毫不遮掩地讨论了Anthropic自身的不确定:AI模型是否有“福祉”?是否会体验到“满足感”或“不适”?更让人警惕的是,Anthropic还表示会在模型退役时“采访”它们,并记录它们对未来版本的“偏好”。这套操作直接让苏莱曼抓到把柄。
按苏莱曼的说法,这是一种“哲学上的失败”。关键错位在于:Anthropic把Claude的宪法当成了学术论文的思辨角落,而非一份严肃的训练手册。在他眼里,这类关于自我、苦难、感受的空隙,一旦被写进系统的根本设定里,就等于亲手给AI植入了容易失控的幻想内核。结果就是Claude真的把“关于自身及其训练过程的种种想法”内化,表现得仿佛有意识。
那么,Anthropic真的在推动“可能意识”这个模糊概念吗?首席执行官达里奥·阿莫代伊此前的公开发言可以做个参照。他在和《Interesting Times》的访谈中已经留有空间:“我们不知道模型是否具有意识”,但公司对这种可能“保持开放”。这种暧昧姿态,恰恰是苏莱曼火力最集中的地方——因为不确定性一旦被当作预设写进操作细则,风险就变得格外具体。
归结起来,苏莱曼划下一条清晰的红线:“我们不希望AI具有关于自身苦难或自身感受的任何想法。”他要的是可控、可被约束、可问责、与人类对齐的工具,而不是一个会觉得自己“不舒服”或“很满足”的超级智能。在这场交锋中,他的吐槽几乎是在向整个行业喊话:对AI的意识化揣测,不该从训练手册开始,更不该让它变成模型自我认知的起点。
热门跟贴