一家公司一边全力把AI塞进办公套件,一边却由首席科学家亲口承认,人类对AI的理解正在快速缩水。这听起来矛盾,但微软首席科学官埃里克·霍维茨(Eric Horvitz)与洛桑联邦理工学院(EPFL)研究员罗伯特·韦斯特(Robert West)的联合作品,的确发出了这样一个刺耳的提醒:我们可能正在滑过一个“理解AI的窄窗期”,一旦错过就会太迟。

他们的论点并非危言耸听,而是直指一个令人困惑的现实——AI正在变得越来越擅长理解人类,而人类对AI的理解却丝毫没有跟上。AI系统如今能够建模人类的恐惧、不确定性和归属需求,这已经不是科幻情节;但反过来,研究人员承认,我们甚至很难说清楚大模型内部某个决策链路是如何形成的。

打开网易新闻 查看精彩图片

霍维茨和韦斯特担心的并不是大家要去逐行审查代码或死记硬背每一组参数。他们强调,只要维持足够的洞察力去进行有意义的监督,哪怕只是部分理解,也具备真正的价值,尤其是在风险还没彻底嵌入系统、尚可修正的时候。而问题恰恰在于,现在要保持这种最低限度的监督,难度都在飙升。

一个关键的加速器是:AI工具正被大量用来设计并改良其他AI系统。这种递归开发循环一旦成为常态,性能可能继续爬升,但人类对底层过程的洞见却会越变越稀薄。霍维茨和韦斯特在文章里直白地写道:“AI系统现在是通过递归循环由AI系统设计并精炼的,这种循环能够超越人类的理解,并在抵制直觉的高维空间中展开。”这就不是某个孤立的黑箱,而是黑箱在生产黑箱。

他们把这种现象命名为“操作不透明”——结果依然可见,但产生结果的机制越来越解释不清。以往我们还能说“模型输出了这个是因为某个注意力头聚焦了那张表格”,可当好几个AI系统接力生成、修剪、重新训练时,因果链就碎裂成人类无法追踪的形态。霍维茨和韦斯特因此建议,凡是参与自身开发的AI系统,就应该被强制加入解释模块,让人类有机会检视它所生成的解释和支持信息。

让局面更复杂的,是不同AI智能体之间正在急剧增加的交互。当多个AI代理在互联环境中以越来越高的复杂度对话时,它们之间的通信模式可能逐渐漂离人类熟悉的语言和推理习惯。一条原来可以翻译成“请求向量检索-结果评分-阈值过滤”的机器间交流,某天也许会演化成一套只有它们自己理解的信号序列。

这种漂移一旦出现在大规模网络中,外部观察者想要弄清楚某个决策究竟怎么冒出来的,就会变得异常艰难。霍维茨和韦斯特把这类现象称作“交互不透明”——AI系统内部的行为虽然连贯,但在人类眼里却越来越像一片无从解读的浓雾。这也解释了为什么他们呼吁研究者要贴近这些生态系统去观察,并鼓励那些能够让人类保持可理解性的通信方式。

整篇文章的出发点并不是要阻碍AI进步,而是试图划出一条底线:如果理解窗口真的关闭,监督将沦为形式,纠错会变成碰运气。毕竟,当一个系统既能模仿你的犹豫,又能预判你的归属焦虑,你却看不懂它为什么给这个患者推荐了那个治疗方案时,信任的根基就已经动摇了。