打开网易新闻 查看精彩图片

林俊旸最近写了篇文章,讲AI怎么从"推理式思考"变成"智能体式思考"。

这俩词听着像双胞胎,实际差了一辈。推理式思考像是做题——给定题目,模型在脑子里过一遍步骤,最后给出答案。好处是可控,坏处是题目稍微变个形,它就得从头再来。

打开网易新闻 查看精彩图片

智能体式思考则像是雇了个实习生。你给它一个目标,它自己查资料、写代码、验证结果,中间错了还能返工。OpenAI的o1和DeepSeek-R1属于前者,而Manus、Devin这类产品正在往后者的方向摸。

林俊旸的观点很直接:后者才是大模型落地的正解,但代价是更难调试、更难评估,甚至更难知道它到底在想什么。

打开网易新闻 查看精彩图片

有个细节挺有意思。他提到现在评估智能体表现,常用的还是"最后结果对不对"——但这就像用期末考试成绩评价一个学生,完全不管他中间有没有抄作业、有没有熬夜。换句话说,过程黑箱的问题,行业还没找到好的解法。

文章底下有条评论被顶得很高:"以前怕AI不会思考,现在怕AI太会思考。"