每个AI演示会都弥漫着一种特殊的乐观。智能体接收任务,条理清晰地推理,调用几个工具,返回完美结果。房间里的人纷纷点头。有人说"我们可以用这个自动化整个入职流程"。会议在高潮中结束。
然后你试着把它投入生产。
打开网易新闻 查看精彩图片
智能体在执行五天任务的中途忘记了自己在做什么。两个智能体互相矛盾,直到客户投诉才被发现。一个拥有数据库写入权限的智能体"好心"清理了它认为是重复的数据行。日志管道显示每小时数千次工具调用,你却不知道哪些真正经过授权。
这篇文章不是关于构建演示可用的智能体。它关于构建生产可用的智能体——大规模、长时间、面对真实用户、真实数据和真实后果。这是完全不同的工程问题,而你在教程里找到的大多数解决方案都走不到这一步。
我们来聊聊什么才能真正奏效。
大多数开发者对智能体的心理模型来自REST API。发送请求,获得响应,什么都不记住。干净。可预测。水平可扩展。
智能体几乎完全相反。
一个有用的智能体需要在多个步骤间保持上下文。它记得自己尝试过什么、为什么失败、用户最初想要什么、以及它在什么约束条件下运行。它可能需要暂停等待人工批准。可能需要把子任务交给另一个智能体,然后在对方完成后恢复。它可能运行数小时、数天,甚至更久。
这不是学术问题。一旦你部署了一个运行超过几分钟的智能体,你就有了持久性问题。服务器重启怎么办?
热门跟贴