打开网易新闻 查看精彩图片

最近Google放出了一份64页的内部技术手册,直接戳破了AI Agent领域最大的泡沫。

当整个科技圈都在吹捧“自主AI员工”的时候,真相是:你上周看到的那个创业公司演示的Agent,本质上就是几个API调用加上漂亮的提示词。这根本不是Agent,只是昂贵的ChatGPT外壳。

Google提出了一个新概念叫“AgentOps”,类似于机器学习领域的MLOps,但专门针对Agent。包括评估框架、监控面板、CI/CD流水线、基础设施配置。和“拼几个提示词就上线”完全是两个世界。

真正的Agent需要通过四层评估检验:

第一层是组件检查,看它是否每次都能调用正确的API。第二层是逻辑检查,看你能否追溯它的推理过程。第三层是质量检查,看输出结果是否真的有效。第四层是安全检查,看它能否被越狱攻击。

现实是,大多数Agent连第一层都过不了。

安全问题更值得警惕。当你给Agent数据库访问权限时,你实际上是把整个公司的钥匙交给了它。提示词注入、数据泄露、静默失败,这些风险被大多数团队当作事后才考虑的问题。

演示和生产环境的差距是巨大的。演示在沙盒里运行,输入完美可控。生产环境面对的是边缘情况、愤怒的用户、凌晨三点宕机的系统。

那个在圈内传开的47000美元失控循环事故就是血淋淋的教训。Token爆炸、静默递归、零监控,这就是没有监控就部署的代价。

演示优化的是惊艳效果,生产优化的是可靠性。这两者之间隔着一条鸿沟。

Google押注的是基础设施,而不是噱头。当创业公司还在烧钱做Agent玩具的时候,Google正在铺设所有人最终都需要的轨道。

如果你在构建Agent时没有评估框架、没有监控、没有可靠性设计模式,那你构建的就不是Agent。

Agent经济不会真正到来,直到我们停止把这件事当作提示词工程来对待。最先想明白这一点的公司,将主导下一个十年。

x.com/rryssf_/status/2015742275607998481