一个开发团队把OpenClaw Agent扔进真实业务跑了30天,结果比预期复杂得多。
核心发现:本地测试能跑通的功能,上线后三分之一会失效。问题不在代码,在上下文丢失——Agent每轮对话的"记忆"窗口太短,长流程任务走到第五步就忘了第一步要干嘛。
打开网易新闻 查看精彩图片
他们试过两种修复方案。延长记忆窗口会拖慢响应速度,精简任务链条又牺牲灵活性。最后妥协:把长任务拆成子Agent,用状态机硬编码交接逻辑。代价是维护成本翻倍。
打开网易新闻 查看精彩图片
另一个教训是权限边界。测试环境给Agent的API访问范围很宽,生产环境必须收紧,但收紧后大量"合理请求"被拦截,误杀率一度高达40%。团队花了两周调白名单规则。
打开网易新闻 查看精彩图片
30天后的结论:开源Agent进生产,省的是模型调用费,花的是工程债。适合流程明确、容错率高的场景,复杂决策链仍需人工兜底。
热门跟贴