生产环境的AI应用最怕什么?模型调用突然失败、工具执行失控、系统黑箱不可观测。谷歌旗下的开源框架Genkit今天甩出一套中间件方案,试图把这些坑填上。
这套系统的核心逻辑很简单:在AI生成内容的循环里"插钩子"。每次调用模型时,Genkit会跑一个工具循环——模型输出、工具执行、结果反馈、再次调用,直到任务完成。中间件就在这个循环的三个层级上动手脚,注入自定义行为。
打开网易新闻 查看精彩图片
目前TypeScript、Go、Dart已经能用,Python版本还在路上。
打开网易新闻 查看精彩图片
谷歌直接提供了三个开箱即用的场景。第一个是自动重试:遇到RESOURCE_EXHAUSTED或UNAVAILABLE这类瞬时错误时,按指数退避策略重新调用模型,最多重试3次。注意它只重试模型调用,不重演整个工具循环。
第二个是故障转移。当主模型因配额耗尽等原因失败时,自动切换到备用模型——比如从Gemini切到Claude。开发者可以指定触发切换的具体错误码。
第三个最实用:工具执行审批。系统可以拦截所有工具调用,强制要求人工确认后再继续。比如删除文件这种危险操作,必须等人点过头才能执行。代码里通过interrupt机制实现暂停-确认-恢复的流程。
打开网易新闻 查看精彩图片
还有一个实验性功能:自动扫描SKILL.md文件并注入系统提示词,让AI自动加载项目文档里的技能定义。
这套设计的聪明之处在于"可组合"。每个中间件都是独立的,可以像搭积木一样叠加使用。对于正在把AI应用从demo推向生产的团队来说,省掉自己造轮子的功夫,可能是更务实的选择。
热门跟贴