花一周时间搭建AI代理,你很快会碰到那堵熟悉的墙。只要超过一个代理、一个模型或一个工具,就没有谁真正在看管这些组件之间的流量。每次调用都各自为战,认证分散在角落,成本毫无约束,出了问题想回放调用链更是无从下手。
两个协议试图终结这种混乱。MCP(模型上下文协议)像一把USB-C接口,统一了代理与工具的对话方式;A2A(代理间协议)则规定了代理之间如何交接任务。它们确实有用,但只定义了消息的形状,完全没有触及谁被允许调用什么、调用花了多少钱、生产环境怎么排错。没有认证,没有授权,没有消费控制,没有审计痕迹。
AgentGateway就是填补这层缺口的角色。这是一款用Rust编写的开源代理网关,采用Apache 2.0协议,目前已托管在Linux基金会下,并新加入了Agentic AI基金会(AAIF)。它原生支持MCP和A2A,同时也处理普通的HTTP和gRPC流量,你不需要在AI流量和普通API流量之间养两套网关。
理解AgentGateway最直观的方式,是把它看作一张统一的前门,背后连接四种模式的后端。眼下最常用的是LLM模式,也就是代理到模型的链接。你只需让应用指向一个OpenAI兼容接口,AgentGateway就在背后把请求分发到OpenAI、Anthropic、Gemini、Bedrock或自托管模型上,某个端点宕掉时还能自动故障转移。它的负载均衡也不走简单的轮询,而是采用Power of Two Choices(P2C)算法,从两个提供商中采样后智能路由,比传统方式更能避免热点。
这一篇只是整个系列的起点,后续我们还将展开其他三种模式,以及你会经常撞见的两个术语:数据平面和控制平面。不过哪怕只看当前拼图,AgentGateway已经让多代理乱战有了一个能认证、能限流、能追踪的基座。
热门跟贴