打开网易新闻 查看精彩图片

2万亿Token是什么概念?相当于每天把维基百科全文翻译300遍,或者让GPT-4连续写4000万篇长篇小说。做这事的Portkey,把自己最核心的AI网关(AI Gateway)开源了。

这家成立刚两年的印度公司,客户名单里躺着Adobe、红杉资本、Postman。现在他们把吃饭的家伙免费往外扔,GitHub星标(Star)24小时内破了3000。不是做慈善,是算过账的——当护城河变成基础设施,赚钱的路子反而多了。

从"卖铲子"到"送铲子",中间隔着2万亿次请求

从"卖铲子"到"送铲子",中间隔着2万亿次请求

Portkey的AI网关本质上是个智能路由器。企业调用大模型时,它负责选哪家API、怎么省钱、出错了怎么兜底。比如你的应用同时接了OpenAI、Anthropic和自研模型,Portkey能根据延迟、成本、准确率自动切换,像导航软件实时选最优路线。

这个生意原本很稳。按调用量抽成,客户越依赖AI,Portkey赚得越多。但创始人Ayush Garg和Rohit Agarwal发现,客户开始怕了——怕 vendor lock-in(供应商锁定),怕核心数据流经黑箱系统,怕哪天Portkey涨价或倒闭。

「我们处理2万亿Token后意识到,客户要的不是一个更好的中间商,是一个他们能完全掌控的基础设施。」Ayush Garg在公告里写道。开源不是放弃收费,是把"信任"本身变成产品。

开源版包含全部核心功能:统一API接口、自动重试、负载均衡、成本追踪、可观测性仪表盘。企业版则加了SSO单点登录、审计日志、SLA保障——这些才是大客户真正愿意付钱的。

开源AI基础设施的"截胡"时刻

开源AI基础设施的"截胡"时刻

打开网易新闻 查看精彩图片

Portkey选的时间点很刁。2024年下半年,AI网关赛道突然拥挤:Cloudflare推出AI Gateway,NGINX加了AI负载均衡,甚至Vercel都内置了类似功能。差异化空间被巨头挤压,闭源产品的定价权在流失。

但开源能逆转这个局面。Portkey的GitHub仓库里,代码贡献者来自Stripe、Shopify、Notion的工程师——这些潜在客户的员工,正在免费帮Portkey打磨产品。社区反馈的速度,远快于任何内部迭代。

更隐蔽的收益是标准制定权。当足够多的开发者用Portkey的协议接入大模型,它就变成了事实上的行业标准。后来者想兼容,得先适配Portkey的接口设计。这和Kubernetes、React的开源逻辑如出一辙:先铺基础设施,再在服务层收钱。

Portkey的融资记录也支持这个判断。2023年种子轮300万美元,2024年A轮700万美元,投资方包括Lightspeed和Peak XV(原红杉印度)。投资人看的不是当前收入,是"成为AI时代NGINX"的可能性。

2万亿Token教会的三件事

2万亿Token教会的三件事

处理海量请求后,Portkey团队沉淀了几个反直觉的认知。

第一,企业客户对"智能路由"的敏感度,远低于对"可观测性"的需求。他们更想知道钱花在哪儿、哪个模型在偷懒、为什么某次调用贵了10倍。开源版本把成本追踪做得极细,甚至能拆分到单次请求的费用构成。

第二,多模型策略从"尝鲜"变成"刚需"。早期客户只接OpenAI,现在平均接入3.7个模型提供商。自研模型、开源模型、商业API混着用,网关的复杂度指数级上升——这正是Portkey的护城河。

打开网易新闻 查看精彩图片

第三,延迟的瓶颈不在模型本身,在"首字节时间"(Time to First Byte, TTFB)。用户发送请求到收到第一个字符的间隔,往往被网络路由吃掉大半。Portkey在全球部署了边缘节点,把TTFB压到50毫秒以内,比直接调用原始API快3倍。

这些经验被编码进开源版本,成为社区贡献的基准线。换句话说,Portkey把"我们知道什么"变成了"所有人都能验证什么"。

开源之后,钱从哪来?

开源之后,钱从哪来?

Portkey的商业模式很清晰:开源版占领心智,托管版赚取便利。自己部署需要工程师、服务器、运维精力;用Portkey的云服务,按调用量付费,起步价每月500美元。

这个定价锚定的是"替代成本"——雇一个专职工程师维护网关,年薪至少15万美元。Portkey的托管服务只要几分之一,还附赠7×24小时支持。

更深层的收入来自"数据飞轮"。当客户通过Portkey调用模型,平台积累了海量性能数据:哪家API在特定时段更稳定、哪种模型对某类任务性价比最高。这些数据被抽象成"推荐引擎",向企业版客户收费。

竞争对手Cloudflare的AI Gateway目前免费,但功能深度不足;NGINX的企业版定价模糊,社区活跃度远不及Portkey。窗口期可能只有12-18个月,Portkey选择用开源速度换规模。

GitHub仓库的Issue区已经热闹起来。一位Shopify工程师提交了"支持Bedrock跨区域故障转移"的PR,被合并后他留言:「终于不用自己维护那坨Python脚本了。」另一位独立开发者则吐槽文档的Rust示例太少,Portkey CTO Rohit Agarwal亲自回复:「下周补,或者你现在来贡献?」