在这场没有硝烟的战争中,Kimi暂时赢得了一个身位,但通往AGI的道路上,还要保持更强大的耐力和更坚韧的态度。
仅仅发布不到24小时,来自月之暗面的Kimi K2.5,已经登顶全球多个大模型榜单。
在权威榜单LMarena的最新排名中,Kimi K2.5在代码、文本等榜单中仅次于Claude 4.5与Gemini 3 Pro等顶级闭源模型,在全球开源模型中位居首位。
同样地,在著名独立评测机构Artificial Analysis的榜单中,Kimi K2.5也在所有开源模型中排名第一。
换言之,排在他前面的几乎都是算力资源约等于无限的闭源模型,而Kimi K2.5背后的算力资源,仅为美国竞争对手的1% 。
这也从某个侧面解释了,一个月前,Kimi获得的C轮融资大幅超募的“盛况”,且目前Kimi的B/C轮融资金额,已超过绝大部分IPO募资及上市公司定向增发规模,新的一轮据说还在进行中。
在中美芯片禁令的铁幕之下,H100和B200,已经成为受到严格管控的战略物资。中美之间的AI竞争,已经实质上变成了不对等的竞争,这甚至在更早之前就已经开始。
这样的条件下,新发布的Kimi K2.5模型,将视觉理解与推理、编程、Agent等能力全部集成到一个模型当中。正如创始人、CEO杨植麟所说,“我们重构了强化学习的基建,并专门优化了训练算法,以确保它能达到极致的效率和性能。”
在长文本和多模态的范式创新几近“卷无可卷”的当下,Kimi K2.5用全新的Agent Swarm架构,试图开拓一种全新的范式。而这种范式,极有可能在如今的中美AI竞争中,成为一种全新的变量。
01 从“单兵作战”到智能体“集团军”
在过去两年的大模型叙事中,行业陷入了一种对“超级单体”的迷信。无论是 GPT-4 还是早期的Kimi,都在试图训练一个全知全能的“大脑”,通过不断增加上下文窗口来容纳更多的信息。
Kimi曾依靠长文本建立了早期的市场心智,在K2时代通过强化思维链提升了逻辑推理的深度。然而,单体智能的 Scaling Law正在撞上一堵“看不见的墙”——无论单个爱因斯坦多么聪明,他都无法在几分钟内同时完成一百家公司的财务审计。
Kimi K2.5的核心突破,在于它果断放弃了对单体模型性能的过度追求,转而拥抱了“群体”的力量。这就是Agent Swarm(智能体蜂群)架构,计算范式由此发生根本性转移。
Swarm基于并行强化学习(PARL),能够将一个宏观的复杂任务瞬间拆解,并生成多达 100 个子智能体并行工作。这种架构上的变迁,好比从单核 CPU 的串行计算时代,跨越到了 GPU 的并行计算时代。
在Swarm的架构下,模型不再是一个孤独的思考者,而是一个拥有最高指挥权的“项目经理”。当用户抛出一个复杂需求时,K2.5 会即时评估任务的拓扑结构,现场决定招募多少个 Agent,并赋予它们不同的角色与权限 。
这些子智能体本质上是K 2.5的分身,但它们可以在同一时刻分别扮演代码审计员、法律顾问、数据分析师甚至视觉设计师。它们之间不再是线性的接力传递,而是网状的并行协作。这种“去中心化”的执行逻辑,直接打破了传统大模型在处理超长复杂任务时容易出现的注意力漂移和逻辑崩塌问题。
Kimi K2.5并没有像许多竞争对手那样,采用“拼接式”的方案——即用一个模型看图,另一个模型写代码,再用第三个模型做推理。它是一个原生多模态混合专家模型,拥有1万亿的总参数,但在单次推理中仅激活320亿参数。
在这个架构中,视觉、文本、视频甚至思考被压缩进了同一个神经网络中。
这就意味着,当Swarm中的一个视觉 Agent 看到网页截图时,它不需要经过中间的转译损耗,就能直接由负责代码的神经元生成生产级的HTML/CSS代码。这种“所见即所得”的端到端能力,是Swarm能够高效运转的生理基础。
02 “无限扩容”的数字劳动力
Swarm架构的实用性,在于它如何重新定义“工作流”的时间成本。尤其对于一些企业用户而言,购买AI服务的实质是购买降本增效和落地的“确定性”。
Kimi K2.5目前所展现的能力表面,在某种程度上,已经可以被视为,充当了一种无限扩容的数字劳动力,而另一个无法绕过去的核心优势则是,其的确更具成本优势。
我们对比全球范围内认可度最高的编程与Agent模型的Claude来看,其开发方Anthropic主动对中国市场实施技术断供,这使得,国内字节跳动Trea、腾讯CodeBuddy等主流编程工具已下架该模型。
当然,即便没有上述这一层诱因,就长远周期来看,Claude高昂的API使用成本偏高,也会间接推动中国企业全面寻找其替代方案。
只不过,此前国产顶尖编程与Agent模型大多都是纯文本架构,缺乏视觉理解能力,实际应用中因无法解析图像,适用场景也相对受限,因此难以从绝对意义上替代Claude。
而这也是Kimi K2.5真正称得上“突破”的关键。Kimi K2.5不仅在编程能力上可与Claude抗衡,使用成本仅为其五分之一,视觉理解能力更实现对Claude的超越,成为兼具技术实力与成本优势的优质替代选择。
先进性与商业化等方面的多重优势,很快便得到了市场端给出的积极反馈:
海外知名编程工具Kilo Code作为Cursor的直接竞品,宣布将Kimi K2.5定为默认模型,并自掏腰包推出首周免费使用活动;国内腾讯旗下编程工具CodeBuddy等也已第一时间上架Kimi K2.5,并将其设为默认模型。
03 算力赤字下的突围
技术细节之外,如果将目光延展至当下中美AI竞争的格局,Kimi K2.5的发布便多了一层悲壮的色彩。
2026年的全球AI格局已呈现出泾渭分明的“双极”状态。大洋彼岸的OpenAI和Google DeepMind正在数万张H100/B200构成的算力海洋中,通过简单粗暴的Scaling Laws向AGI发起冲锋。这是一种大力出奇迹之美。
而处于芯片禁令铁幕之下的中国AI公司,则被迫进入了一场残酷的“非对称战争”,杨植麟在达沃斯提出的“1%资源论”,并不是一句玩笑。
在硬件获取受阻、存量芯片性能落后的客观现实下,Kimi无法像对手那样肆无忌惮地挥霍算力。K2.5的成功并非易事,即便用“被逼出来的”来形容亦不过分,它迫使团队必须在算法层面进行深度的压榨与重构。
除了显性的Swarm架构,Kimi也是全球首个在大型语言模型训练中跑通Muon优化器的公司,自研的线性注意力机制(Kimi Linear)在处理速度上已显著超越传统的全注意力系统,实现效率的跨越式提升。
基于此,K2.5 背后真正的独到之处,将模型训练效率提升了2倍,同时将内存占用减半。也就是说,在同样的硬件预算下,Kimi可以跑两倍的实验,或者在同样的显存限制下训练更大的模型。
Kimi正在验证一条区别于硅谷的“逆Scaling Law”道路:以算法效率换取算力宽度,以智能体协作换取单体参数。
如果这条路能跑通,中国AI产业不必被动等待国产芯片完全追平英伟达的单卡性能,而是通过高效的分布式Swarm架构,就可以在受限的硬件资源上,组合出超越单体巨人的智能涌现。
Kimi K2.5无疑是中国AI版图中最具“硅谷气质”的技术极客之一,颇具“孤勇者”气质。它向行业证明了,智能的进化不仅仅取决于你拥有多少张显卡,更取决于你如何组织和压榨现有的每一分算力。
在这场没有硝烟的战争中,Kimi暂时赢得了一个身位,但通往AGI的道路上,还要保持更强大的耐力和更坚韧的态度。新的征程,又一个新的开始。
热门跟贴