就在刚刚,月之暗面正式发布并开源了 Kimi k2.5。

官方技术报告的第一句话就不装了:the most powerful open-source model to date——迄今为止最强大的开源模型。

与上一代模型不同,Kimi k2.5 并非简单的「升级版」,而是一个基于 1.5T 混合视觉与文本 Token 预训练的原生多模态模型。在这个基础底座之上,Kimi 团队构建了一套名为 Visual Agentic Intelligence(视觉智能体智能)的系统。

打开网易新闻 查看精彩图片

这意味着,Kimi k2.5 原来已经极其强大的长文本,再次进化成了一个既有「眼睛」能看懂复杂屏幕,又有「双手」能指挥庞大智能体集群的超级工头。在 SWE-Bench Verified(编程)和 HLE(人类最后考试)等硬核基准测试中,它不仅超越了 DeepSeek V3,甚至在多项指标上击败了闭源的 GPT 和 Gemini。

打开网易新闻 查看精彩图片

从「单兵作战」到「集群思维」

这次发布的更新当中,Agent 集群堪称是 Kimi k2.5 最亮眼的设计。

在过去的几年里,无论模型多强,面对超长、超复杂的任务(比如「帮我调研 100 家竞品的定价策略」),它们通常只能串行处理:查完第 1 家,再查第 2 家……一旦中间出错,整个任务链就容易断裂。

Kimi k2.5 引入了 Agent Swarm(智能体集群) 架构,其核心理念是 Scaling Out, Not Just Up ——不仅要做大,更要做多。在 Swarm 模式下,Kimi k2.5 会自动扮演指挥官的角色。当接到一个复杂任务时,它不会自己闷头干,而是瞬间动态创建并指挥多达 100 个智能体的「工头」。

打开网易新闻 查看精彩图片

这些智能体可以是「AI 搜索员」、「AI 物理学家」、「AI 事实核查员」……它们在指挥官的调度下并行工作。技术文档显示,Kimi k2.5 支持高达 1500 次并行工具调用(Parallel Tool Calls)。

效果是立竿见影的。在官方演示的「寻找 100 个细分领域的 YouTube 头部博主」任务中,人类需要几天,传统单体 AI 需要数小时,而 Kimi Agent Swarm 仅需几分钟。

打开网易新闻 查看精彩图片

数据显示,相比传统模式,Swarm 架构将端到端任务的执行时间减少了 80%,整体效率提升了 4.5 倍。

打开网易新闻 查看精彩图片

为了驾驭这种疯狂的并发能力,Kimi 团队采用了一种名为 PARL (Parallel-Agent Reinforcement Learning) 的训练方法。这让模型学会了在没有预定义工作流(Workflow)的情况下,自主拆解任务、分发任务、并处理并行反馈。即便某个子智能体失败了(Serial Collapse),指挥官也能迅速感知并重新调度。

VLM 过时了,Kimi 带来「视觉工程师」

如果说 Swarm 是 Kimi 的「大脑」,那么 Visual Coding(视觉编程) 就是它进化的「眼睛」

K2.5 模型支持从简单的自然语言对话生成完整的前端界面,并能有效处理交互式布局及滚动触发等动态效果。在 Kimi k2.5 之前,市面上的 VLM(视觉语言模型)大多停留在「看图说话」的阶段——你给它一张网页截图,它告诉你「这里有个红色按钮」。但如果你让它写代码复刻这个网页,它往往只能写出一个死板的 HTML 骨架,根本不懂交互逻辑。

Kimi k2.5 在这里实现了对传统 VLM 的降维打击。在下面的例子中,展示的是从视频复刻网站(Reconstructing a website from video)的操作,左边为原视频,右边为 Kimi 复刻的网站。

打开网易新闻 查看精彩图片

你只需要录制一段网页操作的视频投喂给 Kimi k2.5,它不仅能看懂静态的 UI 布局,还能理解动态的交互逻辑——比如滚动触发特效、复杂的卡片翻转动画等。然后,它会直接生成包含完整 CSS 和 JS 逻辑的可用代码。

更惊人的是它做视觉调试(Visual Debugging)能力。写完代码后,Kimi k2.5 会「看」一眼渲染出来的页面。如果发现「按钮歪了」或者「颜色和原视频不一致」,它会像人类工程师一样,基于视觉反馈去修改代码,而不是盲目地重新生成。

打开网易新闻 查看精彩图片

这种「观察-编码-验证-修正」的闭环能力,让 Kimi k2.5 成为了目前开源界当之无愧的新王,代码和视觉两手抓。

在权威的 SWE-Bench Verified 测试中,Kimi k2.5 拿下了 76.8 的高分,这一成绩不仅碾压了 GPT 5.2,也超过了同为开源顶流的 DeepSeek V3.2。

当所有人都试图把单一模型做得越来越大时,Kimi 展示了另一种可能:通过极致的视觉感知理解世界,通过庞大的智能体集群改造世界。

目前,Kimi k2.5 已在 Hugging Face 开源,同时 Agent Swarm 模式也已在 Kimi.com 上线。无论是用户还是开发者而言,这可能是 2026 年最值得上手一试的开源模型。

欢迎加入 APPSO AI 社群,一起畅聊 AI 产品,获取,解锁更多 AI 新知

打开网易新闻 查看精彩图片

我们正在招募伙伴

简历投递邮箱 hr@ifanr.com

✉️ 邮件标题 「姓名+岗位名称」(请随简历附上项目/作品或相关链接)

打开网易新闻 查看精彩图片