2026年1月27日,月之暗面正式开源Kimi K2.5模型,创始人杨植麟亲自出镜解读,宣称这是“迄今为止最强大的开源模型”。不同于传统堆参数的路线,K2.5主打原生多模态与智能体集群架构,基于1万亿参数的MoE基础,融合约15万亿个“视觉+文本”混合Token预训练,在SWE-Bench Verified编程测试中拿下76.8分,不仅碾压DeepSeek V3.2,更逼近GPT-5.2水平,而运行成本仅为后者的几分之一
K2.5的核心突破在于“视觉智能体智能”(Visual Agentic Intelligence)。它不仅能原生理解视频与图片,还能通过PARL(并行智能体强化学习)技术,动态调度最多100个智能体并行工作,支持1500次工具调用。在处理“找出100个细分领域抖音头部博主”这类任务时,传统单体AI需数小时,而K2.5的Agent集群仅需几分钟,效率提升4.5倍甚至更高。这种“团队思维”让AI能自主拆解任务、应对子智能体失败并重新调度,真正实现了复杂工作流的自动化。
在编程领域,K2.5实现了对传统VLM的降维打击。它支持“截图即代码”甚至“视频转代码”,能理解页面滚动动画、卡片翻转等动态交互逻辑,并具备视觉调试能力——生成代码后会渲染页面,若发现按钮歪斜或颜色不符,会基于视觉反馈自动修正。实测中,K2.5成功复刻了《三体》主题网站、Mac OS界面及手势切西瓜游戏,甚至能将录屏视频转化为可交互网页,大幅降低了前端开发门槛。
针对办公场景,K2.5的Agent集群展现了强大的批量处理能力。例如处理30家公司的季度财报时,它能自动切换美股、港股、A股数据库,对齐多源数据,并在数据缺失时诚实标注“未找到”,最终生成带引用链的Excel;在文献综述任务中,40篇论文可被拆解为多个子任务,由不同Agent并行撰写,最终汇总成100页的专业PDF。此外,它还能处理高密度办公任务,如在Word中添加注释、用数据透视表构建金融模型,甚至批量转换94个Obsidian文档格式,办公质量较前代提升近60%。
值得注意的是,K2.5在多项权威评测中登顶开源榜首:HLE(人类最后考试)得分50.2%,BrowseComp达74.9%,mniDocBench文档理解测试获88.8分。外网评价其为“开源SOTA推理+视觉+智能体编码”的集大成者。目前,K2.5已在Hugging Face和魔搭社区开源,并上线Kimi Code编程工具,支持无缝集成VSCode、Cursor等IDE。
业内分析认为,K2.5的发布标志着AI从“单点工具”进化为“协作团队”,其朴素的实用主义取向——如视觉调试、最后一公里的代码部署、批量脏活处理——直击行业痛点。对于开发者而言,角色正从“码农”转向“AI指挥官”,需掌握任务拆解与结果验收能力;对于行业而言,小团队借助K2.5可干成以往50人的工作,软件迭代速度将从“按月”加速至“按天”,AGI的落地进程或将因此大幅提前。
热门跟贴