月之暗面已低调对其旗舰模型进行了重大升级,推出了名为 Kimi k2.5 的新版本,标志着该公司在多模态能力与智能体集群协作方面取得了关键进展。此次升级并未举行公开的发布会,而是直接在产品端进行更新,意在通过技术实力的实质性提升,在竞争激烈的中国人工智能市场中巩固其头部地位。
根据公司周二发布的声明,最新的 K2.5 模型采用原生多模态架构,能够通过单一提示词同时处理文本、图像和视频。该模型最显著的技术突破在于其“智能体集群”能力,能够自主调度多达 100 个子智能体并行工作。这一架构使得复杂任务的执行时间相比单智能体配置缩短了最高 4.5 倍,大幅提升了处理效率。
此举正值中国顶尖大模型厂商之间的竞争白热化之际。在竞争对手 DeepSeek 预计发布重大更新的前夕,月之暗面通过此次升级展示了其技术储备。据知情人士向彭博透露,月之暗面近期已完成一轮融资,从包括 阿里巴巴 和 IDG Capital 在内的投资者手中筹集了 5 亿美元,投后估值达到 43 亿美元,目前正寻求以最高 50 亿美元的估值进行新一轮融资。
目前,Kimi k2.5 已通过 Kimi.com 网页版、App 以及 API 平台向用户开放。这一升级不仅强化了其在长文本领域的传统优势,更通过引入视觉理解和自动化代码生成工具,试图在企业级应用和开发者生态中占据更有利的位置。
原生多模态与视觉推理
Kimi k2.5 在基础架构上实现了从单一文本处理向全能视觉助手的跨越。该模型使用了约 15T 的混合视觉和文本标记进行预训练,使其不再局限于简单的 OCR 文字识别,而是具备了深层的视觉理解能力。
根据官方描述,用户可以直接上传复杂的电路图、手写数学公式或财务报表,K2.5 能够理解其中的逻辑并进行分析推导。在编程领域,该模型表现出了强大的视觉编码能力,能够根据图像或视频输入直接生成完整的前端界面代码,并支持可视化调试,降低了用户通过视觉方式表达开发意图的门槛。
智能体集群协同技术
此次更新的核心亮点在于“智能体集群”范式。K2.5 引入了并行智能体强化学习(PARL)技术,使其能够作为一个协调者,自主管理并编排一个包含 100 个子智能体的集群。
在处理大规模搜索或复杂工作流时,该模型无需预定义角色或工作流程,即可将任务分解为可并行的子任务。例如,在筛选特定领域的视频创作者时,K2.5 可同时启动 100 个子智能体进行并行搜索和数据汇总。内部测试数据显示,这种并行处理机制不仅将端到端运行时间减少了 80%,还支持多达1500 个协调步骤的并行工作流,显著突破了传统单智能体的能力瓶颈。
基准测试与办公效率
在性能指标方面,月之暗面表示 K2.5 在多个基准测试中优于开源同行。在 HLE、BrowseComp 和 SWE-Verified 等代理基准测试中,该模型表现突出。特别是在编程和逻辑推理领域,K2.5 缩小了与顶级专有模型的差距,其推出的自动化编码工具旨在与 Anthropic PBC 旗下的 Claude Code 展开竞争。
针对实际办公场景,K2.5 展示了处理高密度、大规模知识工作的能力。内部的“AI Office 基准测试”显示,相比此前的 K2 Thinking 版本,新模型在处理文档、电子表格及构建金融模型等端到端任务上的性能提升了 59.3%。
融资背景与市场格局
月之暗面由前清华大学教授 Yang Zhilin 创立,他在 Meta Platforms Inc. 和 Google 均有过人工智能项目经验。尽管公司在商业化进程上通过订阅计划和企业服务推进,但在市场份额上仍面临 Zhipu 和 MiniMax Group Inc. 等对手的激烈竞争,后两者近期已在香港通过首次公开募股(IPO)合计募集了超过 10 亿美元。
随着 DeepSeek R1 模型在 2025 年初取得突破性成功,中国大模型市场的“百模大战”已进入淘汰赛阶段,许多小型参与者因难以跟上技术升级和资金需求的步伐而掉队。月之暗面此次抢在竞争对手之前发布 K2.5,并配合新一轮的高估值融资计划,意在向市场证明其在技术迭代和资本吸引力上的持续领先地位。
热门跟贴