Kimi K2.6深夜开源,拿下全球开源第一
SWE-Bench Pro 58.6%力压所有闭源对手,代码能力追平Claude Opus 4.6,价格只有1/8
昨晚(月20日晚),月之暗面发了新一代旗舰模型Kimi K2.6并直接开源。消息一出,技术圈就炸了——因为它拿下了Artificial Analysis全球开源第一,仅次于闭源的「御三家」。今天和大家聊聊这个。
开源第一,什么水平?
先看榜单。
Kimi K2.6在Artificial Analysis上取得了全球开源第一的成绩。
具体数字:
• SWE-Bench Pro:58.6%——力压所有闭源对手
• HLE(含工具):54.0
• SWE-bench多语言:76.7
• BrowseComp:83.2
• Charxiv(含Python):86.7
• Math Vision(含Python):93.2
官方说对标的是Claude Opus 4.6——就是Anthropic刚发布的那款。结果K2.6在编程能力上直接追平,价格却只有Opus的1/8。
连续编码13小时,300个Agent一起干
代码能力是一方面,更炸裂的是Agent集群。
月之暗面说,K2.6在测试中可以不间断编码13小时,编写或修改超过4000行代码,完成一个复杂系统的开发和优化。
背后是300个子Agent并行4000步的调度能力——相当于300个程序员同时在线,各司其职,还能协调作战。
这个「Agent集群」升级了动态任务拆解和多Agent协作能力,不再是单兵作战,而是真正的「军团作战」。
「预填充即服务」:给中国芯片趟路
除了模型本身,还有一件事值得关注——月之暗面同时发了一篇论文,提出了「预填充即服务」(Prefill-as-a-Service)架构。
核心思路:用混合模型大幅压缩KV缓存,实现跨数据中心、异构硬件的推理降本。
翻译成人话:这套架构让Kimi更容易跑在国产芯片上,不依赖英伟达的GPU也能高效推理。
在DeepSeek V4还没发的时间里,Kimi已经率先为「中国芯片+中国模型」的合体探出了一条路。
API涨价58%,月之暗面在打什么算盘?
不过也有一个争议点——API定价涨了58%。
有人说月之暗面「开源赚吆喝,商业化才是真目的」。但换个角度看,定价涨了58%还这么多人用,说明市场认可度是真的高。
现在K2.6已经全量上线:Kimi网页端、App、API、Kimi Code编程助手,全部都能用。Hugging Face上也开源了。
开源的意义不只是免费用
有一句话让我印象深刻——Kimi官方在技术博客开头引用了Linus Torvalds的那句:
「Talk is cheap. Show me the code.」
少说废话,代码拿来。
开源的价值不只是让开发者免费用——它让整个社区都能验证模型的真实能力,让生态里的人可以在这个基础上继续构建。月之暗面选了一条难但正确的路。
数据来源:月之暗面官方博客Artificial Analysis、新浪科技、CSDN · 2026年4月22日
热门跟贴