我很喜欢 K2.5,本文会非常主观
以及,本文使用 Kimi 配色,用以致敬
昨天下午,Kimi 的朋友跟我说:K2.5 发了。开始没当回事,想当成个快讯发一下,这是原生多模态
当我看完杨植麟那个 4 分钟的视频(这个没推送)之后,愣了好一会
有一种很难言说的感动,好像...我喜欢的那个 Kimi,回来了
先从客观的角度来说,我觉得:K2.5 是 Kimi 的一个分水岭
具体来说,是在两个维度:
行业
国产头部旗舰模型里,Kimi 首先突破了多模态这一关,并且实践得非常好
质感
Kimi 用这张答卷,回归到了那个有品位、有艺术、更有技术的天才少年形象
而这篇文章,会掺杂很多我的主观成分,因为我真的很喜欢
像音乐家一样优雅,像程序员一样可靠
多模态
从多模态说起吧
在过去的半年中,国内持续发旗舰模型的「非大厂」「非 DeepSeek」就三家:智谱、MiniMax、Kimi。它们的最新模型里,只有 Kimi 真正支持了多模态
K2.5 在 K2 基础上继续训练了约 15T 混合视觉-文本 tokens,原生多模态架构。能直接从视频输入生成代码,不需要额外的视觉 MCP
注意:原生多模态架构,不是额外调用
官方 Tech Report 里有一句话:At scale, the trade-off between vision and text capabilities disappears — they improve in unison.
规模够大之后,视觉和文本能力的权衡消失了,它们同步提升
在多模态这一关上,Kimi 的旗舰模型先过了。具体 Benchmark 我就不展开了。Agent、代码、视觉理解,都是对标 GPT-5.2 和 Claude 4.5 Opus
具体如果想了解,可以在 Tech Blog 里找到完整数据:kimi.com/blog/kimi-k2-5.html
天才少年回归
我公众号里写的第一篇教程,是关于如何配合 AI 进行编程学习
那篇文章用的就是 Kimi 的 API 作为示例,因为真的喜欢当时的质感,就是一种...难以名状的...学术偶像?
杨植麟,93 年生人,清华本科年级第一,CMU 四年读完博士,Google Scholar 引用量中国 35 岁以下 NLP 领域最高。公司名字取自 Pink Floyd 的《The Dark Side of The Moon》
那时候觉得,这家公司有点意思,或者说...很有意思!
但后来,慢慢的,质感变了。海量广告投放、各种 Marketing 狠活....我有点疏远了。不是说营销不好,只是觉得那不太像最开始认识的那个 Kimi
K2.5 把那种曾经的质感,带了回来
同时带来的,还有更好的性能,以及更具竞争力的价格
从发布页说起
这个与模型无关,但在我看来,是这种气质回归的一个最典型的特征,现在打开 moonshot.cn 网站,它显示的内容和 GitHub 开源的网站是完全一样的:moonshotai.github.io
黑色背景,极简排版,技术派美学。GitHub 发布页和公司官网合二为一
一家公司能把主页做成这样,让开发者、让专业人员感到舒服,这在全世界都少见
然后,就看到了吾等开发者们,无论小齿佬还是大技霸,都兴奋了起来,Twitter Tech 榜一骑绝尘
我用 Agent 调用的时候报错了。打开 F12 找报错记录,准备联系 Kimi 的朋友看看是不是通路问题
然后发现,报错信息里直接标出了当前访问场景的 ID
这种细节,让人感觉他们是真的在用心干事
在 Kimi 的 Agent 产品里,最近更新了一个「Agent 集群」,说白了就是一堆 Agent 一起干活。技术上叫 Agent Swarm,最多 100 个子智能体,1500 个并行工具调用,运行时间最高缩短 4.5 倍。目前是 Beta,会逐步开放
对于虚拟出来的 Agent,我总觉得有点恶趣味,比如给我写代码的程序员叫「狄柯」
或许...只有「狄柯」,才能让代码「吊炸天」
还有一个细节:在 Agent 模式下,如果它需要一张图片作为背景或插图,会自己画一个。不知道具体用的什么模型,但这个功能确实顺滑
官方给了一个更复杂的例子:投喂 40 篇心理学和 AI 的论文,Kimi 先通读一遍,然后衍生出几个子 agent 分别负责不同章节,最后主 agent 把关验收,生成一份几十页的 PDF 综述
品味
用 AI 生成的网站往往都是同一种风格。你一眼就能看出来这是 AI 做的。配色、布局、动效,有一种很难形容的「AI 味」
并且,非常喜欢用 Tailwind 紫
K2.5 生成的东西不太一样,举个例子:我拿它给 AGI Bar 做了个品牌网站
给它的 prompt(大致上):
温暖的科技感,充满智识上的玩味但绝不冰冷。深炭灰主导,琥珀金黄强调,气泡泡沫图案充当数据可视化的隐喻
还加了点恶趣味:
AGI Bar(酒吧)也是 AGI Bar(门槛)。鼠标在线上方显示「You're above the bar」,在线下方显示「You're near the bar」
最后,效果超预期,真的实际可用,然后我真的把它部署到了 agi.bar (考虑到 DNS 缓存,有些地区可能现在就能刷到了,最迟 24小时)
这里再放几个官方 Case,我都很喜欢,以下这些,都是仅凭单条 Prompt 实现的
比如这个看着就很炸裂的开场
这种很有 style 的美妆
这种可交互的网站
还有这种,讲道理,我觉得这都是可以直接上发布会的
然后也可以传个录屏进去,K2.5 用干净专业的代码,从头到尾复现,讲道理,「从视频,直接到完美网页」,这种体验在其他模型上,是前所未有的
问题也有
长程 Agent 场景下,指令遵循经常出问题。整体体感依然无法达到海外主流模型的水平
与海外的代差在这里,这个谁也否认不了。可能再给 3 到 6 个月,能追上现在的海外主流
但我还是充值了他们最贵的会员,向探索者致敬
公众号后台的光标,走走停停
中间还专门给这篇文章,写了个样式,让它更像 MoonShot 的风格
昨天下午开始用,直到这里才写完
一边写就会有新的想法,一边尝试又在 Kimi 里找到了更多印证,真的,满怀期待,将话筒交给未来吧
热门跟贴