4月10日下午,中共中央政治局常委、国务院总理李强主持召开经济形势专家和企业家座谈会,“90后”杨植麟作为企业家代表发言。

杨植麟是在场唯一一位来自独立大模型企业的代表,这也是他半个月内第二次出镜《新闻联播》。

3月28日,参加2026中关村论坛年会的杨植麟,出镜《新闻联播》,分享感悟。

打开网易新闻 查看精彩图片

4月20日,杨植麟带领的Kimi团队再交出新作业——Kimi发布最新一代模型Kimi K2.6,上线即开源。

这距离Kimi发布K2.5模型刚过去两个多月时间,在多个大模型基准测试中,K2.6模型均持平或优于GPT-5.4、Claude Opus 4.6 和 Gemini 3.1 Pro等闭源模型,并在全球开源模型中排名第一。

2025年最后一天,杨植麟曾发布一封内部信,其中写道:接下来公司最重要的目标是超越Anthropic等前沿公司,成为世界领先的AGI公司。

随着Kimi频繁发布并开源新的模型,并陆续公布其在MuonClip、Kimi Linear 和 Attention Residuals 等大模型底层架构方面的技术进展和思考,外界愈发清晰地看到:这家中国大模型创业公司,正以底层技术重构和开源生态,加速逼近AGI的终极目标。

国产开源大模型,正成为全球AI新标准

相较于上一代模型K2.5,Kimi最新上线的K2.6在长程任务执行、Agent集群等能力上表现出大幅跃迁。

K2.6被看作是Kimi“迄今最强的代码模型”,在测试中可以不间断编码13小时,编写或修改超过4000行代码,在Kimi内部评测中,K2.6 的成绩比 K2.5 提升了约 20%;Agent集群能力上,K2.6支持 300 个子 Agent 并行完成 4000 个协作步骤,不仅数量上较K2.5翻了几番,任务完成度和交付质量也有显著提升。

这意味着,Kimi仅用了不到三个月,即在通用Agent、代码、视觉理解等模型关键能力上得到全面提升,并迅速登上全球开源模型第一位的宝座。

杨植麟曾在2026 中关村论坛的演讲中谈道,Kimi做的很多技术创新可以被任何人获取,然后大家能够去形成一个生态系统,一起去推动 AI 领域的发展,“开源让每一个企业、每一个研究者、每一个终端的用户能非常低门槛地获取智能,这是一个非常重要的事情。”

从全球范围来看,开源路线正在让以Kimi为代表的国产大模型加速普及应用,并获得更大的全球影响力。美国麻省理工学院与开源平台“抱抱脸”去年11月份发布的一份联合报告显示,过去一年,中国研发的开源模型全球下载量占比达到17.1%,反超美国的15.8%,位居全球第一。

中国的AI开源生态,正在重塑全球创新体系。如杨植麟所说,以Kimi 为代表的很多开源模型,正在全世界所有的模型厂商的评测中被作为一个标准,也成为很多研究机构的研究样本。

新技术直击AI底层架构,引发硅谷热议

杨植麟将Kimi的进化逻辑归纳为三个维度的共振:Token 效率、长上下文以及智能体集群(Agent Swarms)。基于这一逻辑,在大模型底层架构方面,Kimi团队通过技术重构的方式,探索提升模型训练效率和能力的可能性。

3月18日,在被称为“AI春晚”的英伟达GTC大会上,杨植麟受邀演讲,也是主会分享嘉宾中仅有的一位专注基础大模型的创业公司代表。

在这场全球顶尖AI创业者、学者云集的“盛会”,杨植麟首次系统性地披露了Kimi K2.5模型背后的技术路线图,并将焦点对准了大模型中被沿用多年的底层架构。他认为,要推动大模型智能上限的持续突破,必须对优化器、注意力机制及残差连接等底层基石进行重构。而Kimi正是通过对上述底层架构进行重构,逐步突破模型Scaling的瓶颈,让模型更短时间内变得更“聪明”和更好用。

就在杨植麟演讲的两天前,Kimi发布了一篇名为《Attention Residuals》(注意力残差)的技术报告,火速受到硅谷AI专家和企业家的关注。

马斯克在社交媒体上转发了Kimi这一报告的推文并称:“Kimi这项工作令人印象深刻”;OpenAI前研究副总裁、o1系列推理模型主要发明者Jerry Tworek表示,Kimi的这一技术突破标志着“深度学习2.0”的到来,他认为这种创新将在未来的AI发展中起到至关重要的作用。

前OpenAI联合创始人Andrej Karpathy认为,Kimi团队的创新不仅挑战了现有的深度学习架构,还推动了注意力机制在大规模模型中的进一步应用。

从追赶到并跑,国产大模型重构AI生态

过去两年国产大模型技术进展突飞猛进:从追赶GPT到部分性能在全球大模型榜单登顶;从大语言模型能力攀升到多模态模型逐渐成熟并实现商业化落地。

得益于技术上的开创性进展,在全球大模型竞赛中,我国已经涌现出一批能与世界顶尖大模型媲美的自研大模型,成为全球AI创新中不容忽视的新变量。

同样值得关注的是,AI大模型能力的跃升正在反哺我国整体的AI生态,带动国产芯片、算力等协同共进,推动国产AI走向自主可控。

日前,Kimi发布最新论文《Prefill-as-a-Service》,该研究解决了大模型推理中预填充和解码两个阶段在不同芯片上分别运行的问题,有望推动异构计算规模化落地;此外,该报告显示,来自谷歌、华为及阿里平头哥等更多类型的芯片,可切实用于大语言模型推理,不仅能延长旧款芯片生命周期,同时还能降低大模型整体运行成本,为国产芯片参与大模型推理打开了大门。

长远来看,当大模型的能力不断突破上限,人工智能赋能千行百业便成为当下的重中之重。“十五五”规划建议明确提出,全面实施“人工智能+”行动,以人工智能引领科研范式变革,抢占人工智能产业应用制高点。

不可否认的是,在将AI能力转化为生产力的下一阶段,以Kimi为代表的大模型创业公司还将继续提供关键技术支撑,带来颠覆性的创新成果,让人工智能不断突破边界,在更多场景实现规模化应用。

文/张晓慧 图/企业供图

校对 柳宝庆