2026年4月下旬,全球AI圈被中国两家创业公司的动作彻底点燃。周一,月之暗面开源万亿参数模型KimiK2.6;周四,深度求索带着1.6万亿参数的DeepSeekV4登场。一周之内,两个中国万亿级开源大模型先后落地,刷新全球纪录。更让人意外的是,这两家公司的创始人——杨植麟和梁文锋,都是广东人。过去14个月,他们先后走进国务院总理李强的座谈会,从“追硅谷”到“硅谷回头看”,两个广东年轻人,正用技术答卷,撑起中国AI的半壁江山。

打开网易新闻 查看精彩图片

一、一周双响:中国AI的“万亿时刻”

春节后就被调侃“下周一定”的DeepSeekV4,终于在4月24日官宣。1.6万亿参数、100万token上下文、全量开源,直接打破开源模型的参数与上下文上限。技术文档近60页,字字硬核,而行业人翻完文档才反应过来:这已经是本周第二个中国万亿开源模型。

4月20日,月之暗面的KimiK2.6率先开源,同样是万亿参数MoE架构,支持300个子Agent协同工作,能自主拆解复杂长周期任务。上线仅几天,就在OpenRouter平台冲到全球调用量第一,力压Claude、Gemini等海外巨头。

两个模型,路线互补:DeepSeek主攻深度推理、长文本理解和算力效率;Kimi专注多Agent集群、复杂工程落地。看似“内卷”,实则是中国AI的“双向奔赴”——你补我短,我助你长,一起把中国开源模型的天花板越抬越高。

二、广东双雄:从潮汕与粤西走出的AI领军人

14个月,两场总理座谈会,两个广东年轻人,先后坐在总理对面,交出“万亿答卷”。

杨植麟,1992年生于广东汕头,典型的“学霸天花板”。保送清华,CMU博士,师从苹果AI研究负责人和DeepMind首席科学家,年纪轻轻就站在国际AI前沿。2023年创立月之暗面,2024年春节公司估值突破25亿美元,33岁的他,成了中国AI最年轻的掌舵人之一。他的愿景是“承包一片森林,而不是种一棵树”——不做单一模型,要建完整AI生态。

梁文锋,1985年生于广东湛江吴川,父亲是小学老师。吴川一中高考状元,浙大硕士,骨子里带着粤西人的务实与敢闯。2015年创办幻方量化,靠量化交易4年做到管理规模100亿,2021年突破1000亿。赚钱后他不搞虚的,悄悄囤算力:2021年“萤火二号”装了约1万张英伟达A100,当时国内有这规模GPU的公司不超过5家。2021年创办深度求索,从量化大佬变身AI创业者,他说:“中国必然需要有人站到技术的前沿”。

一个从潮汕走进国际顶级实验室,一个从粤西算力牌桌杀出,背景天差地别,却在同一条赛道相遇,做出同样的选择:深耕基础大模型,坚持开源,对标全球顶尖。

三、14个月同步:从技术撞车到生态共生

翻看过去15个月,DeepSeek和Kimi的动作同步到让人怀疑“约好的”,三次关键节点,次次同频。

2025年1月20日,同一天,DeepSeek开源推理模型R1,Kimi发布对标OpenAIo1的K1.5,相隔仅两小时。西方媒体称DeepSeekR1是AI界的“斯普特尼克时刻”,两家成全球最早复现o1思维链的团队。

2025年2月,前后脚发论文,都在改Transformer注意力机制:DeepSeek的NSA做原生稀疏注意力,Kimi的MoBA做混合块注意力,一起解决长文本算力消耗高的行业痛点。

2026年4月,万亿模型同周上线,K2.6和V4接力炸场,全球开源模型前五,中国占四个,K2.6排第一,V4排第二。

更有意思的是技术“互用”:V4用的Muon优化器,是月之暗面去年在KimiK2上率先验证的;K2.6底层的MLA注意力机制,来自DeepSeek。没有封闭保密,只有开放共享,这不是内卷,是中国AI的“生态接力”。

今年3月,Kimi放出“注意力残差”技术,动了Transformer的地基,海外技术圈炸锅,马斯克亲自留言认可。硅谷编程之王Cursor的旗舰模型,底层用的是KimiK2.5;日本乐天“自研”的7000亿参数模型,核心结构和DeepSeekV3几乎一致。黄仁勋在英伟达发布会,拿DeepSeek和Kimi当性能基准;Meta发布新模型,对标名单里只有Llama4、DeepSeek-V3.1和Kimi-K2。

数据更直白:OpenRouter一季度统计,中国开源模型周Token调用量占比超60%,Kimi和DeepSeek稳居前三。HuggingFace报告显示,中国开源模型全球下载量占比41%,位居全球第一。曾经追硅谷的中国AI,如今成了全球标杆。

打开网易新闻 查看精彩图片

四、破局算力:两条路,一个方向

美国收紧高端GPU出口,算力卡脖子成中国AI最大难题。DeepSeek和Kimi,走出两条不同却同向的路。

DeepSeekV4明确用华为昇腾芯片推理,官方直言:“受限于高端算力,目前Pro服务吞吐有限,下半年昇腾950批量上市后,价格会大幅下调”。从训练到推理,深度绑定国产算力,把模型优化和国产芯片特性深度结合,FP4精度适配昇腾950,提前布局“去美化”算力生态。

Kimi走“双线并行”:一边和英伟达深度合作,K2.5入选英伟达DGXStation官方支持清单;一边全力适配国产芯片,K2.6开源当天,壁仞科技就完成适配,昇腾平台也跑通多模态推理。今年4月,Kimi提出“Prefill-as-a-Service”分离式推理架构,核心就是推进国产芯片混合推理,不把鸡蛋放一个篮子。

不赌单一路线,不困于算力封锁,两家公司用行动证明:摆脱卡脖子,不止一条路。国产算力和海外算力双线布局,技术自主和生态开放同步推进,这是中国AI的破局智慧。

五、从追赶到引领:中国AI的黄金时代

两年前,中国AI还在拼命追OpenAI、追英伟达、追硅谷;两年后的今天,硅谷开始回头看中国。

14个月前,梁文锋第一次走进总理座谈会,中国AI要证明的是“能不能做出世界级基础模型”;14个月后,杨植麟走进同一场合,问题变成“被算力封锁,能不能持续做、一起做,让基础能力跃迁成常态”。

答案,他们已经用行动给出:能。

梁文锋说:“我们不是有意成为一条鲶鱼,只是不小心成了一条鲶鱼”。如今看来,这条“鲶鱼”,带着另一条“鲶鱼”,搅动了全球AI的格局。

杨植麟的“森林”愿景,正在成真:这片森林里,已经长出DeepSeek和Kimi两棵够得着云层的大树。而森林之下,还有智谱、千问、Minimax等无数小树,一起扎根中国土壤,面向全球生长。

当“人工智能+”成为国家战略,当中国AI从技术跟随到全球引领,两个广东年轻人的故事,不是偶然,是时代必然。他们用技术证明:中国AI,能站在世界之巅;中国创新,能改写全球规则。