总理座谈会两大青年精英以万亿AI答卷惊艳全球|kimi|吴川|广东|算力基础设施|黄仁勋

2026年4月下旬，全球AI圈被中国两家创业公司的动作彻底点燃。周一，月之暗面开源万亿参数模型KimiK2.6；周四，深度求索带着1.6万亿参数的DeepSeekV4登场。一周之内，两个中国万亿级开源大模型先后落地，刷新全球纪录。更让人意外的是，这两家公司的创始人——杨植麟和梁文锋，都是广东人。过去14个月，他们先后走进国务院总理李强的座谈会，从“追硅谷”到“硅谷回头看”，两个广东年轻人，正用技术答卷，撑起中国AI的半壁江山。

一、一周双响：中国AI的“万亿时刻”

春节后就被调侃“下周一定”的DeepSeekV4，终于在4月24日官宣。1.6万亿参数、100万token上下文、全量开源，直接打破开源模型的参数与上下文上限。技术文档近60页，字字硬核，而行业人翻完文档才反应过来：这已经是本周第二个中国万亿开源模型。

4月20日，月之暗面的KimiK2.6率先开源，同样是万亿参数MoE架构，支持300个子Agent协同工作，能自主拆解复杂长周期任务。上线仅几天，就在OpenRouter平台冲到全球调用量第一，力压Claude、Gemini等海外巨头。

两个模型，路线互补：DeepSeek主攻深度推理、长文本理解和算力效率；Kimi专注多Agent集群、复杂工程落地。看似“内卷”，实则是中国AI的“双向奔赴”——你补我短，我助你长，一起把中国开源模型的天花板越抬越高。

二、广东双雄：从潮汕与粤西走出的AI领军人

14个月，两场总理座谈会，两个广东年轻人，先后坐在总理对面，交出“万亿答卷”。

杨植麟，1992年生于广东汕头，典型的“学霸天花板”。保送清华，CMU博士，师从苹果AI研究负责人和DeepMind首席科学家，年纪轻轻就站在国际AI前沿。2023年创立月之暗面，2024年春节公司估值突破25亿美元，33岁的他，成了中国AI最年轻的掌舵人之一。他的愿景是“承包一片森林，而不是种一棵树”——不做单一模型，要建完整AI生态。

梁文锋，1985年生于广东湛江吴川，父亲是小学老师。吴川一中高考状元，浙大硕士，骨子里带着粤西人的务实与敢闯。2015年创办幻方量化，靠量化交易4年做到管理规模100亿，2021年突破1000亿。赚钱后他不搞虚的，悄悄囤算力：2021年“萤火二号”装了约1万张英伟达A100，当时国内有这规模GPU的公司不超过5家。2021年创办深度求索，从量化大佬变身AI创业者，他说：“中国必然需要有人站到技术的前沿”。

一个从潮汕走进国际顶级实验室，一个从粤西算力牌桌杀出，背景天差地别，却在同一条赛道相遇，做出同样的选择：深耕基础大模型，坚持开源，对标全球顶尖。

三、14个月同步：从技术撞车到生态共生

翻看过去15个月，DeepSeek和Kimi的动作同步到让人怀疑“约好的”，三次关键节点，次次同频。

2025年1月20日，同一天，DeepSeek开源推理模型R1，Kimi发布对标OpenAIo1的K1.5，相隔仅两小时。西方媒体称DeepSeekR1是AI界的“斯普特尼克时刻”，两家成全球最早复现o1思维链的团队。

2025年2月，前后脚发论文，都在改Transformer注意力机制：DeepSeek的NSA做原生稀疏注意力，Kimi的MoBA做混合块注意力，一起解决长文本算力消耗高的行业痛点。

2026年4月，万亿模型同周上线，K2.6和V4接力炸场，全球开源模型前五，中国占四个，K2.6排第一，V4排第二。

更有意思的是技术“互用”：V4用的Muon优化器，是月之暗面去年在KimiK2上率先验证的；K2.6底层的MLA注意力机制，来自DeepSeek。没有封闭保密，只有开放共享，这不是内卷，是中国AI的“生态接力”。

今年3月，Kimi放出“注意力残差”技术，动了Transformer的地基，海外技术圈炸锅，马斯克亲自留言认可。硅谷编程之王Cursor的旗舰模型，底层用的是KimiK2.5；日本乐天“自研”的7000亿参数模型，核心结构和DeepSeekV3几乎一致。黄仁勋在英伟达发布会，拿DeepSeek和Kimi当性能基准；Meta发布新模型，对标名单里只有Llama4、DeepSeek-V3.1和Kimi-K2。

数据更直白：OpenRouter一季度统计，中国开源模型周Token调用量占比超60%，Kimi和DeepSeek稳居前三。HuggingFace报告显示，中国开源模型全球下载量占比41%，位居全球第一。曾经追硅谷的中国AI，如今成了全球标杆。

四、破局算力：两条路，一个方向

美国收紧高端GPU出口，算力卡脖子成中国AI最大难题。DeepSeek和Kimi，走出两条不同却同向的路。

DeepSeekV4明确用华为昇腾芯片推理，官方直言：“受限于高端算力，目前Pro服务吞吐有限，下半年昇腾950批量上市后，价格会大幅下调”。从训练到推理，深度绑定国产算力，把模型优化和国产芯片特性深度结合，FP4精度适配昇腾950，提前布局“去美化”算力生态。

Kimi走“双线并行”：一边和英伟达深度合作，K2.5入选英伟达DGXStation官方支持清单；一边全力适配国产芯片，K2.6开源当天，壁仞科技就完成适配，昇腾平台也跑通多模态推理。今年4月，Kimi提出“Prefill-as-a-Service”分离式推理架构，核心就是推进国产芯片混合推理，不把鸡蛋放一个篮子。

不赌单一路线，不困于算力封锁，两家公司用行动证明：摆脱卡脖子，不止一条路。国产算力和海外算力双线布局，技术自主和生态开放同步推进，这是中国AI的破局智慧。

五、从追赶到引领：中国AI的黄金时代

两年前，中国AI还在拼命追OpenAI、追英伟达、追硅谷；两年后的今天，硅谷开始回头看中国。

14个月前，梁文锋第一次走进总理座谈会，中国AI要证明的是“能不能做出世界级基础模型”；14个月后，杨植麟走进同一场合，问题变成“被算力封锁，能不能持续做、一起做，让基础能力跃迁成常态”。

答案，他们已经用行动给出：能。

梁文锋说：“我们不是有意成为一条鲶鱼，只是不小心成了一条鲶鱼”。如今看来，这条“鲶鱼”，带着另一条“鲶鱼”，搅动了全球AI的格局。

杨植麟的“森林”愿景，正在成真：这片森林里，已经长出DeepSeek和Kimi两棵够得着云层的大树。而森林之下，还有智谱、千问、Minimax等无数小树，一起扎根中国土壤，面向全球生长。

当“人工智能+”成为国家战略，当中国AI从技术跟随到全球引领，两个广东年轻人的故事，不是偶然，是时代必然。他们用技术证明：中国AI，能站在世界之巅；中国创新，能改写全球规则。