华为去年就放过话。在华为全联接大会2025上,副董事长、轮值董事长徐直军说,昇腾芯片会不断演进,后面还有更多芯片在规划。现在看,这话不是画饼。
深圳河套学院AI训练平台项目团队干了件实在事。他们联合哈尔滨工业大学(深圳)、深圳市大数据研究院、华为有关团队,再加上深智城AI算力平台,用昇腾910C国产AI算力集群,完成了一件事:把1.6万亿参数的DeepSeek-V4-Pro模型做完了全参数后训练。不是跑推理,是训练。
打开网易新闻 查看精彩图片
这件事值得拆开看,有三个点很实在:
第一,这是第三方机构在国产算力平台上完成的。不是华为自己关起门来搞的测试,是外部团队真刀真枪跑出来的结果。这意味着国产芯片的训练能力有了可复现的外部验证。
第二,指标不虚。模型算力利用率(MFU)超过30%,关键训练算子效率提升了14%。这些数字够不上顶尖GPU的峰值,但已经达到工业级运行标准。工业级,就是能上线干活,不是实验室跑个demo。
第三,调用已有模型做推理和从零完成全参数训练,技术难度完全不在一个量级。后者对硬件算力、集群稳定性、通信互联的要求高出一个档次。这次实验跑通了,说明国产AI算力能扛住顶级大模型训练任务,这条路走得通。
万亿参数模型的训练,过去基本是英伟达GPU的自留地。现在国产芯片阵营多了一张能打的牌。接下来要看的是,这块芯片的迭代速度够不够快,生态能不能跟上。
热门跟贴