中国智谱AI公司声称,他们使用纯华为硬件训练了一个全新模型,成为首家完全基于中国硬件构建先进模型的公司。
智谱AI推出GLM-Image模型突破
智谱AI公司(品牌名Z.ai)旗下运营着多个通用语言模型(GLM)。本周三,该公司宣布推出GLM-Image模型,采用了"自主研发的'自回归+扩散解码器'混合架构,能够实现图像和语言模型的联合生成"。这一技术代表了在Nano Banana Pro图像生成AI基础上的重要进步。
华为硬件平台的全栈应用
据智谱AI透露,GLM-Image模型完全基于华为Ascend Atlas 800T A2服务器进行开发。该服务器可搭载四颗鲲鹏920处理器,每颗处理器配备64核或48核。华为的处理器采用了自主设计的Arm架构核心。
服务器同时使用华为昇腾910 AI处理器。最新的昇腾910C于2025年发布,华为声称"在FP16精度下单卡算力可达约800 TFLOPS,相当于英伟达H100芯片(2022年发布)算力的80%左右"。
GLM-Image技术架构详解
在模型平台Hugging Face上,智谱AI详细介绍了GLM-Image的双重架构:
自回归生成器:这是一个90亿参数的模型,基于GLM-4-9B-0414版本初始化,扩展了词汇表以纳入视觉Token。该模型首先生成约256个Token的紧凑编码,然后扩展至1K-4K个Token,对应1K-2K高分辨率图像输出。
扩散解码器:70亿参数的解码器,基于单流DiT架构进行潜在空间图像解码。配备文字编码器模块,显著提升了图像中文字渲染的准确性。
全国产化训练的意义与局限
智谱AI强调,"从数据预处理到大规模训练的整个过程"都在Atlas服务器上完成,该模型的发布证明了"在国产全栈计算平台上训练前沿模型的可行性"。
然而,智谱AI并未透露训练GLM-Image使用了多少台服务器或加速器,也没有公布训练速度等关键指标。虽然该公司可以声称使用本土技术开发了模型,但这种说法忽略了Arm对鲲鹏处理器的贡献,同时也没有提供华为硬件在速度或成本方面是否具备全球竞争优势的线索。
对全球AI硬件市场的潜在影响
即使智谱AI的设备运行速度相对较慢,全中国硬件训练模型的消息仍然值得关注。专家预测,未来许多模型将是专注于细分领域的小型化产品。如果中国现在有能力在不依赖英伟达或AMD硬件的情况下制造此类模型,这将对这些芯片设计公司的未来收入构成威胁。
对两大GPU巨头的另一个威胁是昨日宣布的严格出口管制措施,这意味着华盛顿将评估向中国买家销售特定GPU的每一项申请。
开源模式与地缘政治考量
GLM-Image采用开源模式,可供免费使用。值得注意的是,智库ASPI认为,中国利用AI输出其文化和价值观,建议各国需要"防止中国的AI模型、治理规范和产业政策影响全球技术生态系统并强化数字威权主义"。
Q&A
Q1:GLM-Image模型有什么特殊之处?
A:GLM-Image是智谱AI发布的图像生成模型,采用"自回归+扩散解码器"混合架构,能够实现图像和语言模型的联合生成。最特别的是,这是首个完全基于中国华为硬件训练的先进AI模型。
Q2:华为昇腾910C处理器性能如何?
A:华为昇腾910C是2025年发布的最新AI处理器,在FP16精度下单卡算力可达约800 TFLOPS,相当于英伟达H100芯片算力的80%左右。智谱AI正是使用华为Ascend Atlas 800T A2服务器完成了GLM-Image的训练。
Q3:全国产硬件训练AI模型对行业有什么影响?
A:如果中国能够不依赖英伟达或AMD硬件制造AI模型,这将对国际芯片设计公司的未来收入构成威胁。特别是在美国实施严格GPU出口管制的背景下,中国自主AI硬件能力的提升具有重要的地缘政治意义。
热门跟贴