国产GPU上大分！蚂蚁自研大模型计算成本或低于DeepSeek？|amd|deepseek|gpu|国际消费电子展|大模型|英伟达|蚂蚁|计算成本

蚂蚁集团使用国产AI芯片训练大模型，成本可进一步降低。

出品丨自主可控新鲜事

转载请注明出处

正文共1343，建议阅读时间3分钟

国产AI模型，再次迎来突破。

近日，蚂蚁集团Ling团队发表了一篇技术成果论文。论文显示，蚂蚁集团推出了两款不同规模的MoE大语言模型——百灵轻量版（Ling-Lite）与百灵增强版（Ling-Plus），前者参数规模为168亿（激活参数27.5亿），Plus基座模型参数规模高达2900亿（激活参数288亿），两者性能均达到行业领先水平。

除了自研性能领先的大模型以外，该技术论文最大的突破在于提出了一系列创新方法，以提升资源受限环境下AI开发的效率与可及性。实验表明，其3000亿参数的MoE（混合专家）大模型可在使用国产GPU的低性能设备上完成高效训练，性能与完全使用英伟达芯片、同规模的稠密模型及MoE模型相当，还将使成本降低20%。

蚂蚁对此回应称：蚂蚁针对不同芯片持续调优，以降低AI应用成本，目前取得了一定的进展，也会逐步通过开源分享。

这意味着蚂蚁承认了该事件，该技术突破标志着国产AI产业链从硬件到算法的协同创新，将加速国产芯片生态建设，降低行业对英伟达高端GPU的依赖。

据知情人士称，蚂蚁集团使用了包括来自阿里巴巴和华为的芯片，采用混合专家(MoE)机器学习方式来训练模型。他们表示，蚂蚁集团获得了与采用英伟达H800等芯片训练相似的结果。其中一位知情人士称，蚂蚁集团仍在使用英伟达的产品进行人工智能开发，但目前其最新模型主要依赖于包括AMD产品和中国芯片在内的替代产品。

目前，蚂蚁集团Ling团队的技术成果论文《每一个FLOP都至关重要：无需高级GPU即可扩展3000亿参数混合专家LING大模型》已发表在预印版Arxiv平台上。

论文地址：https://arxiv.org/pdf/2503.05139

此前，DeepSeek通过一系列算法创新及工程优化，使用性能较低的英伟达H800训练出了性能与顶尖模型相当的V3与R1，为大模型的训练开辟了新的道路，让更多的企业和研究机构看到了降低成本、提高效率的可能性。如果蚂蚁集团的技术成果得到验证及推广，意味着国产大模型能够寻找成本更低、效率更高的国产芯片或其他替代方案，打破英伟达芯片的垄断和依赖。

根据国泰君安证券研报，AI芯片主要分为三种类型：通用型（GPU）、半定制型（FPGA）、定制型（ASIC）。三类芯片代表分别有英伟达（NVIDIA）的GPU、赛灵思的FPGA和Google的TPU（一种专门为机器学习任务设计的AI ASIC）。GPU的计算能力最强，但是成本高、功耗高；FPGA可编程，最灵活，但是计算能力不强；ASIC体积小、功耗低，适合量产，但是研发时间长，且不可编辑，前期投入成本高，带来一定的技术风险。

目前，国内GPU厂商代表有壁仞科技、天智数芯、摩尔线程和沐曦等；AI ASIC厂商代表有华为海思昇腾、寒武纪、燧原股份等。

2024年8月以来，国内AI算力厂商陆续启动IPO辅导。2024年8月26日，燧原科技启动IPO辅导；GPGPU领域代表厂商壁仞科技于9月11日启动IPO辅导；11月12日，GPU厂商摩尔线程启动IPO辅导。

进入2025年，1月15日，沐曦股份也启动了上市辅导。

这几家接受IPO辅导的企业中，燧原科技创始团队有AMD背景，其创始人兼COO张亚林于2008年加入AMD，历任资深芯片经理、技术总监。曾经作为全球芯片研发主要负责人之一，在AMD上海研发中心成功领导开发并量产了多颗世界级芯片，拥有丰富的工程和产品化实战经验。

沐曦股份创始团队同样来自AMD，其创始人陈维良曾任AMD全球GPGPU设计总负责人；两位CTO（首席技术官）均为前AMD首席科学家，目前分别负责公司软硬件架构。

而摩尔线程创始团队来自全球GPU巨头英伟达，其创始人兼CEO张建中曾任英伟达全球副总裁、中国区总经理，在GPU这一行业已经深耕近二十年。

若四家全部上市成功，得到资本的助力，将大幅提升国产GPU产品在市场上的认可度，加速推动人工智能产业的高质量发展。此外，除了这四家接受IPO辅导的AI芯片厂商外，天数智芯、昆仑芯、平头哥等也广受市场关注。

免责声明：本文系网络转载，版权归原作者所有。但因转载众多，或无法确认真正原始作者，故仅标明转载来源，如涉及作品版权问题，请与我们联系，我们将在第一时间协商版权问题或删除内容！内容为作者个人观点，并不代表本公众号赞同其观点和对其真实性负责。

点击下方标题，洞悉信创产业发展