蚂蚁集团使用国产AI芯片训练大模型,成本可进一步降低。
出品丨自主可控新鲜事
转载请注明出处
正文共1343,建议阅读时间3分钟
国产AI模型,再次迎来突破。
近日,蚂蚁集团Ling团队发表了一篇技术成果论文。论文显示,蚂蚁集团推出了两款不同规模的MoE大语言模型——百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),前者参数规模为168亿(激活参数27.5亿),Plus基座模型参数规模高达2900亿(激活参数288亿),两者性能均达到行业领先水平。
除了自研性能领先的大模型以外,该技术论文最大的突破在于提出了一系列创新方法,以提升资源受限环境下AI开发的效率与可及性。实验表明,其3000亿参数的MoE(混合专家)大模型可在使用国产GPU的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及MoE模型相当,还将使成本降低20%。
蚂蚁对此回应称:蚂蚁针对不同芯片持续调优,以降低AI应用成本,目前取得了一定的进展,也会逐步通过开源分享。
这意味着蚂蚁承认了该事件,该技术突破标志着国产AI产业链从硬件到算法的协同创新,将加速国产芯片生态建设,降低行业对英伟达高端GPU的依赖。
据知情人士称,蚂蚁集团使用了包括来自阿里巴巴和华为的芯片,采用混合专家(MoE)机器学习方式来训练模型。他们表示,蚂蚁集团获得了与采用英伟达H800等芯片训练相似的结果。其中一位知情人士称,蚂蚁集团仍在使用英伟达的产品进行人工智能开发,但目前其最新模型主要依赖于包括AMD产品和中国芯片在内的替代产品。
目前,蚂蚁集团Ling团队的技术成果论文《每一个FLOP都至关重要:无需高级GPU即可扩展3000亿参数混合专家LING大模型》已发表在预印版Arxiv平台上。
论文地址:https://arxiv.org/pdf/2503.05139
此前,DeepSeek通过一系列算法创新及工程优化,使用性能较低的英伟达H800训练出了性能与顶尖模型相当的V3与R1,为大模型的训练开辟了新的道路,让更多的企业和研究机构看到了降低成本、提高效率的可能性。如果蚂蚁集团的技术成果得到验证及推广,意味着国产大模型能够寻找成本更低、效率更高的国产芯片或其他替代方案,打破英伟达芯片的垄断和依赖。
根据国泰君安证券研报,AI芯片主要分为三种类型:通用型(GPU)、半定制型(FPGA)、定制型(ASIC)。三类芯片代表分别有英伟达(NVIDIA)的GPU、赛灵思的FPGA和Google的TPU(一种专门为机器学习任务设计的AI ASIC)。GPU的计算能力最强,但是成本高、功耗高;FPGA可编程,最灵活,但是计算能力不强;ASIC体积小、功耗低,适合量产,但是研发时间长,且不可编辑,前期投入成本高,带来一定的技术风险。
目前,国内GPU厂商代表有壁仞科技、天智数芯、摩尔线程和沐曦等;AI ASIC厂商代表有华为海思昇腾、寒武纪、燧原股份等。
2024年8月以来,国内AI算力厂商陆续启动IPO辅导。2024年8月26日,燧原科技启动IPO辅导;GPGPU领域代表厂商壁仞科技于9月11日启动IPO辅导;11月12日,GPU厂商摩尔线程启动IPO辅导。
进入2025年,1月15日,沐曦股份也启动了上市辅导。
这几家接受IPO辅导的企业中,燧原科技创始团队有AMD背景,其创始人兼COO张亚林于2008年加入AMD,历任资深芯片经理、技术总监。曾经作为全球芯片研发主要负责人之一,在AMD上海研发中心成功领导开发并量产了多颗世界级芯片,拥有丰富的工程和产品化实战经验。
沐曦股份创始团队同样来自AMD,其创始人陈维良曾任AMD全球GPGPU设计总负责人;两位CTO(首席技术官)均为前AMD首席科学家,目前分别负责公司软硬件架构。
而摩尔线程创始团队来自全球GPU巨头英伟达,其创始人兼CEO张建中曾任英伟达全球副总裁、中国区总经理,在GPU这一行业已经深耕近二十年。
若四家全部上市成功,得到资本的助力,将大幅提升国产GPU产品在市场上的认可度,加速推动人工智能产业的高质量发展。此外,除了这四家接受IPO辅导的AI芯片厂商外,天数智芯、昆仑芯、平头哥等也广受市场关注。
免责声明:本文系网络转载,版权归原作者所有。但因转载众多,或无法确认真正原始作者,故仅标明转载来源,如涉及作品版权问题,请与我们联系,我们将在第一时间协商版权问题或删除内容!内容为作者个人观点,并不代表本公众号赞同其观点和对其真实性负责。
点击下方标题,洞悉信创产业发展
热门跟贴