2月13日,蚂蚁集团旗下百灵大模型团队发布并开源万亿参数思考模型Ring-2.5-1T。据蚂蚁集团介绍,这是全球首个基于混合线性架构的万亿参数思考模型,在长文本生成、数学推理与智能体任务执行等维度均达到开源领先水平。

打开网易新闻 查看精彩图片

效率层面的提升是此次升级的核心亮点之一。相较于前代Ring-1T,Ring-2.5-1T在超过32K token的长文本生成场景中,访存规模降低10倍以上,生成吞吐提升3倍以上。这一改进得益于底层架构从Ling 2.0向Ling 2.5的演进——团队通过增量训练方式,将原有注意力机制升级为MLA与Lightning Linear Attention的混合结构,在激活参数从51B增至63B的情况下,推理效率反而大幅提升。即便与激活参数仅为32B的KIMI K2架构相比,Ling 2.5架构在同等万亿参数规模下的长序列推理吞吐仍具备明显优势,且生成长度越长,效率差距越大。

在深度思考能力方面,Ring-2.5-1T在IMO 2025自测中获得35分(满分42分),在CMO 2025自测中取得105分(满分126分),均达到金牌水平,后者显著高于金牌线78分及国家集训队入选线87分。

基准测试结果显示,Ring-2.5-1T与DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking等开源模型及GPT-5.2-thinking-high、Claude-Opus-4.5-Extended-Thinking等闭源模型进行了系统对比。在深度思考模式下,该模型在IMOAnswerBench、HMMT-25等数学竞赛推理基准及LiveCodeBench-v6代码生成基准中超越所有对比模型。在智能体任务执行层面,Ring-2.5-1T可适配Claude Code等智能体编程框架与OpenClaw个人AI助理,支持多步规划与工具调用。

蚂蚁集团同时坦言,当前版本在token使用效率与指令遵循方面仍存在不足,面向复杂真实任务的长程执行与交付能力也有较大优化空间,团队将在后续版本中持续改进。目前,Ring-2.5-1T的模型权重与推理代码已在Hugging Face、ModelScope等开源平台发布,官方体验页和API服务将于近期上线。

市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。

本文源自:市场资讯

作者:观察君