三年蛰伏、匿名冲榜杀进全球前三，美团龙猫2.0如何用国产算力改写万亿参数大模型叙事？|大模型|王兴|知名企业|算力|算法|美团

2026年6月30日，美团正式发布新一代万亿参数大模型LongCat-2.0（龙猫2.0），并宣布全面开源。这不仅是美团AI战略的一次集中亮相，更是国产大模型发展史上一个标志性时刻——业界首个在五万卡国产算力集群上完成全流程训练与推理的万亿参数模型，就此诞生。

一、五万卡国产集群：从“不可能”到“全球首个”

万亿参数大模型与国产算力的组合，在一年前仍被行业视为“不可能完成的任务”。彼时主流判断认为，国产算力卡在单卡性能、软件生态、集群稳定性等方面与英伟达体系存在代际差距，难以承载前沿大模型的训练需求。

LongCat-2.0的出现正在改写这一认知。

据悉，美团龙猫团队自2023年起便聚焦国产算力适配，从千卡规模起步，与国产算力厂商共同推进“模芯协同”研发。从早期的小规模验证到超大规模稳定训练，团队逐步攻克了万卡级容错恢复、NPU确定性计算、算力利用率提升等核心难题。

在五万卡国产算力集群上，LongCat-2.0实现了：

稳定性突破：通过HCCL异常处理、弹性扩缩卡和自动故障恢复，月均日故障率降低70%以上；
正确性保障：自研确定性算子、Bitwise一致性验证和参数检测，保障训练结果可靠；
效率跃升：流水线调度、显存优化和算子级控核，训练MFU提升1.5倍；
规模验证：稳态日吞吐超过1T tokens/day，全程未出现不可逆的loss尖刺与回滚。

LongCat-2.0的实践表明，国产算力卡的计算正确性和精度已足够满足需求，甚至局部略优，已经可以支撑前沿模型的全流程训练。

二、1.6T参数、1M上下文：硬核技术指标

LongCat-2.0采用MoE（混合专家）架构，总参数规模达到1.6万亿，平均激活约480亿参数，动态范围33B~56B。模型从零开始预训练，预训练数据规模超过30T tokens，覆盖中文、英文、多语言和代码等多类数据。

更值得关注的是其原生支持1M超长上下文，可一次处理百万字级输入。这一能力使LongCat-2.0在长文档理解、复杂代码库分析等场景中具备显著优势。

三、架构创新：LSA + 零计算专家 + MOPD

LongCat-2.0的架构设计自始至终围绕一个核心目标——让模型在真实的Agentic Coding任务中更高效、更稳定地完成代码理解、生成与执行。为此，团队引入了多项原创设计：

1. LSA稀疏注意力机制

LongCat Sparse Attention（LSA）将长文本计算量从平方级降至线性级。在处理100万Token的超长上下文时，模型不再“逐字逐句地看”，而是智能筛选关键信息，保持信息定位与理解能力。LSA通过引入流感知索引、跨层索引和分层索引，使长文本推理中的索引读取更加连续，并允许相邻层之间复用部分索引结果。

2. 零计算专家机制（业界首创）

代码任务中不同token的复杂度差异巨大——定义变量名和推导递归算法对算力的需求完全不同。LongCat-2.0通过零计算专家实现Token级动态计算预算：简单token不消耗算力，复杂token自动获得更多计算资源。这一机制为业界首创。

3. MOPD多专家融合架构

LongCat-2.0通过MOPD架构融合Agent、Reasoning、Interaction三组专家能力：

Agent Experts：专攻工具调用与自主纠错；
Reasoning Experts：深耕数学与STEM推理；
Interaction Experts：优化指令遵循与交互体验。

推理时由门控网络根据任务类型动态调度最擅长的专家，而非简单合并参数。

此外，模型还引入ScMoE跨层快捷连接架构和Ngram Embedding增强等多项原创设计。

四、评测屠榜：SWE-bench超越GPT-5.5和Claude Opus 4.6

硬核架构带来了硬核成绩。综合评测结果显示，LongCat-2.0在代码和通用Agent场景表现优异：

评测基准 LongCat-2.0 对比模型

SWE-bench Pro 59.5 Gemini 3.1 Pro（54.2）、GPT-5.5（58.6）、Claude Opus 4.6（57.3）

SWE-bench Multilingual 77.3 与Claude Opus 4.6（77.8）同一水位

Terminal-Bench 2.1 70.8 真实终端操作场景下稳定执行与纠错能力

在SWE-bench Pro上，LongCat-2.0领先于Gemini 3.1 Pro、GPT-5.5和Claude Opus 4.6；在SWE-bench Multilingual上与Claude Opus 4.6基本持平；Terminal-Bench 2.1的70.8分则证明了其在真实运维与开发终端任务中的稳定执行与纠错能力。

五、匿名冲榜：月调用量跻身OpenRouter全球前三

LongCat-2.0并非横空出世。

今年4月底，其预览版以匿名身份 “Owl Alpha” 接入全球最大的大模型API路由平台OpenRouter。截至6月底，总调用量已悄然跻身全球前三。

在具体Agent场景中：