实测美团LongCat-2.0，国产芯片长出来的万亿大模型|key|longcat|上下文|大模型|工作流|知名企业|编程|美团|调用

是的，我的Claude又被封了，

急急国王的我又开始盯上国产模型的API了，刚好美团发布了LongCat-2.0。

就这样说吧，一个总参数 1.6 万亿，每个token只激活约 480亿参数的MoE模型，

从预训练到大规模部署，全程跑在5万张国产算力芯片上，跑了一个多月，吃掉超过 35 万亿 tokens，全程无回滚，没有一次不可恢复的 loss 突刺。

这真的发生了。。。

可能有些朋友对这件事没太大感觉，我帮你把时间往回拉两年。

那会儿英伟达的A100，H100这些高端卡被卡脖子。

整个行业最焦虑的问题，都不是国产卡好不好用，

是个更要命的问题，没有英伟达，我们还能不能接着做大模型。

所以LongCat-2.0这次做出来的意义从来不是它是不是今天最强的模型。

是它把一条特别难的链路，完整跑通了一遍。（人类撰写声明）

从训练到大规模部署，官方口径都是国产算力，同时也已经接到了API和开发者工具里。

这个分量，比多刷几个benchmark第一要重。

时间点还赶得巧。

Claude各种封号限流，8号马上还有来一波大的，

现在都有点心灰意冷，想做 API 战士了。但是纯API的话，Claude就不能作为主力模型了，它肯定是一个辅助的专注于UI和出计划的模型。这样就需要第三个模型融入到我的工作流里面，

一个独立在CodeX和Claude之外，永远不会被卡壳的模型。

就在这个节骨眼上，冒出来一个能开源、还能直接接进现有工作流的国产万亿模型，就很爽了。

当然，LongCat-2.0不是全面SOTA。

倒不是说它一发布，明天大家就能彻底告别Claude。

像是IFEval，GPQA-diamond这种更偏通用能力和知识推理的项目，它跟Gemini 3.1 Pro，GPT-5.5还点有差距。轮到Agent场景版本强度就上来了，在Terminal-Bench 2.1和SWE-bench Pro这类编程任务上，它基本追平Gemini 3.1 Pro。在FORTE这种通用Agent任务上，也跟Claude Opus 4.6五五开了。

LongCat-2.0还拥有最大输出的128K。以及最高提供到了1M上下文。

它这次花心思的地方，是怎么让模型在又长又乱的任务里还稳定出结果。

是一个叫LSA的稀疏注意力机制，面对超长输入时，模型不再一个字一个字从头硬啃。毕竟Agent干活要读代码库，翻文档，还要记住前面十几步操作，还要继续调工具等等。LSA解决的就是这个问题。

另一个叫N-gram Embedding，

就是让模型不只盯着单个词，还更在意几个词连在一起时的意思，对局部语境更敏感一点。

这些改动指向的都是同一件事。

为了让LongCat-2.0在长上下文，工具调用，在Agent工作流里干活。

如果你今天就想用上LongCat-2.0的话很简单，

如果原来就是OpenAI Compatible或Anthropic API生态，就是换个base_url，换个API key，换个模型名。

就能开始调用了。

base_url="https://api.longcat.chat/openai"
model="LongCat-2.0"
api_key=LONGCAT_API_KEY


base_url="https://api.longcat.chat/anthropic"
model="LongCat-2.0"