2026年还没过半,国内大模型开源的动作已经密集到让人眼花缭乱。6月30日,美团正式开源了它的万亿参数大模型 LongCat-2.0——1.6T参数、五万卡国产算力集群训练、原生支持百万级上下文。消息一出,开发者社区又炸了一次。
但比起技术参数本身,更值得琢磨的是另一件事:为什么越来越多的大厂,愿意把自己压箱底的模型拿出来开源?这对普通开发者和企业来说,意味着什么?
五万张国产卡能干什么
LongCat-2.0 最让人意外的不是 1.6T 这个数字——参数量的军备竞赛大家已经看麻了——而是这个模型从训练到推理,全部跑在国产算力集群上。
五万张国产 GPU 卡,听起来就是一个庞大的数字。但真正重要的是,美团用这套集群跑通了全流程。这意味着国产硬件在超大规模分布式训练上的可靠性,不再是纸面参数。过去大家聊国产算力,总有一种"能用但不放心"的心态,LongCat-2.0 相当于给行业递了一份实战报告:国产卡可以撑起万亿级模型,而且结果已经开源,谁都可以验证。
这对整个 AI 基础设施生态来说,是一个信号。国产算力不再只是"备选方案",开始有了值得认真对待的落地案例。
万亿参数的"轻"与"重"
参数多不等于跑得慢。LongCat-2.0 的动态范围设计,在 1.6T 总参数的基础上,每次推理只激活约 48B 参数,范围在 33B 到 56B 之间浮动。这有点像一家大型图书馆——虽然藏书量过亿,但每次只把读者需要的那个书架调出来。
这种"大而精"的思路,在控制成本的同时保留了海量知识储备。对于那些既想要大模型能力、又担心推理开销的团队来说,这是一个值得关注的设计方向。模型不是越重越好,而是该重的地方重、该轻的地方轻。
超长上下文的实战价值
另一个不能忽视的点是 1M 的上下文长度。百万 token 的窗口意味着什么?一本《三体》三部曲大概 90 万字,换算成 token 差不多是这个量级。也就是说,LongCat-2.0 可以一口气读完整个三部曲,还能跟你讨论情节连贯性。
放到企业场景里,这种能力指向的是真正的生产力场景:完整的代码库分析和重构、数百页的合同审查、全量日志的异常检测——这些过去需要人工逐段翻阅的任务,现在模型可以一次性消化。不用分片、不用摘要、不用反复提示,整个上下文铺在桌面上。
有人会问:上下文再长,模型记不记得住是另一回事。但美团既然敢在万亿参数模型上做 1M 原生长上下文,说明内部已经验证了长距离依赖的保持能力。
为什么大厂开始"大方"了
回到开头的问题:为什么美团要把花了大价钱训练的模型开源?
表面看是企业技术品牌建设——开源一个万亿模型,对招聘和行业影响力都是直接加分。但更深层的原因是,大模型的竞争已经过了"藏着掖着"的阶段。当模型能力趋同、训练成本逐渐透明,真正拉开差距的不再是模型本身,而是数据闭环、工程落地和场景适配能力。
开源模型→吸引开发者和生态→获得更多场景数据→反哺模型迭代——这个飞轮一旦转起来,比把一个模型锁在内部的价值大得多。美团不是第一个这么做的,也不会是最后一个。
这个趋势对普通开发者来说是个好消息。过去顶级大模型是少数巨头的专属品,现在不仅 API 调用越来越便宜,连万亿参数级别的模型都直接开源了。选型空间变大、门槛降低、可定制性增强——这才是开源生态的真正红利。
当万亿参数不再是新闻,百万上下文变成标配,国产算力跑通全流程,AI 应用的想象力才刚刚打开。
如果这篇文章对你有启发,欢迎点赞、推荐让更多人看到,也欢迎在评论区聊聊你正在用的模型和场景。
热门跟贴