DeepSeek下一代大模型的消息,这几天又被市场翻了出来,导火索来自OpenRouter。
2026 年 3 月 11 日,OpenRouter 平台上线了两个匿名模型:Healer Alpha 和 Hunter Alpha。
Hunter Alpha 是一款面向智能体场景的模型,参数规模达到 1 万亿,上下文长度为 104.86 万 token。
Healer Alpha 则是一款全模态模型,支持视觉、音频、推理与行动能力,上下文长度为 26.21 万 token。
仅从这些公开参数看,它们确实与外界过去对 DeepSeek - V4 的想象高度重合,也因此迅速点燃了新一轮“DeepSeek - V4 要来了”的讨论。 
这轮猜测之所以发酵得这么快,一个重要原因在于,DeepSeek 本身已经有一段时间没有拿出真正意义上的“大版本发布”。
DeepSeek 在 2025 年 1 月正式发布了DeepSeek - R1,主打推理能力,并明确对外开放了网站、API 和开源模型;此后又在 2025 年 3 月发布 DeepSeek - V3 - 0324,强调推理、前端开发和工具调用能力提升。到了 2025 年 12 月,DeepSeek 又上线了 V 3.2 和 V 3.2 - Speciale,继续朝“面向智能体的推理模型”方向推进。
从外部消息看,DeepSeek 新旗舰模型即将到来的说法并非空穴来风。
《路透社》2 月 25 日还披露,DeepSeek 已经将即将推出的旗舰模型 V4 的早期访问权限,优先给到华为等中国公司,而没有按照行业惯例率先向 Nvidia、AMD 等美国芯片厂商开放。
这至少说明两件事:
1)DeepSeek 内部确实存在一个被外界称为“V4”的新旗舰;
2)这款模型已经进入到与算力适配、生态协同有关的实质阶段,而不只是停留在实验室层面。 
不过,匿名模型出现,并不等于 DeepSeek - V4 已经被坐实。
OpenRouter 页面虽然给出了 Hunter Alpha 和 Healer Alpha 的能力描述,但并未披露背后提供方是谁,也没有将它们直接标注为 DeepSeek 模型。当前市场之所以倾向于把两者与 DeepSeek - V4 联系在一起,主要还是因为参数和能力画像过于接近。
Hunter Alpha 强调 1 万亿参数、百万级上下文、长程规划与多步任务执行;Healer Alpha 强调原生视觉和音频输入、多模态推理与复杂任务执行。这与市场长期流传的“DeepSeek 下一代旗舰将补强长上下文、多模态和 Agent 能力”的方向几乎完全一致。
如果把时间线拉长来看,外界对 DeepSeek 新模型的关注,其实不只是盯着“更强的推理”这一件事,而是盯着它能否补齐过去一年最明显的几块短板。
首先是多模态。DeepSeek 此前最出圈的是 R1 这类推理模型,强项主要在文本推理、数学和代码,而不是原生视觉、音频或视频处理。其次是更长上下文和更稳定的智能体执行能力。DeepSeek 在 V3.2 中已经明确提出“将 thinking 整合进 tool - use”,并强调模型面向 agent 训练的数据合成方法,这说明它的研发重点,已经从单纯“答题更强”,转向“在复杂任务链里更能干活”。 
再往前一步看,所谓 LTM,也就是长期记忆,之所以成为这一轮传闻中的关键词,也并非完全没有铺垫。
DeepSeek 公开的 GitHub 项目里,已经能看到名为 Engram 的研究仓库,对应论文主题是“通过可扩展查找实现条件记忆”,试图把“记忆”作为大模型架构里的一个独立稀疏维度来处理。这不等于 V4 已经实现了市场爆料中所说的“长期记忆突破”,但至少说明,DeepSeek 近阶段确实在围绕记忆机制做前沿研究,而不是只停留在通用对话或推理优化层面。 
市场之所以对 DeepSeek 下一次大迭代抱有极高期待,核心原因也正在这里。R1 真正打响的是 DeepSeek 在推理赛道上的名声,但在今天的竞争里,只会做推理已经不够了。多模态、长上下文、搜索增强、工具调用、智能体可靠执行,正在一起构成下一代旗舰模型的基本盘。、
从 DeepSeek 过去一年公开发布的路线来看,它已经在 V3、R1、V3.2 等节点上,把代码、推理、工具使用和长上下文逐步往前推;而 OpenRouter 这次突然出现的两个匿名模型,又恰好把“全模态”和“百万上下文 Agent 模型”这两块拼图摆到了市场面前。 
另外,很多人盯着 DeepSeek - V4,表面上是在等一款新模型,实质上是在看它会不会重排 AI 板块的估值顺序。
MiniMax、智谱已先后在香港上市,市场早已把“中国大模型龙头”的成长预期打进股价里,因此一旦 V4 在多模态、长上下文、Agent 或 Coding 上明显超预期,投资者就会立刻重新比较 MiniMax、智谱的技术壁垒、商业化速度和估值溢价,担心的不是某一天股价机械地下跌,而是谁会被重新定价、谁的故事还能不能继续成立。
如果《路透社》2 月 25 日披露的情况属实,那么这对英伟达的影响,短期看未必是立刻伤到收入,但中长期更像是一次“生态位被挤压”的信号。
云头条声明:如以上内容有误或侵犯到你公司、机构、单位或个人权益,请联系我们说明理由,我们会配合,无条件删除处理。
热门跟贴