DeepSeek V4 要来了！|deepseek|上下文|推理|新论文|智能体|模态|调用

DeepSeek下一代大模型的消息，这几天又被市场翻了出来，导火索来自OpenRouter。

2026 年 3 月 11 日，OpenRouter 平台上线了两个匿名模型：Healer Alpha 和 Hunter Alpha。

Hunter Alpha 是一款面向智能体场景的模型，参数规模达到 1 万亿，上下文长度为 104.86 万 token。

Healer Alpha 则是一款全模态模型，支持视觉、音频、推理与行动能力，上下文长度为 26.21 万 token。

仅从这些公开参数看，它们确实与外界过去对 DeepSeek - V4 的想象高度重合，也因此迅速点燃了新一轮“DeepSeek - V4 要来了”的讨论。

这轮猜测之所以发酵得这么快，一个重要原因在于，DeepSeek 本身已经有一段时间没有拿出真正意义上的“大版本发布”。

DeepSeek 在 2025 年 1 月正式发布了DeepSeek - R1，主打推理能力，并明确对外开放了网站、API 和开源模型；此后又在 2025 年 3 月发布 DeepSeek - V3 - 0324，强调推理、前端开发和工具调用能力提升。到了 2025 年 12 月，DeepSeek 又上线了 V 3.2 和 V 3.2 - Speciale，继续朝“面向智能体的推理模型”方向推进。

从外部消息看，DeepSeek 新旗舰模型即将到来的说法并非空穴来风。

《路透社》2 月 25 日还披露，DeepSeek 已经将即将推出的旗舰模型 V4 的早期访问权限，优先给到华为等中国公司，而没有按照行业惯例率先向 Nvidia、AMD 等美国芯片厂商开放。

这至少说明两件事：

1）DeepSeek 内部确实存在一个被外界称为“V4”的新旗舰；

2）这款模型已经进入到与算力适配、生态协同有关的实质阶段，而不只是停留在实验室层面。

不过，匿名模型出现，并不等于 DeepSeek - V4 已经被坐实。

OpenRouter 页面虽然给出了 Hunter Alpha 和 Healer Alpha 的能力描述，但并未披露背后提供方是谁，也没有将它们直接标注为 DeepSeek 模型。当前市场之所以倾向于把两者与 DeepSeek - V4 联系在一起，主要还是因为参数和能力画像过于接近。

Hunter Alpha 强调 1 万亿参数、百万级上下文、长程规划与多步任务执行；Healer Alpha 强调原生视觉和音频输入、多模态推理与复杂任务执行。这与市场长期流传的“DeepSeek 下一代旗舰将补强长上下文、多模态和 Agent 能力”的方向几乎完全一致。

如果把时间线拉长来看，外界对 DeepSeek 新模型的关注，其实不只是盯着“更强的推理”这一件事，而是盯着它能否补齐过去一年最明显的几块短板。

首先是多模态。DeepSeek 此前最出圈的是 R1 这类推理模型，强项主要在文本推理、数学和代码，而不是原生视觉、音频或视频处理。其次是更长上下文和更稳定的智能体执行能力。DeepSeek 在 V3.2 中已经明确提出“将 thinking 整合进 tool - use”，并强调模型面向 agent 训练的数据合成方法，这说明它的研发重点，已经从单纯“答题更强”，转向“在复杂任务链里更能干活”。

再往前一步看，所谓 LTM，也就是长期记忆，之所以成为这一轮传闻中的关键词，也并非完全没有铺垫。

DeepSeek 公开的 GitHub 项目里，已经能看到名为 Engram 的研究仓库，对应论文主题是“通过可扩展查找实现条件记忆”，试图把“记忆”作为大模型架构里的一个独立稀疏维度来处理。这不等于 V4 已经实现了市场爆料中所说的“长期记忆突破”，但至少说明，DeepSeek 近阶段确实在围绕记忆机制做前沿研究，而不是只停留在通用对话或推理优化层面。

市场之所以对 DeepSeek 下一次大迭代抱有极高期待，核心原因也正在这里。R1 真正打响的是 DeepSeek 在推理赛道上的名声，但在今天的竞争里，只会做推理已经不够了。多模态、长上下文、搜索增强、工具调用、智能体可靠执行，正在一起构成下一代旗舰模型的基本盘。、

从 DeepSeek 过去一年公开发布的路线来看，它已经在 V3、R1、V3.2 等节点上，把代码、推理、工具使用和长上下文逐步往前推；而 OpenRouter 这次突然出现的两个匿名模型，又恰好把“全模态”和“百万上下文 Agent 模型”这两块拼图摆到了市场面前。

另外，很多人盯着 DeepSeek - V4，表面上是在等一款新模型，实质上是在看它会不会重排 AI 板块的估值顺序。

MiniMax、智谱已先后在香港上市，市场早已把“中国大模型龙头”的成长预期打进股价里，因此一旦 V4 在多模态、长上下文、Agent 或 Coding 上明显超预期，投资者就会立刻重新比较 MiniMax、智谱的技术壁垒、商业化速度和估值溢价，担心的不是某一天股价机械地下跌，而是谁会被重新定价、谁的故事还能不能继续成立。