打开网易新闻 查看精彩图片

DeepSeek下一代大模型的消息,这几天又被市场翻了出来,导火索来自OpenRouter。

打开网易新闻 查看精彩图片

2026 年 3 月 11 日,OpenRouter 平台上线了两个匿名模型:Healer Alpha 和 Hunter Alpha。

Hunter Alpha 是一款面向智能体场景的模型,参数规模达到 1 万亿,上下文长度为 104.86 万 token。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

Healer Alpha 则是一款全模态模型,支持视觉、音频、推理与行动能力,上下文长度为 26.21 万 token。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

仅从这些公开参数看,它们确实与外界过去对 DeepSeek - V4 的想象高度重合,也因此迅速点燃了新一轮“DeepSeek - V4 要来了”的讨论。 

这轮猜测之所以发酵得这么快,一个重要原因在于,DeepSeek 本身已经有一段时间没有拿出真正意义上的“大版本发布”。

DeepSeek 在 2025 年 1 月正式发布了DeepSeek - R1,主打推理能力,并明确对外开放了网站、API 和开源模型;此后又在 2025 年 3 月发布 DeepSeek - V3 - 0324,强调推理、前端开发和工具调用能力提升。到了 2025 年 12 月,DeepSeek 又上线了 V 3.2 和 V 3.2 - Speciale,继续朝“面向智能体的推理模型”方向推进。

从外部消息看,DeepSeek 新旗舰模型即将到来的说法并非空穴来风。

《路透社》2 月 25 日还披露,DeepSeek 已经将即将推出的旗舰模型 V4 的早期访问权限,优先给到华为等中国公司,而没有按照行业惯例率先向 Nvidia、AMD 等美国芯片厂商开放。

这至少说明两件事:

1)DeepSeek 内部确实存在一个被外界称为“V4”的新旗舰;

2)这款模型已经进入到与算力适配、生态协同有关的实质阶段,而不只是停留在实验室层面。 

不过,匿名模型出现,并不等于 DeepSeek - V4 已经被坐实。

OpenRouter 页面虽然给出了 Hunter Alpha 和 Healer Alpha 的能力描述,但并未披露背后提供方是谁,也没有将它们直接标注为 DeepSeek 模型。当前市场之所以倾向于把两者与 DeepSeek - V4 联系在一起,主要还是因为参数和能力画像过于接近。

Hunter Alpha 强调 1 万亿参数、百万级上下文、长程规划与多步任务执行;Healer Alpha 强调原生视觉和音频输入、多模态推理与复杂任务执行。这与市场长期流传的“DeepSeek 下一代旗舰将补强长上下文、多模态和 Agent 能力”的方向几乎完全一致。

如果把时间线拉长来看,外界对 DeepSeek 新模型的关注,其实不只是盯着“更强的推理”这一件事,而是盯着它能否补齐过去一年最明显的几块短板。

首先是多模态。DeepSeek 此前最出圈的是 R1 这类推理模型,强项主要在文本推理、数学和代码,而不是原生视觉、音频或视频处理。其次是更长上下文和更稳定的智能体执行能力。DeepSeek 在 V3.2 中已经明确提出“将 thinking 整合进 tool - use”,并强调模型面向 agent 训练的数据合成方法,这说明它的研发重点,已经从单纯“答题更强”,转向“在复杂任务链里更能干活”。 

再往前一步看,所谓 LTM,也就是长期记忆,之所以成为这一轮传闻中的关键词,也并非完全没有铺垫。

DeepSeek 公开的 GitHub 项目里,已经能看到名为 Engram 的研究仓库,对应论文主题是“通过可扩展查找实现条件记忆”,试图把“记忆”作为大模型架构里的一个独立稀疏维度来处理。这不等于 V4 已经实现了市场爆料中所说的“长期记忆突破”,但至少说明,DeepSeek 近阶段确实在围绕记忆机制做前沿研究,而不是只停留在通用对话或推理优化层面。 

市场之所以对 DeepSeek 下一次大迭代抱有极高期待,核心原因也正在这里。R1 真正打响的是 DeepSeek 在推理赛道上的名声,但在今天的竞争里,只会做推理已经不够了。多模态、长上下文、搜索增强、工具调用、智能体可靠执行,正在一起构成下一代旗舰模型的基本盘。、

从 DeepSeek 过去一年公开发布的路线来看,它已经在 V3、R1、V3.2 等节点上,把代码、推理、工具使用和长上下文逐步往前推;而 OpenRouter 这次突然出现的两个匿名模型,又恰好把“全模态”和“百万上下文 Agent 模型”这两块拼图摆到了市场面前。 

另外,很多人盯着 DeepSeek - V4,表面上是在等一款新模型,实质上是在看它会不会重排 AI 板块的估值顺序。

MiniMax、智谱已先后在香港上市,市场早已把“中国大模型龙头”的成长预期打进股价里,因此一旦 V4 在多模态、长上下文、Agent 或 Coding 上明显超预期,投资者就会立刻重新比较 MiniMax、智谱的技术壁垒、商业化速度和估值溢价,担心的不是某一天股价机械地下跌,而是谁会被重新定价、谁的故事还能不能继续成立。

打开网易新闻 查看精彩图片

如果《路透社》2 月 25 日披露的情况属实,那么这对英伟达的影响,短期看未必是立刻伤到收入,但中长期更像是一次“生态位被挤压”的信号。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

云头条声明:如以上内容有误或侵犯到你公司、机构、单位或个人权益,请联系我们说明理由,我们会配合,无条件删除处理。

打开网易新闻 查看精彩图片

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

打开网易新闻 查看精彩图片

打开网易新闻 查看精彩图片