打开网易新闻 查看精彩图片

2026 年小模型或成为关键。


作者|徐珊

编辑|郑玄

如果说 2025 年 DeepSeek 的爆发让全球意识到算力并非通往 AGI 的唯一方式,那么 2026 年开年,MiroThinker 1.5 的发布,让人更关注小模型的潜力所在。

MiroThinker 1.5 是盛大集团创始人陈天桥与 AI 科学家代季峰创办的 MiroMind 所推出的新一代模型,MiroThinker 1.5 通过 其 30B 小模型规格,通过极小的算力调度,在复杂推理任务中取得了不输大模型的表现,同时响应速度更快、成本更低、智能表现效果更好。目前,MiroThinker 1.5 正处于公开发布阶段,人人皆可上手免费使用。

除了 MiroThinker 1.5 性能表现优越以外,MiroThinker 备受关注的另一大原因是,这是一个强强联手打造出来的创业项目。

MiroMind 是陈天桥在 AI 领域,少有的,自己下场主导并参与的创业项目,他曾凭借《传奇》缔造网游神话、登顶中国首富。在淡出中心视野这些年里,他扎进脑科学领域,砸下十亿美金建立 TCCI,试图挖掘人类大脑的秘密。

公司的另一个创始人则是代季峰,从微软亚洲研究院到商汤科技,一直扎根在计算机视觉领域。他主导过 InternVL 等开源项目,是物体检测与具身智能领域的风云人物。两者组合,让 MiroThinker 1.5 哪怕只是刚上线不久,也得到业内不少关注。

打开网易新闻 查看精彩图片

图片来源: MiroMind 官网

不过,如果小模型的性能真的能够与大模型相媲美,Agent 或许将会迎来一轮落地爆发,随着 Agent 真正完成端侧落地,AI 硬件的能力与玩法,或许也会迎来新一轮的变革。

01

梁文锋牵线搭桥,

MiroMind 想要成为下一个 DeepSeek


就在前不久,MiroMind 首席科学家代季峰在知乎上亲自下场,还原了这段颇有江湖色彩的创业故事。

出人意料的是,为 MiroMind 两位核心人物牵线搭桥的正是 DeepSeek 的掌门人梁文锋。

2025 年初,当陈天桥目睹了 DeepSeek 能力后,就意识到通往 AGI 的道路已开始明晰。当发现自己完全有能力打造下一个 DeepSeek 时,他询问梁文锋,谁最适合带队冲刺 AGI?梁文锋当时就推荐了代季峰,陈天桥没有任何迟疑,直接锁定了他,两人联合创办了 MiroMind。

据代季峰回忆道,在创业前最关键的那场谈话中,没有冗长的商务谈判,只有相见恨晚的共鸣。

当时,陈天桥问代季峰 DeepSeek 成功的核心原因是什么,代季峰提到因为梁文锋一人集齐了「有钱、有理想、懂技术」三个要素,沟通与管理的成本降到极限。代老师随后坦诚相待说:「我有理想和技术,但唯独少了点『资金』。」陈天桥对此相视一笑提到,「我有资本,有对 AGI 的执着理想,但确实缺一位懂技术的领路人。」

这种各有所长的组合,补齐了他们通往 AGI 创业道路的最后一块拼图。代季峰在组建团队时,带有一种近乎纯粹的「少年感」,他提到自己不需要那种在大厂下午发消息、深夜十点才带着满身疲惫回家的员工,而是更希望团队伙伴们都能做到「眼里有光」的状态。

打开网易新闻 查看精彩图片

图片来源:清华大学官网

在选择究竟以什么方向切入赛道时,代季峰很清醒地意识到,现在 LLM 预训练的曲线已经走到了极其平缓的平台期,作为一个后来者,选择再去大模型赛道拼参数并没有意义。

于是,MiroMind 毅然选择杀入了刚兴起的 Agent Modeling 赛道,他们想看看,如果不再推崇算力至上,而是追求最懂、最实用的模型,能不能在 Agent 时代跑出一条不一样的生路。

02

模型参数量降至 1/30,

成本下降 1/20


过去七个月,MiroMind 一直在思考一个更为根本的问题:智能的「奇点」究竟在哪里?

最后他们给出的的答案并非是「用参数推出世界记忆模型」,而是追求「发现智能」。

他们在官网中写道:真正的智能并非依赖于全知全能,而是依赖于研究、验证和纠正的能力。因为真正的智能不是过目不忘的死记硬背,而是像科学家一样,在不确定性中通过纠错抵达真相。

MiroThinker 1.5 测试的最终的效果,也非常令人欣喜。面对万亿级参数的 Kimi-K2-Thinking,仅有 30B 参数规模的 MiroThinker-v1.5 表现出了相当的推理水平。而最直观的表现是模型性能与模型成本成倒挂的态势,在衡量搜索代理能力的基准测试 BrowseComp-ZH 中,30B 版本的表现位列全球前列。

打开网易新闻 查看精彩图片

BrowseComp 基准测试的性能比较 |图片来源:MiroMind 官网

由于参数量缩减到对方的 1/30,MiroThinker 1.5 30B 调用成本大幅下降至每次 0.07 美元,仅为万亿模型成本的 1/20,且推理速度更快。

打开网易新闻 查看精彩图片

智能搜索基准测试的性能比较|图片来源:MiroMind 官网

MiroMind 在官网解释了自己的设计思路与原理。他们认为传统的 Scaling Law 路径倾向于将尽可能多的人类知识记忆在模型参数中。这种做法的弊端在于,当模型面对未知领域或实时变动的信息时,往往会基于统计概率「捏造」答案,从而产生幻觉。而 MiroMind 团队则将技术重点放在了交互式缩放(Interactive Scaling)上。

具体而言,在技术实现上,MiroThinker 1.5 引入了几个核心的新机制:

  • 交互式推理闭环:模型不再进行简单的线性思维链(CoT)外推。它构建了一个「提出假设—查询外部数据—发现冲突—修正假设」的研究循环。在得出结论前,模型会主动发起多轮外部检索,利用确定性的外部证据流来抵御不确定的内部推理偏差。

  • 证据驱动的训练机制:在训练阶段,团队改变了奖励函数。系统不再单纯奖励答案的正确性,而是强化模型搜寻证据的行为。缺乏来源支持的高置信度输出会被惩罚,这迫使模型形成一种「先验证、后判断」的本能。

  • 时间敏感型训练沙箱:为了解决 AI 的「后见之明」问题,标准训练中,模型通常能看到数据的最终结果,这使其在预测未来时倾向于先「回忆过去」。简单来说,MiroMind 构建了一个沙箱,严格限制模型只能访问特定时间戳之前的信息,迫使它在信息不完整、存在延迟的真实环境下学习推理和纠错。

如此一来,MiroThinker 1.5 不再是一个试图记住所有百科知识的容器,而是一个擅长使用工具的专业研究员。在处理金融分析、时效性预测等任务时,它能够展示完整的逻辑验证链条。

打开网易新闻 查看精彩图片

演示提问:下周有哪些重大事件可能会影响美国纳斯达克指数?|图片来源:MiroMind 官网

03

通往 AGI 的另一种道路

MiroThinker 1.5 的出现,在行业内引发了一定反响。不少业内人士认为,AI 竞争即将从拼参数拼规模的时代,转向「拼智力」的时代。

随着模型参数规模的持续下降和推理成本的边际递减,2026 年小模型或成为关键。当 AI 模型的参数规模最够小、价格最够低,且表现性能足够好时,能够更高效地集成进各类移动终端和边缘设备中,那么 AI 落地硬件的算力门槛问题将会迎刃而解。那些已经在大厂实验室、初创公司里打磨了一两年的 AI 硬件,才算真正具备了底层技术支撑,迎来了真正的「开智」时刻,且能够进一步迎接更丰富的功能,更有趣的交互设计。

就如同电力时代刚开启时,人类必须依赖庞大的变压器和错综复杂的电网供电,那时的电力是昂贵且固定的。但当电池技术成熟、电力变得可随身携带后,电器才真正爆发并改变了每一个人的生活。如今的大模型就像初期的电网中心,而 MiroThinker 1.5 这样的小模型,则更像随处可见的「电池」。

可以预见的是,2026 年,AI 变革将不再仅仅局限于行业内部的技术狂欢,而是会通过手机、眼镜、穿戴设备等每一个真实的硬件入口,触达每一个普通人。当 AI 能够以极低的成本在端侧实时运行、自主研究并解决问题时,所有人都会比以往任何时候,都更直观地感受到 AI 时代对生活的影响。

*头图来源:MiroMind

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

极客一问

你看好 MiroThinker 1.5 吗?

未来 AI 在微观型操作上,占比将被大大压缩,转而提升构建角色交流感。

点赞关注极客公园视频号,