来源:市场资讯

(来源:具身之家产业观察)

作者| 拂晓子

27岁的姚顺雨,终于在腾讯交出了第一张答卷。

但这张答卷的分量,不只是一个年轻科学家的首秀,它更像是腾讯AI打法的一次重启。

4月23日,腾讯混元 Hy3 preview 正式上线并开源。这是姚顺雨归国加盟腾讯后,带队交出的第一个重要成果,也是混元团队在架构、基础设施重新出发后的首个版本。

打开网易新闻 查看精彩图片

从参数看,Hy3 preview 是一个快慢思考融合的 MoE 语言模型,总参数 295B,激活参数 21B,支持 256K 上下文。

更关键的是,它不是只停留在模型页面上,而是已经进入腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ、QQ浏览器、腾讯文档、腾讯乐享等产品,微信公众号、和平精英、腾讯新闻、腾讯自选股、腾讯客服、微信读书等主线产品也在陆续上线。

这意味着,腾讯这次不是又发了一个模型,它是在重新回答一个更大的问题:

AI下半场,腾讯到底靠什么赢?

姚顺雨“重建混元”

如果说去年国内大模型竞争,重点还在“谁先卷出更强能力”,那么今年开始,问题已经变了。

市场不再只关心:

这个模型聪不聪明?

这个模型会不会写诗?

这个模型能不能拿高分?

大家开始关心的是:

它能不能完成一个真实任务?

它能不能联网、搜集、比对、分析、输出?

它能不能稳定调用工具?

它能不能在产品里跑起来?

它能不能在企业场景里创造效率?

这就是为什么腾讯这次反复强调两个词:重建、实用性。

Hy3 preview 是混元团队在架构、基础设施重新出发后的第一个版本。换句话说,这次不是常规意义上的“模型升级”,而是一次底层工程的重构。

这背后其实透露了一个非常重要的信号:腾讯已经不满足于做一个“可以回答问题”的模型,它想做的是一个可以被全产品线调用,并且真正进入工作流的智能底座。

这一点,对腾讯尤其关键,因为腾讯最强的从来不是单个模型,而是生态。

元宝、腾讯云、QQ、QQ浏览器、腾讯文档、腾讯乐享、微信公众号、腾讯新闻、腾讯客服、微信读书、和平精英、CodeBuddy、WorkBuddy……这些产品背后,本质上都在等待一个更统一、更稳定、更能执行复杂任务的AI引擎。

如果没有这样一个底座,腾讯AI就会变成“每个产品都有一点AI,但没有形成腾讯级AI能力”。

而Hy3 preview的出现,本质上就是在解决这个问题。

于是,从姚顺雨加入腾讯开始,就把评测重心从“考卷式能力”转向“真实任务式能力”,AI下半场,评估比训练更重要。

打开网易新闻 查看精彩图片

姚顺雨

今天通用大模型的基础配方,其实已经非常成熟。预训练、强化学习、算力扩展,这些大家都在做。继续在同一套题库上卷,当然还能进步,但很多时候投入巨大,提升却有限。

真正拉开差距的,不再是谁多刷了几分,而是谁定义了更接近现实世界的新任务,谁能更客观地衡量“这个模型到底能不能解决问题”。

在腾讯版 AI 办公助手 WorkBuddy 上,我们可以选择最新的混元模型,让它进行代码开发、深度研究、产品管理、数据分析等。

打开网易新闻 查看精彩图片

比如我们要求它联网获取联合国人口司数据,完成一项「全球人口结构变迁」可视化分析。

这是一个涉及数据获取、清洗、分析与可视化呈现的复合型任务,Hy3 preview 同样完成得较为顺畅,最终输出了直观的图表与分析文本。

打开网易新闻 查看精彩图片

腾讯这次就是直接把模型扔进工作流里,看看它到底能不能干活。

这件事,非常腾讯。

因为腾讯拥有中国互联网里最复杂的一批真实业务环境:社交、内容、搜索、广告、办公、云服务、游戏、金融信息、客服、开发者工具……这些场景天然就是“现实世界的测试场”。

所以,腾讯自建基准测试的真正价值,不是比别人多做了一套题库,而是它更容易把“真实业务痛点”直接变成评估环境。

这意味着,Hy3 preview 的评测逻辑已经不是“做更难的考卷”,而是在尝试回答一个更商业化的问题:AI到底能不能在复杂业务里,完成一件完整的事。

硬核看点:Agent能力

姚顺雨本身就是 ReAct 框架的重要提出者之一,ReAct 的关键价值,不是让模型说得更像人,而是让模型学会“推理 + 行动”——一边想,一边调用工具,一边不断修正。

这恰恰是AI下半场最重要的能力之一。

Hy3 preview 在腾讯版 AI 办公助手 WorkBuddy 里的表现,已经明显不是传统问答模型那一套了。

1)它开始能处理“深度研究型任务”

Hy3 preview 能够自主启动多步搜索,完成长链推理,并最终输出一份相对客观、中立、结构化的调查报告。

对于企业来说,这种能力的商业价值远比聊天更大。因为大量知识工作,本质上就是:搜信息 → 找差异 → 做判断 → 出报告。

如果模型能把这条链跑通,它就不只是AI助手,而是流程参与者。

2)它开始能处理“数据分析型任务”

Hy3 preview 最终能够输出较为直观的图表和分析文本,这说明它不只是“会写分析”,而是已经开始具备一定的“数据型任务执行能力”。

如果这个能力后续继续稳定,它进入企业分析、市场研究、咨询辅助、投研辅助、BI应用场景的空间会非常大。

3)它开始能处理“代码交付型任务”

腾讯手里已经有 CodeBuddy、WorkBuddy 这样的工具入口。如果底层模型在代码生成、调试、修复、产品协作等能力上持续增强,腾讯完全有机会把模型能力,往研发流程、办公流程和协作流程深度嵌入。

换句话说,模型的价值不只是写代码,而是开始影响交付效率。

腾讯的一次工业化取舍

Hy3 preview 选择的是 295B 总参数、21B 激活参数的 MoE 路线,这条路线背后的商业含义,其实非常明确:腾讯选择的不是“参数叙事”,而是“工业化可用性”。

如果只拼想象力,当然可以继续往更大模型走。但腾讯是一个拥有海量真实业务的公司,它必须考虑几个更现实的问题:

  • 推理成本
  • 并发吞吐
  • 服务稳定性
  • 部署复杂度
  • 上线效率
  • 多产品接入能力

从这个角度看,295B 并不是“保守”,而是一种很腾讯的工程选择,因为腾讯需要的不是实验室里最猛的模型。

它需要的是一个能在腾讯云、元宝、QQ、文档、办公、搜索、内容、客服、代码工具等多场景同时跑起来的模型。

这背后的逻辑,不是“把模型做到最大”,而是“把模型做到最能进入业务”。

混元团队把相当多精力都砸在了 infra 上——包括预训练、强化学习基础设施的重做,以及评估体系的加强。

这其实才是AI下半场真正的硬仗,因为今天真正能拉开差距的,不再是一个小的注意力机制创新,不再是一个漂亮的理论点,而是:谁能把模型训练、评估、部署、迭代、上线这一整套工程系统打牢。

性”上,而是放在了“实用性、稳定性、性价比”上。

这不是不够激进,恰恰相反,这是大公司真正开始进入工业化阶段的标志。

我们认为腾讯真正想做的,不是一个模型,而是“Agent化腾讯”。

不是给每个产品简单加一个对话框、不是让用户对着AI聊聊天,也不是只追求“会不会回答”,而是让AI逐步学会:

  • 读懂任务
  • 拆解任务
  • 调用工具
  • 获取信息
  • 处理数据
  • 生成结果
  • 在产品里完成闭环

一旦这件事跑通,腾讯的商业空间就会被彻底重写。

因为腾讯过去最强的是“连接能力”:连接人,连接内容,连接社交,连接交易,连接娱乐,连接企业。

而AI一旦进入下半场,腾讯就有机会从一家“连接型公司”,进一步变成一家“调度型公司”。

腾讯AI下半场靠什么?

说到底,AI竞争不是单靠技术热情就能打赢的。它需要两样东西:“真实场景”以及“持续投入能力”。

腾讯恰恰同时具备这两样。

从场景上看,腾讯拥有中国互联网最复杂的一批业务系统。微信、QQ、游戏、广告、办公、云服务、内容生态、金融信息服务,这些天然都是AI的落地场。

从财务上看,腾讯2025年总收入超过7500亿元,毛利超过4200亿元,Non-IFRS经营利润超过2800亿元,自由现金流超过1800亿元。

这意味着,腾讯做AI,不是靠融资故事,不是靠短期资本市场想象力,而是靠主业现金流去支撑长期投入。

这和很多AI创业公司的打法完全不同,创业公司要用模型证明估值,腾讯要用模型改造经营效率,改造产品体验,改造利润模型。

所以,Hy3 preview 对腾讯来说,从来不是一个“独立业务”,它更像一层新的基础设施。

眼下,Hy3 preview 只是开始。

腾讯后面至少还有三道硬题要继续回答:

1.开源之后,能不能真正形成开发者生态?

2.Agent能力能不能在高频场景里稳定运行,而不是只在Demo里漂亮?

3.混元能不能形成区别于阿里、字节、DeepSeek的差异化路径?

当姚顺雨加入腾讯,外界只看到“年轻”“天才”“OpenAI背景”。

但对腾讯来说,更重要的不是一个人的光环,而是一套新的组织逻辑:

用真实任务定义模型;

用复杂场景训练模型;

用评估体系反推能力建设;

用产品入口放大模型价值;

用工程化和基础设施把能力变成生产力……

AI上半场,腾讯看起来似乎慢了一步,但AI下半场,竞争规则已经变了。

当模型不再只是回答问题,而是开始调用工具、理解流程、进入产品、参与工作、重写效率,腾讯手里的微信、QQ、文档、云、广告、游戏、办公和内容生态,反而会重新变成一张大牌。

真正的AI巨头,不一定是最先把模型做出来的公司。

而是最先把模型,塞进每一条业务流程里的公司。

cjm321666(微信)