公司情报专家《财经涂鸦》获悉,4月23日,腾讯混元Hy3 preview语言模型发布并开源,成为混元重建后训练的第一个模型,也是混元迄今最智能的模型。
作为一个快慢思考融合的混合专家模型,Hy3 preview总参数295B,激活参数21B,在复杂推理、指令遵循、上下文学习、代码、智能体等能力及推理性能上实现了大幅的提升,最大支持256K上下文长度。
今年2月,腾讯混元重建了预训练和强化学习的基础设施,以及模型追求实用性的三个原则,包括能力体系化、不推崇“偏科”,评测真实性以及性价比。
“Hy3 preview是混元大模型重建的第一步。”腾讯首席AI科学家姚顺雨表示,“我们希望通过这次开源和发布,获得来自开源社区和用户的真实反馈,帮助我们提升Hy3正式版的实用性。”
“与此同时,我们也在继续扩大预训练和强化学习的规模,提升模型的智能上限,并通过与腾讯众多产品的深度Co-Design,持续提升模型在真实场景中的综合表现,并开始探索特色模型能力。”
多个测评结果显示,Hy3 preview 模型能力全面提升。
首先,出色的上下文学习和指令遵循能力。基于腾讯业务场景的灵感,腾讯混元提出了 CL-bench和 CL-bench-Life 来创新性地评估模型的上下文学习能力,并在 Hy3 preview 显著地提升了模型上下文学习和指令遵循能力。
其次,复杂推理能力突出。Hy3 preview 在 FrontierScience-Olympiad、IMOAnswerBench 等高难度理工科推理任务中表现突出,并在最新的清华大学求真书院数学博资考(26春) 和 全国中学生生物学联赛(CHSBO 2025) 中取得优异成绩,展现了可泛化的强推理能力。
第三,代码与智能体提升最为显著,展现出高性价比。得益于预训练及强化学习框架的重建和强化学习任务规模的提升,腾讯混元以较快的速度在 SWE-Bench Verified、Terminal-Bench 2.0 等主流代码智能体基准以及 BrowseComp、WideSearch 等主流搜索智能体基准中取得了有竞争力的结果。
目前,Hy3 preview 已在腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ、QQ浏览器、腾讯文档、腾讯乐享等首发上线,微信公众号、和平精英、腾讯新闻、腾讯自选股、腾讯客服、微信读书等多个主线产品也在陆续上线。另外,Hy3 preview 支持接入流行的开源智能体产品,如 OpenClaw、OpenCode、KiloCode 等,并已上架腾讯云大模型服务平台 TokenHub。
得益于模型和推理框架上的深度协同,以及在推理框架、算子性能、量化算法等全方面优化,Hy3 preview整体推理效率提升40%,成本相比上一代模型大幅下降。
在腾讯云大模型服务平台TokenHub上,Hy3 preview输入价格最低1.2元/百万tokens,输入命中缓存价格0.4元/百万tokens,输出价格最低4元/百万tokens。同时,腾讯云联合混元推出定制的Hy3 preview Token Plan套餐,个人版定价最低28元/月,为Agent开发和打造“龙虾”应用的提供更具性价比选择。
值得一提的是,今年3月份财报发布之际,腾讯曾透露,HY 3.0正在内部业务测试中,将于4月对外推出,相比HY2.0版本效果进步明显,推理和 agent能力有显著提升。
热门跟贴