1月27日,欢迎来到股市早观点,我们来看看今天有哪些消息热点?
打开网易新闻 查看精彩图片
通过总参数、强化学习、推理计算的极致规模扩展,新模型实现了性能的大幅飞跃,刷新科学知识、数学推理、代码编程等多项关键性能基准测试的全球纪录。
在关键的模型推理能力提升中,千问新模型采用了一种全新的测试时扩展(Test-time Scaling)机制,推理性能提升的同时还更经济。
打开网易新闻 查看精彩图片
业界普遍的推理时计算,只会简单增加并行推理路径,重复推导已知结论,造成冗余推理效率低下;而千问采用的这一新机制,可对此前推理的结果进行“经验提取”式的提炼,
打开网易新闻 查看精彩图片
并据此进行多轮自我迭代,在相同的上下文中实现更高效的推理计算,获得更智能的推理结果。基于这一推理技术创新,千问推理性能和推理效率大为提升,比如在启用工具的“人类最后的测试”HLE中,千问得分58.3,大幅超过GPT-5.2-Thinking的45.5、Gemini 3 Pro的45.8。
关注我,更多股市资讯告诉你!
热门跟贴