阿里云推出最新通义千问 QwQ-32B 推理模型

零壹财经

2025-03-06 08:05 ·北京 ·数字经济决策服务平台

3 月 6 日讯，研究表明，强化学习可以显著提高模型的推理能力，例如 DeepSeek-R1 通过整合冷启动数据和多阶段训练，实现了最先进的性能，使其能够进行深度思考和复杂推理。
阿里云通义千问官方今日宣布推出最新的推理模型 QwQ-32B。这是一款拥有 320 亿参数的模型，其性能可与具备 6710 亿参数（其中 370 亿被激活）的 DeepSeek-R1 媲美。（IT之家）

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴