它来了,Qwen团队开源推理大模型-QwQ

最近国内的类o1系列模型疯狂发布,deepseek、kimi、skywork都发布了,现在Qwen也来了。

今天Qwen团队也发布了推理大模型,不叫o1,叫QwQ,发音为 /kwju:/ ,与单词 “quill” 的读音近似。

本次开源的是32B级别的模型,专注于增强AI推理能力,是实验性研究模型,目前为预览版本,也在疯狂迭代中,期待后面开源更强的模型。

Blog: https://qwenlm.github.io/blog/qwq-32b-preview/
HF: https://huggingface.co/Qwen/QwQ-32B-Preview
Demo: https://modelscope.cn/studios/Qwen/QwQ-32B-preview
打开网易新闻 查看精彩图片

打开网易新闻 查看精彩图片

依然老规矩,来测试一下整体效果。

所有测试来自于,https://modelscope.cn/studios/Qwen/QwQ-32B-preview

  • 2024年年高考全国甲卷数学(文)试题

打开网易新闻 查看精彩图片

结果正确,

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

  • 2024年高考全国甲卷数学(理)试题

打开网易新闻 查看精彩图片

结果正确,C方程为 ;

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

数学测试了比较多,基本上都是正确的,并且推理过程也很完整。

下面就是我要测试的一些文本问题了,依旧老几样:

  • 小红有2个兄弟,3个姐妹,那么小红的兄弟有几个姐妹

打开网易新闻 查看精彩图片

打开网易新闻 查看精彩图片

回答正确,模型一直在反复跟自己强调,确认,整个过程确实蛮有意思的,但推理内容中有时会存在中英文夹杂的情况,官方blog中也提到了这一点,期待后续优化吧。。

  • 用水来兑水,得到的是浓水还是稀水

打开网易新闻 查看精彩图片

结果错误,推理过程中说了其实还是水,不知道为啥在最后结论的地方,出现了反转。

  • 将“I love Qwen-QwQ”的所有字母反过来写

打开网易新闻 查看精彩图片

对了对了,其实一开始第一种解法就对了,但是这道题一直输出了七八种解法,最后结果还是很让我满意的。

这是我目前测试以来,唯一一个反转对的,之前的deepseek也没对,k0-math也没对。

  • strawberry有几个r

打开网易新闻 查看精彩图片

答案正确,数的没错,完美。

最后引用俊旸兄对QwQ的自述(来自pyq),

如果你体验过后,觉得这个模型很神经,那就对了。反正它跟我们全组同学的精神状态差不多。 强不强客官您自己判断,神经它一定是神经的。 Btw 我实在不懂它干嘛动不动就在那跟自己一顿叭叭……


版块介绍 —产业之声

紧跟产业发展脉搏,我们汇集行业领袖与企业的真实声音,在算力基础设施的规划与布局、能耗优化、大模型能力发展、大模型评测体系、产业应用案例深入研究、新技术与应用趋势前瞻探索等方面,剖析成功案例背后的逻辑与挑战,并提供基于产业深度洞察的策略建议。同时,我们依托于阿里巴巴集团在人工智能领域的全面布局,分享阿里的AI产业生态和应用的实践落地,探讨技术如何重塑产业格局并推动社会经济的转型升级。

Reading

1、

2、

3、

4、

5、

6、

7、

8、

9、

10、

11、

12、

13、

14、

15、

16、

17、

18、

19、

20、

21、

22、

23、

24、

25、

26、