它来了,Qwen团队开源推理大模型-QwQ
最近国内的类o1系列模型疯狂发布,deepseek、kimi、skywork都发布了,现在Qwen也来了。
今天Qwen团队也发布了推理大模型,不叫o1,叫QwQ,发音为 /kwju:/ ,与单词 “quill” 的读音近似。
本次开源的是32B级别的模型,专注于增强AI推理能力,是实验性研究模型,目前为预览版本,也在疯狂迭代中,期待后面开源更强的模型。
Blog: https://qwenlm.github.io/blog/qwq-32b-preview/
HF: https://huggingface.co/Qwen/QwQ-32B-Preview
Demo: https://modelscope.cn/studios/Qwen/QwQ-32B-preview
依然老规矩,来测试一下整体效果。
所有测试来自于,https://modelscope.cn/studios/Qwen/QwQ-32B-preview
2024年年高考全国甲卷数学(文)试题
结果正确,
2024年高考全国甲卷数学(理)试题
结果正确,C方程为 ;
数学测试了比较多,基本上都是正确的,并且推理过程也很完整。
下面就是我要测试的一些文本问题了,依旧老几样:
小红有2个兄弟,3个姐妹,那么小红的兄弟有几个姐妹
回答正确,模型一直在反复跟自己强调,确认,整个过程确实蛮有意思的,但推理内容中有时会存在中英文夹杂的情况,官方blog中也提到了这一点,期待后续优化吧。。
用水来兑水,得到的是浓水还是稀水
结果错误,推理过程中说了其实还是水,不知道为啥在最后结论的地方,出现了反转。
将“I love Qwen-QwQ”的所有字母反过来写
对了对了,其实一开始第一种解法就对了,但是这道题一直输出了七八种解法,最后结果还是很让我满意的。
这是我目前测试以来,唯一一个反转对的,之前的deepseek也没对,k0-math也没对。
strawberry有几个r
答案正确,数的没错,完美。
最后引用俊旸兄对QwQ的自述(来自pyq),
如果你体验过后,觉得这个模型很神经,那就对了。反正它跟我们全组同学的精神状态差不多。 强不强客官您自己判断,神经它一定是神经的。 Btw 我实在不懂它干嘛动不动就在那跟自己一顿叭叭……
版块介绍 —产业之声
紧跟产业发展脉搏,我们汇集行业领袖与企业的真实声音,在算力基础设施的规划与布局、能耗优化、大模型能力发展、大模型评测体系、产业应用案例深入研究、新技术与应用趋势前瞻探索等方面,剖析成功案例背后的逻辑与挑战,并提供基于产业深度洞察的策略建议。同时,我们依托于阿里巴巴集团在人工智能领域的全面布局,分享阿里的AI产业生态和应用的实践落地,探讨技术如何重塑产业格局并推动社会经济的转型升级。
Reading
1、
2、
3、
4、
5、
6、
7、
8、
9、
10、
11、
12、
13、
14、
15、
16、
17、
18、
19、
20、
21、
22、
23、
24、
25、
26、
热门跟贴