一夜爆火！阿里再次拿下第一，敢跟闭源模型打擂台？

战争史

2024-12-20 11:32 ·上海

又被马斯克说中，中国AI再次登顶世界第一！

谁是最强开源大模型？海外在线平台CodeArena进行一次投票，结果却惊掉了许多人的下巴。

前三名中，来自中国的阿里云开源大模型Qwen拿下两席，Qwen 2.5 Coder32B位列第一，一直被认为是开源模型标杆的Llama 3.1排在第二，Qwen 2.5 72B排名第三！

老外们一边破大防，一边极其不解！

破大防的是：Llama 3.1明明比Qwen 2.5 Coder32B大10倍，后者竟然赢了，中国AI好比打赢了科技上甘岭之战。

极其不解的是：西方媒体不说Llama 3.1天下第一吗？怎么最终霸榜的是中国的开源大模型！还是两个！

CodeArena这个在线平台还是有很多专业的用户。

通过比较不同大型语言模型 (LLM) 生成代码的能力，并且显示排名结果，这也方便了全球开发者观察谁才是开源大模型的王者。

在这个平台上，谁强谁弱根本瞒不住，真相一目了然。CodeArena的数据摆在那，谁也没得黑。

看到Qwen在海外为国争光，那些唱衰国内AI公司的人，不知作何感想？

其实有一小撮言论，总是盯着国产的大模型。在他们的意识里，国产AI天生就该永远落后美国，一旦国产AI有了突破，那也是山寨、套壳美国AI的结果。

可现实呢？反倒是美国的科技大佬和开发者们看清了中国AI的实力。2023年世界人工智能大会上，马斯克就给出过两个断言：

第一，中国下决心做好人工智能，那一定会做得非常出色。

第2，马斯克相信，「中国在人工智能方面将拥有强大的能力。

当黑子们还在网上贬损中国AI时，马斯克已经站到大气层看问题了。十分尴尬的是，曾让马斯克寄予厚望的Chatgpt，却接连爆出丑闻。

12月12日，OpenAI证实其聊天机器人ChatGPT在全球范围宕机，被很多国人神话的ChatGPT、Sora及API全部瘫痪。

随后，美国媒体爆料，OpenAI吹哨人Suchir Balaji被证实死亡，年仅26岁，他此前公开揭露OpenAI的ChatGPT机器人涉嫌侵犯版权法。意味深长的是，马斯克转发了Suchir Balaji死亡的消息，写下了“Hmm”。

说实话，马斯克称赞中国AI，也说出了美国开发者们的心声。无论社媒还是油管上，阿里云开源Qwen大模型都是“流量王”，老外们像发现了新大陆，原来在AI大模型这块，天不只有美国的蓝啊！

老外们拿出美国AI压箱底的大模型对比，被测评成绩直接干傻眼了。美国开发者干脆飙脏话：等等，我的天呐，Qwen 2.5 72B绝对完胜了GPT4o和Claude Sonnet！

老美有这么大反应，完全可以理解。GPT4o绝对是老外们心中的“遥遥领先”，透着慢慢的美国“技术乐观主义”。就比方说，GPT4o后边的o，代表着“omni”（全知全能）。当初GPT-4o一发布，就被国内媒体捧成能“使得ChatGPT进入实时互动纪元”。

可老外们想破脑袋也没料到，眼看GPT-4o即将封神，哪成想半路杀出个中国开源Qwen，还上演了开源完胜闭源的戏码，杀人诛心不过如此啊。

美国开发者列出详细评测数据，写道：在25个LLMs上运行MMLU-Pro CS基准超过59次，运行时间超过70小时之后，阿里巴巴的Qwen系列QwQ-32B-Preview是最好的本地模型！冠军！

哪怕是十年前，都难以想象，中国科技能有在外网疯狂吸粉的今天。尤其在外网，风向彻底变了：咱们的Qwen甚至成了老外们的新标准，哪家公司新出的大模型强不强，得跟Qwen比较一下才有说服力！

对一项科技最好的证明，莫过于使用者的认可。分享一个振奋人心的数据吧，全球开源社区基于Qwen系列二次开发的衍生模型数量已经突破了7.43万，超越Llama系列衍生模型，成为世界最大的生成式语言模型族群。等于说，全球那么多生成式语言大模型，我们的Qwen系列是最受欢迎和认可的！

总有人问：中国AI实力到底如何？国内讨论难免有人护犊子，有人自吹自擂，但这些海外的评价已经证明，Qwen就是中国开源AI大模型的绝对王者，更是征服了美国开发者的中国科技王牌。

阿里云这波确实干得很漂亮！

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴