一觉醒来,世界人工智能彻底变天了。斯坦福李飞飞团队最新发布了第8版人工智能指数报告(2025),这份指数报告被誉为“迄今为止内容最为全面的一版”。
引人注目的是,该报告详细对比了中美AI实力,刷新了业界对全球AI格局的认知。其中,中国开源模型的强势表现令人惊叹。
作为AI领域最权威的报告之一,斯坦福大学人工智能研究所评选出了2024年全球61个重要AI大模型,美国双雄谷歌、OpenAI均入选了7个,中国开源旗手阿里则入选了6个,重要模型贡献度排在全球第三、中国第一。此外,另一中国开源模型DeepSeek入选了2个,贡献度位列第十。
很多人可能半信半疑,阿里不是搞电商的,咋就在AI上跟谷歌、OpenAI旗鼓相当了?难道阿里比DeepSeek还厉害?
但换个角度看,真得“感谢”斯坦福大学报告做了一次科普。自从OpenAI横空出世,国产AI模型被狠狠“嫌弃”了,更有甚者把美国闭源人工智能奉若神明,把中国坚持的开源贬地毫无价值。
事实真是如此吗?当然不是!DeepSeek今年确实火,但论走开源路线,说实话阿里要早得多。在开源规模和开源模型能力方面,阿里更是低调的巨人,这也是阿里能荣膺重要模型贡献度世界第三的原因所在。
说几组数据,你或许会大感意外:
第1, 全球最大AI开源社区Huggingface最新的开源大模型榜单中,当今世界排名前十的开源大模型,都是基于阿里通义千问(Qwen)开源模型二次训练的衍生模型。有阿里在,美国、欧洲、日韩根本挤不进来。
第2, 从2023年8月起,阿里通义千问已经相继开源Qwen、Qwen1.5、Qwen2、Qwen2.5等4代模型,共计200多款开源模型。Qwen的衍生模型数量已突破10万,超越美国Meta公司旗下的Llama系列开源模型,位居全球第一。
第3, 在Hugging face2024年的开源模型下载中,Qwen模型系列中的Qwen2.5-1.5B-Instruct的下载量占总下载量的26.6%。全球下载量最高的开源模型,也出自阿里。
在性能上,阿里开源模型也是“扫地僧”级别的存在。比如这次入选斯坦福报告的QwQ-32B,其参数量仅为320亿,性能却足以比肩6710亿参数的 DeepSeek-R1满血版。
同样是此次入选的Qwen2.5-32B-Instruct,李飞飞团队以该开源模型为底座,花费不到50美元的费用,就训练出新模型s1-32B,取得了与OpenAI的o1和DeepSeek的R1等尖端推理模型数学及编码能力相当的效果,甚至在竞赛数学问题上的表现比o1-preview高出 27%,震惊业界。
其实没必要比较谁高谁低,无论阿里还是DeepSeek,还是其他模型,每个国产AI模型的进步,都是在促进中国AI模型的整体进步啊。斯坦福报告也提到了,现在中美顶级AI大模型性能已大幅缩至0.3%,接近抹平!
科技竞争从来都是用实力赢得地位和声誉,2025年注定是颠覆之年,只希望中国开源模型百舸争流,共同为中国科技书写辉煌!
热门跟贴