全球领先的AI研究机构Artificial Analysis发布了最新的中国AI大模型的报告,其中对比了中美两国在AI大模型的各项数据。我们可以一窥中国大模型在全球的格局和地位。

人工智能在领导力领域的崛起

趋势:中国AI实验室(如DeepSeek、阿里巴巴)逐步缩小与美国(如OpenAI、Anthropic)的差距,部分中国模型(如DeepSeek R1)接近o1级智能(推测为性能等级)。

关键技术趋势

2024年底中国密集发布高性能模型(如DeepSeek V3),中美模型智能差距显著缩小。OpenAI于2024Q3首创“先思考后回答”的推理模型,中国实验室(如DeepSeek)快速跟进,已具备与c1级(对标标准)相当的推理能力。DeepSeek、阿里巴巴的开源模型(如Owen系列)接近o1级智能,推动技术普惠。

2024年底,DeepSeek取代阿里巴巴成为中国AI模型发布的领跑者,持续推出新模型(如R1、V3系列)。

中国AI实验室虽起步较晚,但2024年迅速缩小与美国顶尖模型(如OpenAI的O1)的差距,DeepSeek R1对标美国同类模型仅耗时数月。

开源模型全球竞争力:中国实验室(如DeepSeek、阿里巴巴、腾讯)发布的开源权重模型已达全球前沿水平。

2025年初,中国实验室(DeepSeek、阿里巴巴、月之暗面、智谱等)密集发布前沿推理模型,发布速度和数量表明其技术已不再落后。

美国在语言模型领域保持整体领先,多个模型得分较高(如OpenAI的o3和o1.得分94和90)。中国紧随其后,部分模型得分接近美国(如DeepSeek和o1-mini,得分89)。法国、加拿大和以色列等国家也有部分模型进入榜单,但得分相对较低(如加拿大的AI21 Labs模型得分为55)。

多个中国AI实验室已经展示了或声称达到了前沿级别的智能水平。其中,有七个模型具备推理能力。图表显示了中国AI实验室开发的模型在“Artificial Analysis Intelligence Index”中的得分。总体来看,中国AI实验室在语言模型领域,尤其是在推理能力方面,取得了显著进展,与美国的模型表现相当。

阿里巴巴、百度、字节跳动、华为和腾讯等公司发布了多个AI语言模型,涵盖推理和非推理能力。这些公司通过开放权重模型和专有模型推动AI技术发展。

主要AI模型及智能得分

阿里巴巴:Qwen 2.5 Max(79分)、QwQ(78分)。

百度:Ernie 4.0 Turbo(76分)。

字节跳动:Doubao 1.5 Lite(77分)、Doubao 1.5 Pro(80分)。

华为:Pangu 5.0 Large(74分)。

腾讯:混元Large(74分)。

中国AI初创公司,在中国大型科技公司和政府的支持下,这些公司开发了世界领先的开放权重模型。

主要AI模型及智能得分

MiniMax:MiniMax-Text-01(非推理,76分)、Kimi k1.5(推理,87分)。

Moonshot AI:V1-128k(非推理,52分)。

01.AI:Yi-Lightning(非推理,73分)、R1(推理,89分)。

DeepSeek AI:V3(非推理,79分)、GLM-Zero-Preview(推理,81分)。

Zhipu.AI:GLM-4-Plus(非推理,70分)。

Baichuan智能:Baichuan 4-Turbo(非推理,65分)、Baichuan M1-Preview(推理,83分)。

Stepfun:Step-2-16k(非推理,82分)、Step-R-mini(推理,84分)。

美国对中国出口高端AI加速器的限制时间线,以及NVIDIA GPU在不同限制下的状态。

美国对中国出口高端AI加速器的限制时间线及具体措施。

影响:TPP ≥ 4.800 或 TPP ≥ 1.600 且 PD ≥ 5.92.

特朗普政府可能进一步扩大受限芯片范围,H20可能被加入限制清单。总体来看,美国对NVIDIA高端GPU的出口限制严格,但H20和L20目前不受影响。

未来,中美AI竞争将继续推动技术发展。尽管美国在高端AI芯片出口方面对中国实施了严格限制,但中国AI实验室在语言模型方面取得了显著进展,全球AI技术的应用前景将更加广阔。

以上内容引自:Artificial Analysis。