打开网易新闻 查看精彩图片

顶尖AI模型的能力持续提升,OpenAI和Anthropic等头部AI公司正加速冲刺今年晚些时候的IPO。与此同时,公众对AI的抵触情绪持续发酵,在美国尤为明显——多地政府开始支持限制乃至全面禁止新建数据中心。

斯坦福大学以人为本人工智能研究中心发布的2026版AI指数报告,对这一复杂局面进行了全面梳理。这份逾400页的报告汇集了数十项数据与图表,从基准测试成绩到投资规模、再到公众认知,多角度呈现AI的发展面貌。延续往年惯例,本文从报告中提炼出最能概括2026年AI现状的核心趋势。

美国仍是AI模型发布数量最多的国家

过去十年,美国始终引领AI模型发布的浪潮,2025年也不例外。据研究机构Epoch AI统计,2025年美国机构共发布了50个"值得关注"的模型,但中国的产出正在迅速追近。

值得关注的是,几乎所有重要模型均来自产业界,而非学术界或政府机构。Epoch AI追踪到2025年产业界共发布87个值得关注的模型,其他来源仅有7个。这是一个意义深远的长期趋势:产业界发布的模型占比已超过90%,而2015年这一比例不足50%,2003年更是为零。

中国工业机器人装机量遥遥领先

尽管美国在AI模型发布数量上占优,中国在工业机器人部署方面却拥有绝对领先优势。根据国际机器人联合会的数据,2024年中国安装了29.5万台工业机器人,而日本约为4.45万台,美国约为3.42万台。

全球AI算力三年增长三十倍

斯坦福AI指数报告中不乏震撼人心的数字,但最引人瞩目的当属Epoch AI对全球AI总算力的估算。

以英伟达H100e的算力为基准衡量,自2022年以来,全球AI算力每年增长逾三倍,与2021年相比已增长了30倍。英伟达是这轮算力扩张的最大受益者,其GPU占全球AI算力总量的60%以上,亚马逊和谷歌凭借各自的自研AI芯片分列二、三位。

训练前沿大语言模型的碳排放急剧攀升

斯坦福AI指数在往年报告中已就AI训练的碳排放问题发出警示,这一问题如今仍在朝着令人担忧的方向演变。

报告估计,训练xAI的Grok 4等最新前沿大语言模型所产生的碳排放当量超过7.2万吨,远超此前的估算值——OpenAI GPT-4约为5184吨,Meta Llama 3.1 405B约为8930吨。

AI指数指导委员会联席主任雷·佩罗指出,上述数字均为估算值,"对于Grok的估算高度依赖从公开报道(如福布斯文章)、xAI声明及其他无法核实的来源中推断出的数据,存在一定不确定性。"他同时指出,"Epoch AI独立估算Grok 4的碳排放量约为14万吨二氧化碳,远高于上述数字。"

AI推理的碳排放同样持续增加,但各模型间差异显著。报告估计,推理效率最低的模型碳排放量是效率最高模型的10倍以上。DeepSeek V3处理一个"中等长度"提示词时,估计消耗约23瓦电力,而Claude 4 Opus仅消耗约5瓦。

多模态大语言模型攻克基准测试的速度令人叹为观止

过去十年,AI模型的能力以惊人速度提升,且进步势头有加速迹象。多模态大语言模型尤为突出,几乎每出现一个新基准就能迅速攻克。

智能体AI的进步最为显著。OSWorld基准(评估自主计算机操作能力)和SWE-Bench Verified软件工程基准(评估自主编程能力)均呈现出陡峭的上升曲线。

在"人类终极考试"基准测试中,AI的表现也在快速提升。该基准收录了由各领域专家设计的顶级难题。斯坦福2025版AI指数报告显示,当时排名最高的模型OpenAI o1仅能正确回答8.8%的题目;此后准确率已升至38.3%,而截至2026年4月,Anthropic Claude Opus 4.6和谷歌Gemini 3.1 Pro等顶尖模型的得分已突破50%。

尽管如此,佩罗提醒称,基准测试成绩未必能直接反映现实表现:"我们普遍缺乏对系统(或智能体)在特定场景中实际运作效果的衡量标准。一个法律推理基准准确率达75%,并不能告诉我们它在律所实际业务中的适用程度。"

AI在医学领域的应用迅速普及

AI基准测试的进步似乎正在医学领域得到印证,AI的应用渗透速度极快。其中医学研究领域的采用尤为迅猛。过去两年,以AI辅助药物研发为主题的学术论文数量翻了一番以上;将医学影像与文本结合分析的多模态生物医学AI相关论文数量,更是两年前的2.7倍。

AI在读取时钟等日常任务上仍表现糟糕

尽管AI在多个领域取得了快速进展,在某些常见任务上却表现得出奇之差,比如读取时钟和理解日历。

ClockBench基准专门测试多模态大语言模型读取模拟时钟的能力,结果显示即便是表现最好的OpenAI GPT-5.4,答对率也只有五成。大多数模型的表现则更为糟糕——Anthropic Claude Opus 4.6的正确率仅为8.9%。这一结果颇为意外,因为该模型在其他基准测试中往往表现优异(正如前文所述,Claude Opus 4.6在"人类终极考试"中取得了顶尖成绩)。

当然,大语言模型在实际使用中几乎不会被要求执行读取时钟这类任务,但佩罗认为,这一现象折射出一个更深层的问题:"有一类研究表明,当系统被要求处理语言与其他模态(如图像或语音语调等音频信息)相结合的问题时,语言部分承担了出乎意料的大部分处理负担,甚至会完全忽略非语言信息。"

AI投资在2025年再创新高

AI模型性能的提升,与对AI公司的投资热情相互呼应。根据AI分析公司Quid的数据,2025年AI投资规模突破5810亿美元,创下历史新高。

这一数字是2024年2530亿美元的两倍有余,也超过了2021年创下的3600亿美元前纪录。与2021年以并购为主导不同,2025年的创纪录投资由对AI公司的私人融资拉动。其中大部分资金流向美国,去年美国AI领域的投资总额超过3440亿美元。

GitHub上的AI开源项目数量激增

然而,AI的蓬勃发展不仅体现在资本层面,在GitHub上同样可以感受到来自开发者社区的自发热情。截至2025年,GitHub上的AI相关项目已达558万个,较2020年增长约5倍,较2024年增长23.7%。

这一数字并不像是AI生成项目的大量涌入:获得至少10个星标的项目数量以相近速度增长,AI项目获得的总星标数也呈现类似增势,说明这些项目获得了真实的人工关注。开源智能体AI软件OpenClaw已累计获得35.2万个星标,其受欢迎程度可见一斑。

在计算机科学领域,热情同样高涨。过去十年,AI相关计算机科学论文数量翻了一番以上,从10.2万篇增至25.8万篇,其中超过68%仍来自学术界,以机器学习、计算机视觉和生成式AI方向的论文增长最为突出。

生成式AI兴起引发就业担忧,但数据喜忧参半

生成式AI的崛起与就业忧虑相伴而来,全球顶尖AI公司CEO的各种预言无疑加剧了这种担忧。然而,目前的数据仍呈现出复杂面貌。

软件开发者和客服人员被普遍认为是最容易被AI取代的职业群体。数据显示,这两类职业的初级岗位就业人数均有所减少,而中高级职位则保持稳定甚至有所增加。

不过,这些变化很难与更宏观的经济趋势剥离开来。报告指出,失业率在各类职业中普遍上升,而与预期相反,受AI影响最小的工作岗位失业率上升幅度,反而高于受AI影响最大的岗位。

公众对AI的乐观情绪小幅提升

报告中最出人意料的发现,或许是近年来公众对AI的乐观情绪出现了小幅但值得关注的回升。在益普索开展的调查中,59%的受访者表示"AI的好处大于坏处",高于2024年的55%;68%的受访者表示自己对AI有"较好的了解",略高于2024年的67%。

总体而言,公众对AI的态度正面多于负面,但部分负面情绪也有所上升——52%的受访者表示,使用AI的产品和服务会让他们感到"紧张"。

情绪因国家而异,差异显著。东南亚国家及中国、马来西亚、泰国、印度尼西亚、新加坡对AI的态度趋于积极;年度正面情绪变化最大的是德国(+12%)、法国(+10%)和荷兰(+10%);哥伦比亚则出现了最大幅度的负向转变(-6%),与往年趋势相反。

政府监管AI的公众信任度参差不齐

尽管越来越多的人认为AI将带来正面影响,在部分国家——尤其是围绕政府监管议题——仍存在深重的不信任感。

值得关注的是,美国尽管在AI投资方面全球领先,在政府监管AI的公众信任度上却垫底,益普索调查中仅有31%的受访者信任政府对AI的监管能力。许多欧洲国家及日本的信任度同样偏低,而亚洲和南美洲国家的公众对本国政府监管AI的能力则表现出更高的信任度。

美国与哥伦比亚的对比耐人寻味:美国公众对AI监管高度不信任,却普遍认为AI的利大于弊;哥伦比亚则相反,公众对AI监管较为信任,但对AI整体的态度却在恶化。

这一切恰是2025年AI叙事的缩影:无论是AI模型的实际能力,还是公众对AI影响社会的预期,都因具体任务或问题的不同而呈现出巨大差异,往往相去甚远。

Q&A

Q1:2025年全球AI投资规模有多大?主要流向哪些地区?

A:根据AI分析公司Quid的数据,2025年全球AI投资总额突破5810亿美元,创下历史新高,是2024年2530亿美元的两倍有余。其中大部分资金集中流入美国,仅美国一国的AI投资额就超过3440亿美元。与2021年的前纪录不同,2025年的增长主要由对AI公司的私人融资推动,而非并购活动。

Q2:AI模型的碳排放问题有多严重?

A:根据斯坦福AI指数报告的估算,训练xAI的Grok 4等最新前沿大语言模型产生的碳排放当量超过7.2万吨,而Epoch AI的独立估算更高达约14万吨二氧化碳。相比之下,OpenAI GPT-4约为5184吨,Meta Llama 3.1 405B约为8930吨,可见碳排放量随模型规模急剧攀升。AI推理阶段的排放同样不容忽视,效率最低的模型碳排放量是效率最高模型的10倍以上。

Q3:生成式AI的兴起对就业市场产生了哪些影响?

A:目前数据呈现出复杂局面。在被认为最易受AI冲击的软件开发者和客服人员群体中,初级岗位就业人数有所减少,而中高级职位则基本稳定甚至有所增长。值得注意的是,报告发现,受AI影响最小的工作岗位失业率上升幅度,反而高于受AI影响最大的岗位,这与普遍预期相悖,也使AI对就业的实际影响难以从整体经济趋势中单独剥离。