揭示2026年AI发展现状：投资暴涨，就业与公众认知却喜忧参半|基准|推理|智能体|模态

顶尖AI模型的能力持续提升，OpenAI和Anthropic等头部AI公司正加速冲刺今年晚些时候的IPO。与此同时，公众对AI的抵触情绪持续发酵，在美国尤为明显——多地政府开始支持限制乃至全面禁止新建数据中心。

斯坦福大学以人为本人工智能研究中心发布的2026版AI指数报告，对这一复杂局面进行了全面梳理。这份逾400页的报告汇集了数十项数据与图表，从基准测试成绩到投资规模、再到公众认知，多角度呈现AI的发展面貌。延续往年惯例，本文从报告中提炼出最能概括2026年AI现状的核心趋势。

美国仍是AI模型发布数量最多的国家

过去十年，美国始终引领AI模型发布的浪潮，2025年也不例外。据研究机构Epoch AI统计，2025年美国机构共发布了50个"值得关注"的模型，但中国的产出正在迅速追近。

值得关注的是，几乎所有重要模型均来自产业界，而非学术界或政府机构。Epoch AI追踪到2025年产业界共发布87个值得关注的模型，其他来源仅有7个。这是一个意义深远的长期趋势：产业界发布的模型占比已超过90%，而2015年这一比例不足50%，2003年更是为零。

中国工业机器人装机量遥遥领先

尽管美国在AI模型发布数量上占优，中国在工业机器人部署方面却拥有绝对领先优势。根据国际机器人联合会的数据，2024年中国安装了29.5万台工业机器人，而日本约为4.45万台，美国约为3.42万台。

全球AI算力三年增长三十倍

斯坦福AI指数报告中不乏震撼人心的数字，但最引人瞩目的当属Epoch AI对全球AI总算力的估算。

以英伟达H100e的算力为基准衡量，自2022年以来，全球AI算力每年增长逾三倍，与2021年相比已增长了30倍。英伟达是这轮算力扩张的最大受益者，其GPU占全球AI算力总量的60%以上，亚马逊和谷歌凭借各自的自研AI芯片分列二、三位。

训练前沿大语言模型的碳排放急剧攀升

斯坦福AI指数在往年报告中已就AI训练的碳排放问题发出警示，这一问题如今仍在朝着令人担忧的方向演变。

报告估计，训练xAI的Grok 4等最新前沿大语言模型所产生的碳排放当量超过7.2万吨，远超此前的估算值——OpenAI GPT-4约为5184吨，Meta Llama 3.1 405B约为8930吨。

AI指数指导委员会联席主任雷·佩罗指出，上述数字均为估算值，"对于Grok的估算高度依赖从公开报道（如福布斯文章）、xAI声明及其他无法核实的来源中推断出的数据，存在一定不确定性。"他同时指出，"Epoch AI独立估算Grok 4的碳排放量约为14万吨二氧化碳，远高于上述数字。"

AI推理的碳排放同样持续增加，但各模型间差异显著。报告估计，推理效率最低的模型碳排放量是效率最高模型的10倍以上。DeepSeek V3处理一个"中等长度"提示词时，估计消耗约23瓦电力，而Claude 4 Opus仅消耗约5瓦。

多模态大语言模型攻克基准测试的速度令人叹为观止

过去十年，AI模型的能力以惊人速度提升，且进步势头有加速迹象。多模态大语言模型尤为突出，几乎每出现一个新基准就能迅速攻克。

智能体AI的进步最为显著。OSWorld基准（评估自主计算机操作能力）和SWE-Bench Verified软件工程基准（评估自主编程能力）均呈现出陡峭的上升曲线。

在"人类终极考试"基准测试中，AI的表现也在快速提升。该基准收录了由各领域专家设计的顶级难题。斯坦福2025版AI指数报告显示，当时排名最高的模型OpenAI o1仅能正确回答8.8%的题目；此后准确率已升至38.3%，而截至2026年4月，Anthropic Claude Opus 4.6和谷歌Gemini 3.1 Pro等顶尖模型的得分已突破50%。

尽管如此，佩罗提醒称，基准测试成绩未必能直接反映现实表现："我们普遍缺乏对系统（或智能体）在特定场景中实际运作效果的衡量标准。一个法律推理基准准确率达75%，并不能告诉我们它在律所实际业务中的适用程度。"

AI在医学领域的应用迅速普及

AI基准测试的进步似乎正在医学领域得到印证，AI的应用渗透速度极快。其中医学研究领域的采用尤为迅猛。过去两年，以AI辅助药物研发为主题的学术论文数量翻了一番以上；将医学影像与文本结合分析的多模态生物医学AI相关论文数量，更是两年前的2.7倍。

AI在读取时钟等日常任务上仍表现糟糕

尽管AI在多个领域取得了快速进展，在某些常见任务上却表现得出奇之差，比如读取时钟和理解日历。

ClockBench基准专门测试多模态大语言模型读取模拟时钟的能力，结果显示即便是表现最好的OpenAI GPT-5.4，答对率也只有五成。大多数模型的表现则更为糟糕——Anthropic Claude Opus 4.6的正确率仅为8.9%。这一结果颇为意外，因为该模型在其他基准测试中往往表现优异（正如前文所述，Claude Opus 4.6在"人类终极考试"中取得了顶尖成绩）。

当然，大语言模型在实际使用中几乎不会被要求执行读取时钟这类任务，但佩罗认为，这一现象折射出一个更深层的问题："有一类研究表明，当系统被要求处理语言与其他模态（如图像或语音语调等音频信息）相结合的问题时，语言部分承担了出乎意料的大部分处理负担，甚至会完全忽略非语言信息。"

AI投资在2025年再创新高

AI模型性能的提升，与对AI公司的投资热情相互呼应。根据AI分析公司Quid的数据，2025年AI投资规模突破5810亿美元，创下历史新高。

这一数字是2024年2530亿美元的两倍有余，也超过了2021年创下的3600亿美元前纪录。与2021年以并购为主导不同，2025年的创纪录投资由对AI公司的私人融资拉动。其中大部分资金流向美国，去年美国AI领域的投资总额超过3440亿美元。

GitHub上的AI开源项目数量激增

然而，AI的蓬勃发展不仅体现在资本层面，在GitHub上同样可以感受到来自开发者社区的自发热情。截至2025年，GitHub上的AI相关项目已达558万个，较2020年增长约5倍，较2024年增长23.7%。

这一数字并不像是AI生成项目的大量涌入：获得至少10个星标的项目数量以相近速度增长，AI项目获得的总星标数也呈现类似增势，说明这些项目获得了真实的人工关注。开源智能体AI软件OpenClaw已累计获得35.2万个星标，其受欢迎程度可见一斑。

在计算机科学领域，热情同样高涨。过去十年，AI相关计算机科学论文数量翻了一番以上，从10.2万篇增至25.8万篇，其中超过68%仍来自学术界，以机器学习、计算机视觉和生成式AI方向的论文增长最为突出。

生成式AI兴起引发就业担忧，但数据喜忧参半

生成式AI的崛起与就业忧虑相伴而来，全球顶尖AI公司CEO的各种预言无疑加剧了这种担忧。然而，目前的数据仍呈现出复杂面貌。

软件开发者和客服人员被普遍认为是最容易被AI取代的职业群体。数据显示，这两类职业的初级岗位就业人数均有所减少，而中高级职位则保持稳定甚至有所增加。

不过，这些变化很难与更宏观的经济趋势剥离开来。报告指出，失业率在各类职业中普遍上升，而与预期相反，受AI影响最小的工作岗位失业率上升幅度，反而高于受AI影响最大的岗位。

公众对AI的乐观情绪小幅提升

报告中最出人意料的发现，或许是近年来公众对AI的乐观情绪出现了小幅但值得关注的回升。在益普索开展的调查中，59%的受访者表示"AI的好处大于坏处"，高于2024年的55%；68%的受访者表示自己对AI有"较好的了解"，略高于2024年的67%。

总体而言，公众对AI的态度正面多于负面，但部分负面情绪也有所上升——52%的受访者表示，使用AI的产品和服务会让他们感到"紧张"。

情绪因国家而异，差异显著。东南亚国家及中国、马来西亚、泰国、印度尼西亚、新加坡对AI的态度趋于积极；年度正面情绪变化最大的是德国（+12%）、法国（+10%）和荷兰（+10%）；哥伦比亚则出现了最大幅度的负向转变（-6%），与往年趋势相反。

政府监管AI的公众信任度参差不齐

尽管越来越多的人认为AI将带来正面影响，在部分国家——尤其是围绕政府监管议题——仍存在深重的不信任感。

值得关注的是，美国尽管在AI投资方面全球领先，在政府监管AI的公众信任度上却垫底，益普索调查中仅有31%的受访者信任政府对AI的监管能力。许多欧洲国家及日本的信任度同样偏低，而亚洲和南美洲国家的公众对本国政府监管AI的能力则表现出更高的信任度。

美国与哥伦比亚的对比耐人寻味：美国公众对AI监管高度不信任，却普遍认为AI的利大于弊；哥伦比亚则相反，公众对AI监管较为信任，但对AI整体的态度却在恶化。

这一切恰是2025年AI叙事的缩影：无论是AI模型的实际能力，还是公众对AI影响社会的预期，都因具体任务或问题的不同而呈现出巨大差异，往往相去甚远。

Q&A

Q1：2025年全球AI投资规模有多大？主要流向哪些地区？

A：根据AI分析公司Quid的数据，2025年全球AI投资总额突破5810亿美元，创下历史新高，是2024年2530亿美元的两倍有余。其中大部分资金集中流入美国，仅美国一国的AI投资额就超过3440亿美元。与2021年的前纪录不同，2025年的增长主要由对AI公司的私人融资推动，而非并购活动。

Q2：AI模型的碳排放问题有多严重？

A：根据斯坦福AI指数报告的估算，训练xAI的Grok 4等最新前沿大语言模型产生的碳排放当量超过7.2万吨，而Epoch AI的独立估算更高达约14万吨二氧化碳。相比之下，OpenAI GPT-4约为5184吨，Meta Llama 3.1 405B约为8930吨，可见碳排放量随模型规模急剧攀升。AI推理阶段的排放同样不容忽视，效率最低的模型碳排放量是效率最高模型的10倍以上。

Q3：生成式AI的兴起对就业市场产生了哪些影响？

A：目前数据呈现出复杂局面。在被认为最易受AI冲击的软件开发者和客服人员群体中，初级岗位就业人数有所减少，而中高级职位则基本稳定甚至有所增长。值得注意的是，报告发现，受AI影响最小的工作岗位失业率上升幅度，反而高于受AI影响最大的岗位，这与普遍预期相悖，也使AI对就业的实际影响难以从整体经济趋势中单独剥离。