斯坦福大学:《2026年人工智能指数报告》|2026年人工智能指数报告|斯坦福大学|知识库|美国

“21世纪关键技术”关注科技未来发展趋势，研究21世纪前沿科技关键技术的需求，和影响。将不定期推荐和发布世界范围重要关键技术研究进展和未来趋势研究。

来源：21世纪关键技术

斯坦福大学以人为中心的人工智能研究所（HAI）近日发布《2026年人工智能指数报告》，这是该系列的第九版。报告综合独立来源的全球数据，全面追踪人工智能在技术、经济、劳动力、治理与公众认知等维度上的发展轨迹。如果说2025年的报告记录的是人工智能作为主流力量的"到来"，那么这份最新报告试图回答的是：到来之后，发生了什么。

报告联席主席在序言中写道，这项技术的扩张速度，已超出一切围绕它建立的管理体系所能跟上的节奏。这句话，构成了整份报告的核心张力。

资本与规模：一场没有减速迹象的扩张

2025年，全球企业对人工智能的投资总量超过此前任何年份，且增速同样创下历史纪录。私人投资增长127.5%，占全部投资的60%；生成式人工智能的私人融资增长逾200%，几乎占据全部AI私人融资的半壁江山。新获融资的AI企业数量同比增长71%，融资规模超过10亿美元的单笔交易数量几乎翻倍。

美国在这一格局中保持绝对主导地位。2025年，美国私人AI投资达2859亿美元，是中国124亿美元的23倍以上。当年新获融资的AI企业共1953家，是排名第二国家的10倍以上。谷歌母公司Alphabet仅资本支出一项便超过1500亿美元。

但这一领先地位存在内在的隐患。自2017年以来，流入美国的AI研究人员和开发者数量下降了89%，仅在过去一年就下降了80%。资本在集聚，而人才在流失。报告指出，如果这一趋势持续，美国在AI研发生态上的优势可能受到更深层的侵蚀。

与此同时，前沿模型公司的营收正以历史罕见的速度攀升，但计算成本和基础设施开支同样在突破纪录。这意味着，AI经济的规模化并不必然等同于盈利能力的成熟。收入在增长，但支出的增长可能同样凶猛。

普及与价值：比互联网还快，但分布极不均衡

生成式人工智能在三年内实现了约53%的人口普及率，超过个人电脑和互联网在同等时间窗口内的扩散速度。这一数字在报告中被反复引用，因为它不仅是一个技术传播的统计，更折射出一场经济和社会结构的深层变动。

然而，普及率背后的地理分布高度不均。新加坡以61%的采用率领先，阿联酋为54%，两国均超出其收入水平所能预测的数值。美国的数字则令人意外：28.3%，全球排名第24位。普及速度与人均GDP高度相关，但规律并非铁板一块——一些中等收入国家的扩散速度远超预期。

消费者从这些工具中获取的经济价值，也在快速上升。报告估算，截至2026年初，美国消费者从生成式AI工具中获得的年度消费者剩余约达1720亿美元，较一年前的1120亿美元增长54%。更值得注意的是，每位用户的中位价值在2025年至2026年间增长了两倍，而这些工具中大多数仍可免费或近乎免费获取。这一组合——极高价值、极低获取成本——是AI经济区别于大多数历史技术扩散的显著特征之一。

在企业层面，受调查组织中有88%表示正在使用AI，生成式AI已在至少一项业务职能中部署于70%的组织。但与此同时，AI智能体（AI agent）的部署率在几乎所有业务职能中仍处于个位数。这说明，企业的"采用"在很大程度上仍停留在试验和局部应用阶段，真正的流程替代尚未大规模发生。

劳动力冲击：生产率提升与青年就业下滑同步出现

报告对劳动力市场的分析是最令人不安的部分之一，原因在于其揭示的结构性不对称。

在客户支持和软件开发领域，AI辅助工具带来了14%至26%的生产率提升，这是有实证依据的发现。然而，在需要更多判断力的任务中，效果则减弱甚至为负。更关键的是，生产率的提升并未平均分配于劳动力市场的各个层级。在AI赋能效果最为显著的软件开发领域，美国22岁至25岁的开发者就业率从2024年起下降了近20%，而资深开发者的就业人数却仍在增长。

这一发现印证了多项独立研究所提出的"资历偏向型技术变革"假说：AI倾向于替代初级劳动力，而使高级职位受益。报告将年轻开发者称为"煤矿里的金丝雀"——他们的就业恶化，是整个劳动力市场深层变动的早期信号，而这一信号早在ChatGPT面世之前的2022年便已出现。

麦肯锡的调查数据显示，在软件工程和制造业职能中，受访者将AI与最高成本节约相关联的比例为56%，而在营销与销售、战略与财务等职能中，AI被认为能带来最高收入增长的比例超过60%。用一个更简单的方式概括：在哪里省钱，就在哪里裁人；在哪里赚钱，就在哪里留人。

教育体系的滞后使这一问题更加突出。超过80%的美国高中生和大学生已将AI用于学习相关任务，但只有一半的中学和高中出台了AI使用政策，且仅有6%的教师认为这些政策是清晰的。新增AI博士数量从2022年到2024年增长了22%，但增量部分的毕业生选择进入学术界，而非产业界。

技术边界与治理空白

在技术层面，报告描绘了一幅前沿模型趋于收敛的图景。在Arena等主流评测平台上，头部供应商的模型Elo分数彼此相差无几，Anthropic、xAI、Google之间的差距已不足以产生实质性区分。基准测试的饱和问题——即模型分数高到测试本身失去区分能力——正在成为系统性挑战。为此而设计的"更难"测试，往往在数年内便被模型突破。

与此同时，前沿实验室在负责任AI评测方面的信息披露极为稀少。报告梳理了多项涵盖安全性、公平性、事实可靠性的评测基准，发现大多数模型条目为空白——前沿实验室并非不做内部评测，但它们极少使用外部可比的标准化基准进行披露。这使得独立验证几乎无从实现。在科学领域，前沿模型已在化学基准测试上平均优于人类化学家，但在天体物理学的论文复现任务上得分却低于20%，在地球观测问题上得分33%。大模型并不必然优于小模型，一个1.11亿参数的蛋白质语言模型在ProteinGym基准上击败了参数量大近200倍的竞争模型。

AI的环境代价同样在快速累积。Grok 4的训练估计排放了72816吨二氧化碳当量。全球AI数据中心的电力容量已达29.6吉瓦，相当于纽约州峰值用电量。GPT-4o的推理过程每年消耗的水量，可能超过1200万人的饮用水需求。

在政策领域，2025年出现了方向上的明显分歧。欧盟《人工智能法案》的首批禁止条款开始生效，日本、韩国和意大利分别通过了本国AI立法；与此同时，美国联邦层面转向放松监管，而各州立法机构通过的AI相关法案数量却创下历史纪录。超过一半新采纳国家AI战略的国家来自发展中国家，表明"AI主权"已成为一个跨越发展阶段的政策关切。

公众认知方面，报告追踪了覆盖30余个国家的多项大规模调查。全球对AI的乐观情绪在2025年上升，但焦虑感同步增加。专家与公众之间存在巨大认知鸿沟：73%的AI专家预期AI对工作方式有积极影响，而持同样看法的公众仅占23%，差距高达50个百分点。美国公众对本国政府监管AI的信任度仅为31%，是受调查国家中最低的。在全球范围内，欧盟被认为比美国或中国更值得信赖地监管AI。

报告最终呈现的，是一幅内部充满张力的图景：技术在加速，资本在集中，普及在扩散，但治理体系、评测方法、教育机构乃至用于追踪AI影响的数据基础设施，均未能跟上这一节奏。正如报告序言所言，"数据并不指向单一方向。它揭示的是一个扩张速度超过周围系统适应能力的领域。"这句话，既是诊断，也是警告。

阅读最新前沿科技趋势报告，请访问21世纪关键技术研究院的“未来知识库”

未来知识库是 “21世纪关键技术研究院”建立的在线知识库平台，收藏的资料范围包括人工智能、脑科学、互联网、超级智能，数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。

截止到2月28日 ”未来知识库”精选的百部前沿科技趋势报告

（加入未来知识库，全部资料免费阅读和下载）