REPORT

斯坦福 AI 指数报告(AI Index Report) 由斯坦福「以人为本人工智能研究院」(HAI)每年发布,追踪、整合并可视化 AI 领域的各类数据

刚刚,「斯坦福 AI 指数报告 2026」发布,423 页,9 个章节

与 相比,今年新增了两个独立章节:AI 与科学、AI 与医疗,同时新增了 AI 主权分析框架和生成式 AI 的消费者价值估算

过去两年,我每年都会进行完整解读,今年自然也不例外,先说 15 条核心要点,然后逐章展开

打开网易新闻 查看精彩图片

https://hai.stanford.edu/ai-index/2026-ai-index-report

15 条核心要点

1. AI 能力没有停滞,还在加速。 行业贡献了超过 90% 的前沿模型,多个模型在博士级科学问题、多模态推理和竞赛数学上达到或超过人类基准。SWE-bench Verified 上一年内从 60% 涨到接近 100%。组织采用率达 88%,五分之四的大学生在用生成式 AI

打开网易新闻 查看精彩图片

AI 各项能力 Benchmark 达到人类水平的时间线,来自斯坦福 HAI

2. 中美模型性能差距基本消失。 2025 年 2 月 DeepSeek-R1 一度追平美国最强模型,截至 2026 年 3 月 Anthropic 最强模型仅领先 2.7%。美国在前沿模型数量和高影响力专利上领先,中国在论文数量、引用、专利总量和工业机器人安装量上领先。韩国在人均 AI 专利数上全球领先

打开网易新闻 查看精彩图片

中美模型 Arena Elo 评分对比,差距从 2023 年的显著领先收窄到 2.7%

3. 美国拥有最多 AI 数据中心,大部分芯片由一家台湾代工厂制造。 美国有 5427 个数据中心,是第二名的 10 倍以上。TSMC 一家公司制造了几乎所有领先 AI 芯片,全球 AI 硬件供应链依赖台湾一座代工厂。TSMC 美国扩产计划在 2025 年开始运营

4. AI 能拿 IMO 金牌但看不准时钟,研究者称之为「锯齿边界」。 Gemini Deep Think 在国际数学奥赛拿了金牌(35 分),但最强模型看模拟时钟的准确率只有 50.1%。AI Agent 在 OSWorld 上从 12% 跳到约 66%,但每 3 次结构化测试还是会失败 1 次

5. 机器人在家庭任务中依然失败率极高,尽管在受控环境中表现出色。 机器人在真实家庭任务中成功率只有 12%。RLBench 模拟环境中达到了 89.4%,但可控实验室和不可预测家庭环境之间的差距依然巨大

6. 负责任 AI 跟不上能力进步,安全基准滞后,事件急剧增加。 几乎所有前沿模型开发商都报告能力 Benchmark 成绩,但在负责任 AI Benchmark 上的报告依然稀疏。AI 事件数据库记录的事件从 2024 年的 233 起上升到 2025 年的 362 起。改善一个负责任 AI 维度(比如安全)可能会恶化另一个(比如准确性)

打开网易新闻 查看精彩图片

AI 事件数量 2013-2025,2025 年达到 362 起

7. 美国在 AI 投资上领先,但吸引全球人才的能力在下降。 美国私人 AI 投资达到 2859 亿美元,是中国 124 亿的 23 倍。但纯看私人投资低估了中国的实际投入,政府引导基金在 2000-2023 年间向 AI 企业注入了约 1840 亿美元。2025 年美国新获资 AI 公司 1953 家,是第二名的 10 倍以上。但流向美国的 AI 研究者和开发者人数自 2017 年下降了 89%,仅最近一年就下降了 80%

生成式 AI 三年达到 53% 的人口渗透率,比 PC 和互联网都快

8. AI 采用以历史性速度扩散,消费者从免费工具中获得大量价值。 渗透率与人均 GDP 强相关,但也有例外:新加坡 61%,阿联酋 54%。美国排第 24 位,28.3%。美国消费者从生成式 AI 获得的估算年化价值到 2026 年初达到 1720 亿美元,每用户中位价值一年内翻了三倍。大多数工具是免费或接近免费的

9. AI 带来的生产率提升,恰好出现在入门级就业开始下降的领域。 客户支持和软件开发中生产率提升 14%-26%,需要更多判断力的任务中效果更弱甚至为负。AI Agent 部署在几乎所有业务功能中都处于个位数。22-25 岁软件开发者就业人数较 2024 年下降近 20%,同时年长开发者的人数仍在增长。

10. AI 的环境足迹随能力一起扩大。 Grok 4 的训练碳排放达到 72,816 吨 CO2 当量。AI 数据中心功率容量达 29.6 GW,相当于纽约州峰值用电量。GPT-4o 单年推理用水量可能超过 1200 万人的饮用水需求

11. 科学 AI 模型可以超越人类科学家,但更大的模型并不总是更好。 前沿模型在 ChemBench 上平均超过人类化学家,但在天体物理学论文复现上低于 20%,地球观测问题上只有 33%。1.11 亿参数的 MSAPairformer 在 ProteinGym 上打败了之前的领先方法,2 亿参数的 GPN-Star 打败了近 200 倍大的模型。大多数科学 AI 基础模型来自跨部门合作,与通用 AI 的工业主导格局形成对比

12. AI 正在改变临床医疗,但严谨证据仍然有限。 自动生成临床笔记的 AI 工具在 2025 年被大规模采用,医生写笔记时间减少 83%,职业倦怠显著下降。但证据基础依然薄弱:超过 500 项临床 AI 研究中近半使用考试题而非真实患者数据,只有 5% 使用了真实临床数据

13. 正规教育落后于 AI,但人们在人生每个阶段都在学习 AI 技能。 超过 80% 的美国高中生和大学生在用 AI 做作业,但只有一半的中学有 AI 政策,只有 6% 的教师认为这些政策是清晰的。课堂之外,AI 工程技能增长最快的国家是阿联酋、智利和南非。美国和加拿大新增 AI 博士数量从 2022 到 2024 年增长 22%,增量全部流向了学术界

14. AI 主权正在成为国家政策的核心特征,但能力分布仍然不均。 国家 AI 战略正在扩展,特别是在发展中经济体中。国家级 AI 超算投资也在同步增长。但模型生产仍集中在美中两国。开源开发正在重新分配参与权,来自「世界其他地区」的 GitHub 贡献已超过欧洲,正在接近美国

15. AI 专家和公众对技术未来的看法截然不同,全球对机构管理 AI 的信任是碎片化的。 在就业影响上,73% 的专家持积极态度,公众只有 23%,差距 50 个百分点。经济影响差距 48 个百分点,医疗差距 40 个百分点。美国对自己政府监管 AI 的信任度全球最低,31%。全球范围内,欧盟被认为比美国或中国更可信地监管 AI

打开网易新闻 查看精彩图片

AI 专家 vs 公众对 AI 影响各维度的看法差异

第一章:研发

2025 年全球共发布 95 个 notable models,同比有所下降。美国 50 个,中国 30 个,韩国 5 个。按机构:OpenAI 19 个,Google 12 个,阿里巴巴 11 个,Anthropic 7 个,xAI 5 个。91.6% 来自产业界。 纯学术界只产出了 1 个

透明度崩塌是今年报告最值得注意的趋势之一。 95 个 notable models 中有 80 个没有公开训练代码,只有 4 个开源了训练代码。2020 年开源和未公开大致对半,到 2025 年前沿模型变成了能力最强、透明度最低的存在

打开网易新闻 查看精彩图片

全球数据中心分布,美国 5427 个,超过第二名德国(529 个)10 倍以上

全球 AI 算力容量以每年约 3.3 倍增长,达到 1710 万 H100 等效算力。 Nvidia 占 60% 以上,Google 和 Amazon 提供大部分剩余,华为持有小但增长中的份额。整个全球 AI 硬件供应链依赖一个点:台积电。包括 Nvidia 的 Blackwell GPU 和 AMD 的 MI300X 都由台积电代工

环境代价在快速增长。训练 Grok 4 碳排放 72,816 吨 CO2 当量,超过一辆普通汽车全生命周期(约 63 吨)。DeepSeek v3 只产生了约 597 吨,远低于同等规模的模型。AI 数据中心总功率达 29.6 GW,和纽约州峰值用电量(31 GW)差不多。GPT-4o 单年推理用水量可能超过 1200 万人的饮用水需求

Epoch AI 预测高质量文本数据将在 2026-2032 年之间耗尽。 截至 2025 年 1 月,超过 50% 的新发布网络内容是 AI 生成的。各大公司开始转向授权数据(纽约时报和亚马逊签了协议,Meta 也在和新闻机构谈)。但数据质量可能比数量更重要:OLMo 3.1 Think 32B 只有 320 亿参数(Grok 4 的约 1/90),通过数据清洗和去重,在 AIME 2025 上达到了 78.1%

开源方面,GitHub 上 AI 项目达 560 万个,Hugging Face 上传量三年翻了三倍。地理分布在变化:美国占 31.7%(2011 年是 80%),「其他国家」27.6%,欧洲 24.5%,中国 11%。Hugging Face 上文本生成模型从 2022 年占 10.63% 上升到 2025 年的 42.46%

人才数据是这一章里最值得注意的部分

美国仍然是全球 AI 人才最多的国家(220,520 人),但净流入在急剧下降:从 2022 年的峰值 324.6 降到 2025 年的 26.0,接近归零。迁入美国的 AI 研究者数量自 2017 年以来下降了 89%。瑞士和新加坡在人均 AI 研究者和开发者数量上全球领先。性别差距 15 年来没有变化,各国女性比例在 18%-32% 之间

打开网易新闻 查看精彩图片

流向美国的 AI 人才数量 2012-2025,净流入接近归零

第二章:技术性能

前沿模型正在趋同。 Arena 排行榜上,Anthropic(1503)、xAI(1495)、Google(1494)、OpenAI(1481)、阿里巴巴(1449)和 DeepSeek(1424)全部挤在 Elo 评分的顶部区间。2023 年初 OpenAI 领先 Google 205 分,现在这个差距没了。能力不再是明确的差异化因素,竞争正在转向成本、延迟、可靠性和垂直性能

开放权重模型的差距在 2025 年重新拉大了。2024 年 8 月差距一度缩到 0.5%,2026 年 3 月回到了 3.3%。Arena 排行榜前 10 中有 6 个是闭源模型

中美差距:2025 年 2 月 DeepSeek-R1 和美国顶级模型只差 5 个 Elo 分(0.4%),2026 年 3 月差距是 39 分(2.7%)。DeepSeek-R1 用 GRPO 做强化学习,不需要标注数据也不需要 critic model,一度导致美国科技股蒸发超过 1 万亿美元市值

Benchmark 饱和的问题越来越严重。 设计出来要用好几年的 Benchmark 几个月就饱和了。HLE(Humanity's Last Exam)一年内从不到 10% 涨到 38.3%。GPQA Diamond(博士级科学)模型 93%,人类专家 81.2%。但 Benchmark 本身的质量也在下降:9 个常用 Benchmark 的无效题目比例从 2%(MMLU 数学)到 42%(GSM8K)不等

打开网易新闻 查看精彩图片

能拿 IMO 金牌,但读模拟时钟准确率只有 50.1%。人类 90.1%

当模型读错时钟时,误差中位数是 1-3 小时,人类是 3 分钟。MMLU-Pro 上前 15 名模型全部在 87% 以上,整个前沿的差距只有 4 个百分点。SWE-bench Verified 上从约 60% 逼近 100%。Terminal-Bench 2.0 从 2025 年 2 月的 20% 涨到 77.3%。Vibe Code Bench(从零构建完整 Web 应用)Claude Opus 4.6 领先,但也只有 56.5%

Agent 进展快但离可靠有距离:GAIA(通用 AI 助手)从 20% 涨到 74.5%,人类 92%。OSWorld(真实电脑操作)最好的模型 66.3%,人类 72.35%,差 6 个百分点。WebArena(自主网页 Agent)从 15% 涨到 74.3%,人类 78.2%。Cybench(网络安全 CTF)从 15% 涨到 93%

自动驾驶是 AI 进入物理世界最成功的案例。Waymo 在五个美国城市达到每周约 45 万次出行。 中国的 Apollo Go 完成了 1100 万次完全无人驾驶出行,同比增长 175%。人形机器人硬件在 2025 年快速增长(Figure AI、特斯拉、波士顿动力、宇树等),Figure 02 在宝马工厂加载了 9 万多个零件。但 BEHAVIOR-1K(1000 个家务任务)完成率只有 12.4%,大规模部署尚未发生

第三章:负责任的 AI

AI Incident Database 在 2025 年记录了 362 起事件,2024 年是 233 起,2022 年之前每年不到 100 起。2025 年 7 月,xAI 的 Grok 在一次系统更新放松安全过滤器后,生成了反犹言论和暴力仇恨言语

透明度倒退。 Foundation Model Transparency Index(FMTI)平均分从 2024 年的 58 分跌到 2025 年的 40 分。IBM 以 95 分领先,Claude 4 得 41 分,Gemini 2.5 得 39 分,Grok 3 只有 14 分。几乎所有前沿模型的预训练数据透明度得分为零

幻觉率在不同 Benchmark 上差异巨大。Vectara 的 HHEM 排行榜显示 1.8%-5.4%(文档摘要场景),但 AA-Omniscience 测试(跨 6 领域 6000 个问题)显示幻觉率从 22% 到 94% 不等。GPT-4o 在「用户信念」场景下准确率从 98.2% 跌到 64.4%,DeepSeek R1 从 90%+ 跌到 14.4%

组织层面有进展:AI 专职治理岗位增长 17%,没有负责任 AI 政策的企业从 24% 降到 11%。主要障碍是知识差距(59%)、预算限制(48%)和监管不确定性(41%)

AI 在英语之外的表现差距比全球 Benchmark 所反映的要大得多

在 HELM Arabic 上,一个为阿拉伯语专门开发的区域模型超过了 GPT-5.1 和 Gemini 2.5 Flash。在斯洛文尼亚语常识推理测试中,用方言测试时多个领先模型的准确率损失接近一半

安全评估方面,在 AILuminate Benchmark 上多个前沿模型在正常条件下获得「非常好」或「好」的安全评级,但面对对抗性越狱攻击时所有模型的安全性能都出现下降

负责任 AI 的各个维度之间存在冲突,并且这个问题比想象中更棘手。差分隐私提升了隐私保护,但降低了公平性、可解释性和准确性(准确率下降高达 33 个百分点)。目前没有任何框架能解决这个 trade-off

第四章:经济

全球 AI 企业投资总额达到 5816 亿美元,同比增长约 130%,约为 2013 年的 40 倍。私人投资增长 127.5%,达到 3447 亿美元。GenAI 拿走了 1709 亿(接近一半),增长超过 200%。超 10 亿美元融资事件从 15 起增长到 28 起

大额交易:OpenAI 融资 400 亿(估值 3000 亿),Anthropic 融资 130 亿(估值 1830 亿),Anysphere(Cursor)23 亿(估值 293 亿),CoreWeave IPO 估值 230 亿。Stargate 项目宣布 5000 亿,中国设立 1380 亿国家 VC 基金

美国私人 AI 投资 2859 亿美元,是中国(124 亿)的 23 倍。但中国政府引导基金在 2000-2023 年间投入约 1840 亿。自 2013 年以来美国累计吸引了 7573 亿美元 AI 私人投资

营收方面,OpenAI 年化收入约 250 亿美元。 Anthropic 约 190 亿。xAI 约 4.28 亿。OpenAI 的收入增速超过了 Uber 和 Moderna 在类似阶段的表现。但 Google 2025 年资本支出超过 1500 亿,算力成本在快速攀升

打开网易新闻 查看精彩图片

生成式 AI 在三年内达到 53% 人口渗透率,比 PC 和互联网都快

GenAI 工具给美国消费者带来的年度剩余价值估算达 1720 亿美元。 一年前是 1120 亿。使用 GenAI 的美国成年人从 9500 万增加到 1.25 亿,每用户中位价值从 3.40 美元涨到 11.40 美元(+235%)。这个消费者剩余远超 GenAI 企业的收入总和。各国差异大:阿联酋 64%,新加坡 61%,法国 44%,美国排第 24 位只有 28.3%

企业层面,88% 的组织在至少一个业务功能中使用了 AI。但 AI Agent 的采用仍处于早期,几乎所有业务功能中大规模使用 Agent 的比例都是个位数

22-25 岁软件开发者就业人数从 2022 年峰值到 2025 年 9 月下降近 20%

在 AI 暴露程度最高的职业中,22-25 岁工人的就业相对暴露最低的职业下降了约 16%。自 GenAI 引入以来的职业流动速度,快于计算机和互联网引入后的同期速度。三分之一的组织预计 AI 将在未来一年减少员工

生产率提升在结构化工作中最明显。客户支持 14%-15%(Brynjolfsson et al.),软件开发 26%(Cui et al.,GitHub Copilot),营销产出 50%(Ju & Aral),会计 55%(Choi & Xie)。METR 的研究发现经验丰富的开源开发者反而慢了 19%(但后续未能复现)。依赖 AI 学习的软件工程师没有表现出可测量的速度提升,研究者称之为「学习惩罚」

宏观层面,美国 2025 年生产率增长达 2.7%,接近过去十年 1.4% 平均值的两倍。Brynjolfsson 将此解读为「J 曲线」的早期阶段。12,000 家欧洲企业的研究发现 AI 采用提升了 4% 的劳动生产率

中国继续安装全球一半以上的工业机器人(2024 年 54%),差距还在扩大。台湾以 33% 的同比增长率领跑

第五章:科学

今年新独立的章节,与 Schmidt Sciences 合作开发

AI 相关科学论文在 2025 年达到约 80,150 篇,同比增长 26%。AI 方法占科学研究产出的 5.8%-8.8%,2010 年低于 1%。地球科学的 AI 渗透率最高(8.8%),其次是整体自然科学(6.8%)和生命科学(6.5%)

AI 在科学中的角色分三个层次:第一层是传统的科学数据机器学习,已经成熟;第二层是辅助科学家工作流(文献综合、实验设计、数据分析),2025 年大幅扩展;第三层是自主发现,仍在早期阶段

在分子生物学领域,小模型在打败大模型 MSAPairformer 只有 1.11 亿参数,在 ProteinGym 上打败了之前的领先方法。GPN-Star 2 亿参数的基因组学模型打败了近 200 倍大的模型

虚拟细胞模型在 2025 年出现突破,包括 Arc Institute 的 Evo 2(400 亿参数,训练数据 9.3 万亿碱基对,全开源)、STATE 和 DeepMind 的 AlphaGenome(从 DNA 预测数千种功能测量)。天文学发布了第一个基础模型 AION-1,训练于 2 亿多个天体

AI 首次端到端运行了完整的天气预报流程。Aardvark Weather 用单个 ML 系统替换了传统数值预报流水线。FourCastNet 3 在不到 4 分钟内生成 60 天全球预报,比之前的方法快 8-60 倍。材料科学方面,微软的 MatterGen 用扩散模型生成新材料,新颖性和稳定性是此前方法的 2 倍以上

ClimateAgent 完成了 85 个气候任务,完成率 100%,质量评分 8.32,超过 Microsoft Copilot 的 6.27 和 GPT-5 的 3.26

Sakana 的 AI Scientist-v2 产出了第一篇完全由 AI 生成并被同行评审(ICLR 2025 Workshop)接受的论文。Google 的 AI Co-scientist 在 GPQA Diamond 上达到 78.4% 的 top-1 准确率。Kosmos 在单次 12 小时运行中执行平均 42,000 行代码并阅读 1,500 篇论文,约相当于 6 个月的研究工作量

但 frontier agents 在论文级复现任务上的得分仍然低于 20%。能提出计算假设和能实验验证之间的差距仍然很大

第六章:医疗

同样是今年新独立的章节

AI 驱动的蛋白质研究在 2024 到 2025 年间增长了约 71%。蛋白质-药物相互作用占论文的最大份额(54.4%)。随着共折叠模型已经可以表示蛋白质数据库中的所有结构类型,瓶颈正在从架构转向数据

环境笔记 AI 是 2025 年临床 AI 中采用最广的品类。 Abridge 从约 100 家扩展到 150 多家医疗系统,Kaiser Permanente 在 40 家医院和 600 多个诊所部署。Sharp HealthCare 报告笔记写作工作量减少 83%。芝加哥大学医学中心认知负荷降低 47%,不分心地关注患者的时间增加 58%。斯坦福医疗(48 名医生的前瞻性研究)每半天门诊节省 20 分钟,职业倦怠显著降低

脓毒症预测取得实质进展。TREWS(约翰霍普金斯/Bayesian Health)在克利夫兰诊所 13 家医院部署后:脓毒症死亡率相对降低 18.7%,首次抗生素使用时间提前 1.85 小时,ICU 使用降低 10%,临床医生采用率 89%。COMPOSER(加州大学圣地亚哥分校):脓毒症死亡率降低 17%,估计每年挽救 50 条生命

诊断方面,微软的 MAI-DxO 搭配 OpenAI 的 o3 在 NEJM 疑难病例上达到 85.5%,21 名执业医生(5-20 年经验)在类似条件下约 20%。MedAgentBench 上最佳模型在虚拟电子病历环境中达到 69.7% 的任务成功率

2025 年 FDA 授权了 258 个 AI 医疗设备,已超过此前任何完整年度。 累计总数达到 1,357 个。放射学占 76.6%。绝大多数通过 510(k) 通道上市(不要求新临床试验),只有 2.4% 有随机试验数据支撑

AI 生成的摘要现在出现在 84%-92% 的健康相关 Google 搜索结果顶部

症状和常见健康问题触发 AI 概览的比例最高(92%),其次是治疗和疾病查询。这正在塑造用户对健康问题的初始理解

临床 AI 的证据基础依然薄弱。超过 500 项临床 AI 研究的综述发现,近一半使用的是考试题而非真实患者数据,只有 5% 使用了真实临床数据

医学数字孪生的研究兴趣增长迅速。在一项 150 名糖尿病患者的随机试验中,71% 在一年内达到了健康血糖水平,同时安全地减少了用药

医学 AI 论文中的伦理讨论在 2025 年翻倍,但话题集中在治理层面,算法问责、生物安全和全球健康公平仍然被忽视

第七章:教育

美国四年制大学的 CS 入学人数在 2024 到 2025 年间下降了 11%,学生在对入门级 CS 岗位的就业前景做出反应。但 AI 软件相关硕士毕业生在 2022-2024 年间增长了 82%

打开网易新闻 查看精彩图片

美国高中和大学生使用 AI 的情况

全球 80% 的大学生使用过 GenAI 学习(2023 年是 40%)。60% 的美国高中生用 GenAI 做研究、编辑论文和头脑风暴。Anthropic 对 Claude 使用数据的分析显示,学生主要用于高阶任务:创造(39.8%)和分析(30.2%)

但只有约一半的美国中学和高中有 AI 政策,只有 6% 的教师认为学校的 AI 政策清晰。47% 的学生想用 AI 做作业但不确定是否被允许

美国和加拿大新增 AI PhD 从 2022 到 2024 年增长 22%,达到 442 人,但新增的 PhD 全部去了学术界而非产业界,扭转了过去十年的趋势

全球 90% 以上的国家已向中小学生提供 CS 课程,但 AI 教育推进更慢。中国和阿联酋从 2025-26 学年强制要求 AI 教育。韩国在 2025 年 3 月推出 AI 教科书后因家长和教师反对而撤回

第八章:政策与治理

今年报告新增了 AI 主权分析框架,覆盖基础设施主权、数据主权、模型主权、应用主权和人才主权五个维度。国家支持的 AI 超算集群:中国以 85 个领先。 欧洲/中亚 44 个,北美 41 个。南亚 2 个,拉美 3 个,中东北非 8 个

打开网易新闻 查看精彩图片

全球 AI 相关立法数量趋势

全球 AI 政策方向分裂。2025 年 1 月特朗普签署行政命令撤销了拜登的 AI 行政命令 14110,转向去监管和创新。2 月 EU AI Act 第一阶段生效,禁止预测性执法和情感识别等高风险应用。巴黎 AI 行动峰会上美国和英国拒绝签署 60 个国家背书的包容性 AI 宣言

7 月美国参议院通过了 10 年联邦禁令阻止州级 AI 立法。但州级立法在快速增长:从 2020 年的不到 10 部增加到 2025 年的 150 部,加州一个州在 2025 年就通过了 20 部 AI 法案

模型产出仍高度集中:美国累计 1,618 个,中国 849 个,欧洲 666 个,拉丁美洲只有 2 个。数据本地化措施:东亚太平洋 77 项,撒哈拉以南非洲 71 项,北美只有 3 项。超过一半的新 AI 国家战略来自发展中经济体

美国国会 AI 相关听证证人从 2017 年的 5 人增长到 2023 年峰值 131 人。产业界证人占比从 13% 升到 37%,成为最大群体。学术界降至 15%,政府降至 10%

美国公共投资与私人支出相比微不足道。 2013 到 2024 年美国在 AI 相关合同和拨款上投入约 204 亿,而 2025 年一年美国私人 AI 投资就有 2859 亿。欧洲 AI 公共承诺在 2013-2024 年间约 37 亿美元(英国 16 亿,德国 5.05 亿,法国 3.2 亿)

第九章:公众舆论

全球 AI 乐观主义和焦虑同时上升。认为 AI 利大于弊的比例从 55% 升到 59%,但认为 AI 产品让自己紧张的比例升到了 52%。超过一半的受访者认为自己对 AI 有良好理解

东南亚仍是全球最乐观的地区。马来西亚、泰国、印度尼西亚、新加坡超过 80% 认为 AI 将在 3-5 年内深刻改变生活。德国(+12 个百分点)、法国(+10)和中国(+9)的乐观情绪在 2022-2025 年间增长最多

印度是 AI 焦虑上升最快的国家。 担忧增加了 14 个百分点,乐观只增加了 2 个百分点

工作场所 AI 使用在新兴经济体中高于许多发达经济体。全球 58% 的员工报告半定期或定期使用 AI 工作,但在印度、中国、尼日利亚、阿联酋和沙特,这一比例超过 80%

AI 专家和公众的看法几乎在所有维度上都存在巨大分歧

就业影响:专家 73% 积极 vs 公众 23%(差距 50 个百分点)。经济影响:69% vs 21%。医疗:84% vs 44%。两组人唯一的共识是 AI 会损害选举和人际关系

64% 的美国人预期未来 20 年 AI 会减少就业,只有 5% 认为会增加。专家没那么悲观(39% 减少,19% 增加),但预测采用速度快得多:专家预计 2030 年生成式 AI 辅助 80% 的美国工作时长,公众的预期是 10%

AI 伴侣目前仍是小众行为。2025 年 8 月一起与 AI 伴侣互动相关的青少年自杀事件引发了美国立法审查。专家预测到 2027 年 10% 的美国成年人将每天使用 AI 伴侣,2040 年 30%

美国对自己政府监管 AI 的信任度全球最低,只有 31%。 全球平均 54%。新加坡最高 81%,印尼 76%,日本 32%。全球范围内,欧盟被认为比美国或中国更可信地监管 AI(53% vs 37% vs 27%)。全部 50 个美国州中,担心监管不足的人多于担心监管过度的人(41% vs 27%)

报告原文 423 页,配套数据集在 Google Drive 上公开,详情看这里

https://hai.stanford.edu/ai-index/2026-ai-index-report