4月14日,斯坦福大学以人为本人工智能研究院(Stanford Institute for Human-Centered Artificial Intelligence,简称“斯坦福HAI”)发布了重磅年度报告《2026 年人工智能指数报告》(The 2026 AI Index Report)。
报告 自2017年以来已连续更新了9年,是成为人工智能领域最全面的年度快照,有“AI体检单”之称。
报告长达423页,下文中我们重点概括了“第六章-医学”部分,内容概述了人工智能在医学领域的进展,包括科学发现、临床应用、患者参与度及伦理考量。
小模型碾压大模型
报告首先关注到分子生物学领域,并提出了核心观点:较小的模型表现优于较大的模型。
2024年至2025年间AI蛋白质研究增长了约71%,其中蛋白质语言模型(PLMs)被着重强调,该领域正在从规模竞争转向模型效率和专业化的比拼。
报告还特别提到两个例子,分别是仅有1.11亿参数的蛋白质语言模型MSAPairformer在权威榜单ProteinGym上优于多个亿级参数的巨无霸;
以及拥有2亿参数的基因组模型GPN-Star,表现优于拥有400亿参数的模型。
虚拟细胞一夜崛起
虚拟细胞模型是2025年最热门的全新领域,仅PubMed出版物数量就增长了50%,其中Arc研究所的Evo 2、STATE以及DeepMind的AlphaGenome是最受关注的产品。
这些模型旨在预测细胞对药物和基因变异的反应,而无需进行湿实验室实验,在药物开发的临床阶段具有极大应用潜力。
不过目前的该领域系统仍需通过实验进行验证,且训练方法和数据管理仍然是性能的重要决定因素。
AI为医生节省了83%时间
临床人工智能已经从试点阶段发展到企业级部署,其中能够从患者就诊记录中自动生成临床记录的AI笔记工具是最典型的应用。
在多个医院系统中,医生们在书写病历上的时间减少了多达83%,其中Northwestern Medicine更实现了高达 112% 的投资回报率。
258款AI器械获批 中国企业杀入前三
截至2025年9月,FDA批准了258 款人工智能医疗设备,超过了此前所有全年总数。具体到厂商上,GE Healthcare以93个设备领先,其次是西门子(82个)以及来自中国的联影医疗(38个)。
但绝大多数获批产品是依赖现有安全性和功效证据(而非新的随机试验)的设备改造途径进入市场的,仅有2.4%的设备拥有由随机试验数据支持的临床研究支持。
AI Agent战胜人类医生
自主和半自主的Agent已成为AI医疗领域的一项重大成果。
该领域最大的成果来自于微软AI医疗诊断工具MAI-DxO,在304个《新英格兰医学杂志》刊登的复杂病例中以85.5%的惊人准确率,击败了未借助任何辅助工具的人类医生(成绩仅为 20%)。
在微软的AI诊断编排器(MAI-DxO)配合OpenAI的o3联合使用的情况下,多代理框架能提升7%-60%的诊断准确性,优于单代理基线。
84%健康搜索已被AI统治
人工智能生成的摘要如今出现在84%-92%的与健康相关的谷歌搜索结果顶部。
其中92%症状与常见的健康问题会触发AI概览功能,其次是关于治疗方案与病情状况的查询。这些概述如今已成为健康信息搜索中的常规功能,影响着用户对自身问题的初始解读。
数字孪生值得关注
学术界对医疗数字孪生的研究兴趣正在迅速增长,出版数量从2015年的接近0增加到2025年的372篇,而且在已进行试验中,早期成果均显示出良好前景。
在一项针对150名糖尿病患者的随机试验中,71% 的受试者在一年时间内成功实现了血糖水平的健康稳定,同时还能安全地减少用药量。
数据仍是AI天花板
与其他领域一样,AI生命科学模型的开发也正日益受到数据而非架构方面的瓶颈制约。
随着共折叠模型如今涵盖了蛋白质数据库中所有结构类型,2025年该领域开始转向基于人工智能预测结构的精炼数据集,并借助综合实验数据源进行训练,从而将训练数据集的规模从数十万条目扩展至数千万。
说到最后:
此外报告还涉及了医疗伦理领域。2025年医学人工智能出版物中关于伦理问题的讨论内容已增加了一倍多,但相关讨论范围较为狭窄。
治理问题在讨论中占据主导地位,而算法问责制、生物安全及全球卫生公平性等问题则仍未得到充分探讨。
报告原文:https://hai.stanford.edu/ai-index/2026-ai-index-report/medicine
热门跟贴