百位临床专家专业把关,国际顶刊内容注入,医学AI要走进诊室,首先要过的不是技术关,而是信任关。

撰文丨凌 骏

打开网易新闻 查看精彩图片

医学AI赛道从不缺热闹。

大模型、智能问答、辅助诊断……过去 几 年, 医学AI工具层出不穷,可对 医生群体 而言 ,一个问题始终悬而未决——AI给出的答案,能信吗?

这不是技术洁癖,而是现实 的 顾虑。日常 生活中 , AI的“幻觉”现象 或许只是一次无伤大雅的误差;但在医学领域,一条虚构的文献引用,一个编造的用药剂量,都可能将临床决策引向危险的方向。

面对这一痛点,一款新的 医学AI 工具 给出了一套不同于行业主流的解法——不卷模型参数,转而从 “ 内容源头 ” 和 “ 输出把关 ” 两个维度同时下手。

5月13日,阿里健康旗下 的 医学AI助手 “ 氢离子 ” 正式发布 , 由超 300位中国临床专家 组建起“ 医学AI专家委员会 ” ,并 宣布与英国BMJ集团(BMJ Group)达成期刊内容独家合作 。

一边是数百位中国临床专家的专业判断力把关 , 一边是国际顶刊的前沿内容注入 。 当这两股力量同时汇入一个AI模型,医学AI或许才真正具备了走进诊室的资格。

打开网易新闻 查看精彩图片

AI能答, 但医生敢不敢信?

循证医学引入中国 已 近三十年, 其 价值 早已不言而喻 。 但在高强度的临床节奏下,如何高效获取、筛选并应用最新的医学证据,仍是一道现实难题。

北京某三甲医院肿瘤内科住院医师卢医生对此深有体会。她告诉“医学界”,肿瘤学的知识更新极快,几乎每隔一阵就有新的临床试验结果公布,顶刊上的新发现,可能会直接影响第二天的治疗策略。

“但现实是文献更新的速度,远快于人工检索、学习并总结的效率。”卢医生认为,在高强度的临床节奏下,医生很难实时追踪每一条前沿进展,想把循证要求完全落到实处,并不容易。

这 也 并非个别科室的困扰。 温州某三甲医院急诊科温医生同样提到,急诊科病种繁杂、病情瞬息万变,遇到疑难病例时,医生往往需要跨多个专业检索平台,才能找到可靠的临床证据,“整个过程非常繁琐费时”。

这种情况下, AI工具的出现 一度 被寄予厚望 , 可 当医生们真正上手后, 又 遇到了新的问题。

卢医生告诉“医学界”,她曾尝试用通用AI检索文献,即便明确要求提供准确的DOI号,点开链接却发现是一篇毫不相关的文章。“这不但没节省时间,反而增加了验证成本。”温医生也有类似经历,有些回答给出的引用,根本查不到出处。

虚构文献, 编造 结论 …… 通用AI的 “ 幻觉 ” 问题,在其他领域或许只是不便, 但 在医学场景中却可能酿成真正的风险 , 也是医生们难以信任AI最根本的原因。

正是基于这一 痛点 , 阿里健康在开发“ 氢离子 ” 之初,就 将核心定位 瞄准 在六个字上:低幻觉,高循证。 换句话说,“氢离子” 要解决的,不是 “ AI能不能回答医学问题 ” ,而是 “ 医生敢不敢信AI的回答 ” 。

为此, “ 氢离子 ” 构建了一套完整的循证链路 。

为了确保 所有回答均 能 标注权威出处,支持一键溯源 ,“ 氢离子 ” 录入 了 千万级医学核心期刊文献, 并 打通 了“ 中外文献检索 —— 翻译 —— 解析 —— 可溯源回答 ” 的全流程 ,覆盖从问题提出到证据验证的完整工作流。

同时, 氢离子还首次将时效性与权威性融入引用逻辑——通过对全球指南与文献的日更追踪,每一个回答都能精准定位到原文中支撑观点的具体语句,并同步校验其时效性与可信度 , 精准指出 “ 引用的 哪句话 ? 为什么可信 ? 此刻是否仍然有效 ?”。

打开网易新闻 查看精彩图片

卢医生告诉“医学界”,在“氢离子”的辅助下,目前她已经形成了一套熟练的工作流:准备学术汇报时,先用通用AI生成大纲初稿,再用“氢离子”搜索权威文献、翻译精读、提炼总结。“它给出的每一条引用,我都能查到真实出处,这是让我最放心的。”

让证据可得、可用、可信 , 在面对 循证医学落地 的 “ 最后一公里 ” 时,这是“氢离子”所给出的回答。

医学循证,靠什么保障?

“ 低幻觉 ” 三个字说起来简单,但在医学场景中,靠什么来保障?

当行业多数产品还在卷模型参数、卷问答的流畅度时,氢离子选择了另一条路径——从 “ 内容源头的权威性 ” 和 “ 输出质量的专家把关 ” 两个维度,同时建立壁垒。

在内容源上, “ 氢离子 ” 没有选择依赖互联网上质量参差不齐的公开信息,而是基于千万级国际顶尖期刊文献、国内外权威临床指南与共识以及药品说明书,构建了一套专用的循证数据库。

据 阿里健康CTO王祥志 介绍,“ 氢离子 ” 有别于其他通用大模型的底层技术逻辑 , 是 四层循证AI架构 。

“ 第一层 是 证据理解与内容体系,所有指南和文献在进入系统时,都会基于PICO框架和GRADE标准进行结构化理解 ; 第二层基于PICO的检索与数据增强,保证输出的每一句话都有据可查 ; 第三层 是 模型强化与微调 , 让模型学会 ‘ 什么是准确、忠实循证、安全有用的答案 ’ ,并确保满足循证医学的严格标准。 ”

而 第四层, 则是由 医学专家评审体系完成质量 的 闭环。

在此次 发布会上, “ 氢离子 ” 正式宣布成立 “ AI医学专家委员会 ”, 由 黄晓军教授、肖瑞平教授、于金明教授等10位国内各学科顶级专家 领衔 ,负责整体学术方向把关 。

同时, 50位指导委员会成员 负责 制定评测标准与方法论;数百位来自复旦100强医院 的 评测医生, 则 对AI回答进行验证与反馈。

值得一提的是,这并非一次性的“专家亮相”。专家的定期评测结果,将持续地反馈到产品的迭代中,经确认后统一纳入“氢离子”的实时知识库更新,形成了“用——评——改”的循环。

肖瑞平教授在发布会上表示,AI对医学的影响是方方面面的,但越往前走,越需要标准、需要底线、需要方向。 “ 什么样的AI是安全的?什么样的模型是可信的?这些问题不只是靠技术来解决,必须由临床、由科学证据、由规范治理来回答。”

肖瑞平 教授 指出,专家委员会的三级架构设计——顾问委员会把握方向,指导委员会制定标准,评审委员会扎实做好临床验证——是一种务实、专业、可长久 运行的 模式。 “ 我们不是 走个形式 ,而是要面向临床,建立一个经得起检验的、有循证基础的AI评价体系。 ”

从内容源头的权威性,到输出质量的专家把关,这套 “ 顶刊授权+ 专家 审核 ” 的双保障体系, 都指向了一个核心 目标:让每一条AI输出 , 都 能 经得起临床验证。

当国际顶刊投出“ 信任票 ”

发布会上另一个引发广泛关注的信号,来自国际顶刊英国BMJ集团 。

“ 氢离子 ” 宣布, 成为BMJ集团在中国独家合作的医学AI平台 , 包括 《英国医学杂志》 在内, BMJ集团 旗下 70本医学期刊 的所有 内容和多媒体资源 , 将独家授权提供给“氢离子 ”。 同时,“ 氢离子 ” 目前还正在 与全球多家顶刊进行合作沟通。

打开网易新闻 查看精彩图片

国际顶刊筛选合作对象的标准素来严苛,其判断“独家内容授权”的依据,不仅是模型参数和用户规模,更是对产品循证能力与专业内容把控水准的专业认可。

因此,对于一款将贯穿医生日常工作的AI工具来说, 这张 “ 信任票 ” 的分量不言而喻。

依托此次合作, 中国医生可以通过 “ 氢离子 ” 直连全球顶级医学文献,进行循证问答、全文阅读、在线翻译,解决临床与科研过程中的医学问题。

B MJ集团出版业务首席执行官Niels Peter Thomas博士 表示:“ BMJ集团致力于提供优质医学知识、促进全球健康事业的发展。将期刊文章内容接入人工智能医学平台 ‘ 氢离子 ’ ,是突破传统知识获取方式的一次创新,期待能以此更好、更多地服务中国医生。”

当AI 的所有 回答 , 都可溯源至顶刊原文或国内权威指南,当每一次输出都经过专家委员会的验证, “ 氢离子 ” 实际上建立 的,是 一套 “ 循证问答 标准 ” ——什么样的信息源可以被引用,什么样的输出质量才算合格,什么样的迭代机制才能持续可信。

这不只是一个产品的能力边界,更可能深远影响中国医生的临床决策习惯:从 “凭经验判断” 到 “ 有据可查 ” ,从 “ 我觉得 ” 到 “ 证据显示 ” 。

肖瑞平教授 认为 ,面向全球医学 AI 快速发展的格局,中国需要有自己的权威学术声音,需要有立足临床实践、符合中国国情、经得起国际检验的医学 AI 标准体系。

“ 我们有决心 ,也 有能力,汇聚全国顶尖学术力量,以严谨态度、科学方法、临床实践,打造属于中国、服务中国,并能走向世界的医学 AI 标准,为全球医学 AI 治理贡献中国智慧与中国方案。 ” 肖瑞平教授 说。

*“医学界”力求所发表内容专业、可靠,但不对内容的准确性做出承诺;请相关各方在采用或以此作为决策依据时另行核查。

打开网易新闻 查看精彩图片