刚刚过去的2024年,生成式AI正以肉眼可见的速度席卷医疗行业。
“啃下”6000多本国内外权威教材、成功通过国家执业医师资格考试,多次参加中文医学信息挑战赛连续获得冠军……日前,上海市东方医院一款由医生团队主创、技术团队共同研发的AI医学大模型“Med-Go”一经发布,便引起业内关注。
就在1个月前,由清华大学智能产业研究院团队打造的首家“AI医院”Agent Hospital也开始内测,预计今年上半年对公众开放。
从全能型医学伴侣、智能陪诊助手到病历生成式语言模型,甚至是呼之欲出的“AI医院”……市面上医疗垂直模型迭出,不少头部医院甚至主动要求上线相关平台,并自主开展研发。
中国互联网络信息中心的统计数据显示,截至2024年7月,中国完成备案并上线、能为公众提供服务的生成式AI服务大模型已达190多个,其中有不少与医疗相关。
日前,上海也发布了全市首个MaaS(“模型即服务”)平台,重点聚焦医诊疗场景,通过大模型赋能临床诊疗,同步发布的首批5个由该平台赋能的AI应用中就包括“Med-Go”。
人们不禁要问,AI赋能之下,医疗领域将开启怎样的深度变革?传说中的“AI医生”,真的要来了吗?
从读片到给诊断,AI“开始像人一样思考”?
“这是我们自主研发的‘Med-Go’,如同一名医学教授,具有强大的思考与分析能力。”“Med-Go”创始人、上海市东方医院急诊与重症医学科主任张海涛向记者演示了一个病例。
一名11岁男童因不明原因发热、间歇性晕厥、嗜睡等症状在外地某著名三甲医院儿科反复检查,却始终无法查明病因,直至一年后,他才被确诊为患有一种十分罕见的自身免疫性疾病。
而当张海涛将这名患儿的病例输入“Med-Go”后,医学大模型仅用几分钟便给出了专家耗费一年才完成的诊断。
“这一堆病历如果给一名人类医生,仅整理病例、理清思路至少得一个多小时。”张海涛说,大模型基于庞大的医学知识数据库和强大的思维分析能力,给予医生辅助决策支持,是生成式AI对临床诊疗极具价值的部分。
其实,AI作为临床辅助诊断工具已经发展了十多年,其中“表现”比较出色的当属影像AI,它能够帮助医生处理高强度的重复阅片工作,在鉴别结节良恶性、肿瘤分期等方面颇具优势,但更多聚焦于特定病种。
大语言模型的出现,给医疗AI带来了新的突破。“相较于传统的影像AI,现在的医疗AI确实越来越像医生。”上海市第十人民医院超声医学科副主任郭乐杭与团队正开展“超声+AI”的临床研究,主要面向全身多器官、多疾病,针对诊断、预测、教学、远程医疗等多重任务。
“我们团队搭建了具有自主知识产权的超声影像数据库,在此基础上依托十院优势病种,积累了甲状腺、乳腺、前列腺、皮肤及软组织四大器官队列,累计数据量超过2万。”郭乐杭告诉记者,从影像AI到大语言模型加持的医疗AI,其中最重要的转变在于,“AI开始像人一样思考。”
“以前用AI读片只能得到一堆冷冰冰的数据,但如今它更像一名超声科医生,读完片后可以再出一份患者读得懂、能理解的诊断报告。而医生则仿佛从写卷子的人变成批卷子的人,工作效率更高,工作体验感也随之提升。”郭乐杭解释,传统影像AI聚焦单病种、单器官的研发范式如今正被突破,现在的医疗AI可自动挖掘医学影像和诊断报告的相关性,进行大规模数据快速标注,并且从医学影像直接生成诊断报告,给予临床医生更多的参考。
生成式AI跑出加速度,医生用起来了吗?
目前,“Med-Go”已接入东方医院的HIS系统(医院信息系统),已有数个科室的百余名医生“尝鲜”。它在日常诊疗中的使用情况究竟如何?
张海涛直率地表示,拥抱AI医学大模型,对医生来说,“有一个从了解到熟练应用的过程。”而这也与记者采访中的体感相似:在多家已经上线各种医疗AI平台的医院,不少一线医生都表示“用得不算多”。
这样的情况并非只发生在国内。此前,全球数据分析公司爱思唯尔对全球123个国家和地区近3000名科研人员和临床医生进行调查,并发布了《洞察2024:人工智能态度报告》。《报告》显示,尽管AI在科研和医疗领域拥有巨大潜力,但目前在科研人员和临床医生工作中的应用仍然有限。
那么,医疗AI融入日常诊疗的难点在哪?
“首先是习惯,很多医生对用生成式AI仍持谨慎态度,有的医生只是将其当作搜索引擎,无法与其进行深层次交互,这使得AI强大的‘赋能’潜力尚未被释放。”业内人士分析,而另一个重要原因,则是AI目前无法消除的“幻觉”。
“大模型的认知状态还处于‘我不知道我知道什么’,这往往导致其出现‘幻觉’或者生成虚假信息。”这是一位人工智能领域的专家对大模型出现“幻觉”的解释。但是,面对生命,医疗AI最重要的“特质”就是必须可信赖,这也是临床医生眼中AI应用于其工作的前提条件。
“就我目前的体验来说,AI对结节良恶性判断的准确性很高,但真正成为日常诊疗中的必备工具,还差一口气。”郭乐杭说得直接,“幻觉”是医疗AI普及的最大麻烦和瓶颈,这可能导致错误的诊断、治疗建议或医疗决策,从而对患者的健康造成严重影响。
中国科学院院士、国际欧亚科学院院士陈润生接受记者采访时曾提到,破除AI“幻觉”需跨越技术难题、伦理问题等诸多挑战。从技术层面来说,AI的表现很大程度上依赖于训练数据的质量和多样性,如果训练数据存在偏差,模型可能会产生错误的输出。再从伦理层面看,算法可能因为训练数据的不完善或设计者的主观偏见而导致歧视性的决策结果。
基于可信数据源来提高AI的准确度,是减少“幻觉”的关键。对此,国家卫生健康委卫生发展研究中心副主任游茂也曾表示,目前我国AI医疗器械研究领域的高质量数据仍然较为缺乏,真实世界数据应用实现机制还需进一步建立。
此外,医疗AI的偏差对医生带来的影响很难评估。《美国医学会杂志》2023年发表的一篇名为《评估AI在住院患者诊断中的影响》的随机临床调查研究就发现,当故意给医生呈现有偏倚的AI诊断结果时,医生可能会被AI“欺骗”,导致诊断准确性降低11.3%。即便是影像AI,其偏差也会对医生带来影响。
《自然医学》的一项研究就显示,虽然使用AI工具进行图像解读是否有益因临床医生而异,但是,AI的错误显然会强烈影响治疗结果。
“高年资医生也许不会受AI影响,但低年资医生不免犹豫,甚至会怀疑自己的判断。”郭乐杭说,这也就不难解释,为什么很多医生对于是否将AI作为工具箱中的重要选项,仍持观望状态。
医生的“伴侣”,始终无法替代医生
不可否认的是,拥抱医疗AI,是一个不可逆转的趋势。但是,经由算法培养出的“AI医生”究竟能用到什么程度?“AI医生更可能是在一些特殊场景下,为人类医生补缺。”一位学者在接受记者采访时说,目前,相较于头部医院,体检机构、基层医疗机构、偏远地区等医疗资源相对薄弱的地方,更需要安全且有效的医疗AI加持。
眼下,东方医院医联体内的15家浦东新区社区卫生服务中心已同步安装“Med-Go”,江苏省射阳县人民医院及其下属社区卫生服务中心、山西省忻州市人民医院及其下属社区卫生服务中心也安装了“Med-Go”。
浦东新区陆家嘴社区卫生服务中心眼科医生刘方圆是“Med-Go”的首批尝鲜者。对于这名初出茅庐的眼科医生而言,入职不久的她常会遇到一些“拿不准”的案例。
曾有一名34岁的患者因眼睛红来就诊,主诉眼痛三天。“检查后发现,患者前房正常、眼压正常,睫状体出现按压痛。”刘方圆告诉记者,她虽然心中有答案:急性虹膜睫状体炎,却并无十分把握。将病历一键输入“Med-Go”后,她松了一口气——诊断被验证了。对这名年轻医生而言,这款生成式AI更像自己的智囊团和百宝箱。
将医疗AI布局到基层医疗机构,还有更重要的一层考量——将疾病的防治关口迁移,对患者进行初筛,实现分级诊疗,进而提升医疗资源的利用效率。
对此,上海已有不少探索。徐汇区卫健委基于AI大模型、云计算、数字人等技术为全区超48万居民进行健康画像,更直观的患者健康概览让基层医生能快速识别患者存在的高风险疾病;仁济医院卜军教授团队已在“AI+心血管影像”领域取得多个突破性进展,研发了适用于社区人群的早期筛检和精准诊断新技术,以推动心血管疾病防治关口前移……
“‘AI医生’确实要来了,它可以是医生的‘伴侣’,或者填补医生能力的空缺,但就目前的技术而言,‘AI医生’还不能取代医生。”张海涛告诉记者,人的共情能力、同理心、关怀能力都是AI无法拥有的。“同一种疾病常常有不同的治疗方法,‘AI医生’给出的最优解未必是人类所需要的最优解,毕竟疾病的治疗,不仅和疾病本身有关,还和患者的个人情况、家庭情况、个人理念等诸多方面相关。”
就当下而言,“辅助”是医疗AI最重要的关键词。“科学审慎地用好AI这个帮手,并不断帮助‘AI医生’成长,别让喧嚣埋没理性。毕竟,随着技术发展,医疗AI和医生并肩作战很快就可能成为日常了。”一名医学教授这样说。
热门跟贴