打开网易新闻 查看精彩图片

#扬帆2026#

在此刻的急诊室里,或许正上演着这样一幕:

一位满面愁容的中年人坐在诊床边,手里攥着厚厚一沓检查单。他已经断断续续发烧了一个多月。抗生素吃了一箩筐,退烧药当饭吃,但这股无名火就是压不下去。

社区医院说是感冒,县医院说是肺炎,到了大三甲急诊,医生皱着眉头把检查单翻了一遍又一遍,依然不敢轻易下笔写确诊结果。

它像是一个隐形的幽灵,游荡在感染、肿瘤、免疫疾病的迷宫里。对于医生,尤其是经验尚浅的年轻医生来说,要在急诊这种“高压锅”一样的环境下,迅速从成千上万种可能性里揪出真凶,无异于大海捞针。

但最近,一项发表在《BMC急诊医学》(BMC Emergency Medicine)上的重磅研究显示,急诊室里迎来了一位强悍的“新同事”。它不穿白大褂,不拿听诊器,却能凭着一张病历单,在几秒钟内给出惊人准确的诊断。

它就是当下最火的人工智能——ChatGPT-4o。

01. 当“福尔摩斯”遇上“超级大脑”

为了搞清楚AI到底能不能看病,来自中南大学湘雅医院急诊科的团队做了一场非常有意思的“回顾性实验”。

他们找来了60位“不明原因发热”的患者病历。这些患者都是硬骨头,发烧超过3周,体温飙到38.3℃以上,且经过了一周的初步排查还没找到病因。

为了公平起见,研究人员把这60份病历像发考卷一样,分别发给了三组“选手”:

年轻组: 3位住院医师(急诊科的新生力量,有一点经验但还在成长期)。专家组: 3位资深主治医师及以上级别的专家(临床摸爬滚打8年以上,那是真正的老江湖)。AI组: ChatGPT-4o(没有任何临床经验,但背靠海量医学数据库的数字大脑)。 比赛规则很简单:看病历,给诊断。

这不仅仅是一场准确率的比拼,更是一次对未来医疗模式的预演。结果如何?让我们先看一个根据研究数据还原的典型案例,来感受一下现场的“硝烟味”。

02. 一个被“发热”困住的男人

50岁的张先生(化名),是这60位患者中的典型代表。

两个月前,他开始莫名其妙地发低烧。起初以为是流感,没在意。但随着时间推移,他开始盗汗、消瘦,体重掉了十斤。到了急诊科时,他已经在其他医院辗转了一圈,肺部CT没看到明显感染,血常规只是提示有点贫血和炎症。

年轻医生的视角:拿着张先生的急诊初诊记录,年轻医生犯了难。发热、炎症指标高……这不就是感染吗?可能是某种隐蔽的细菌?或者是结核?于是,年轻医生给出的初步诊断倾向于“复杂性感染”。

专家的视角:老专家看着同样的病历,敏锐地捕捉到了“消瘦”和“长期低热”这两个关键词。他没有急着下定论,他的直觉告诉他,这可能不是简单的细菌感染,淋巴瘤(肿瘤)或者成人斯蒂尔病(免疫系统疾病)的可能性很大。

ChatGPT-4o的视角:研究人员把张先生去掉了个人隐私信息的病历“喂”给了AI。几秒钟后,屏幕上跳出了三条建议:

淋巴瘤(理由:长期发热伴B症状、贫血)。结核病(理由:长期低热、流行病学考量)。 在这个回合里,年轻医生因为经验局限“跑偏”了,而AI和专家都锁定了真凶。但更惊人的是,AI给出的鉴别诊断逻辑,清晰得就像教科书一样。

03. 数据揭示的残酷真相:AI真的比人强吗?

这个案例只是冰山一角。研究团队对60个病例进行了详细统计,结果让人喜忧参半。

结果二:AI与专家“打平手”面对经验丰富的老专家,AI的表现依然亮眼,准确率(70.0%)在数值上甚至超过了专家(57.78%),但在统计学上,这种差异并不显著。也就是说,AI已经具备了和人类专家“掰手腕”的能力,虽然还没做到绝对碾压,但绝对算得上是顶尖高手的水平。

结果三:1+1>2的奇迹这是整项研究最让人兴奋的发现。研究人员做了一个“作弊”实验:让医生们先自己看病,然后再把ChatGPT-4o的建议拿给他们看,问他们:“看了AI的意见,你要不要改诊断?”

这说明了什么?AI不是医生的替代者,而是最强的“外挂”。它能帮年轻医生迅速补齐经验短板,也能帮老专家查漏补缺,提醒他们可能忽略的罕见病。

04. 为什么“不明原因发热”这么难搞?

我们要理解AI的厉害之处,首先得知道“不明原因发热”有多难。

在医学界,FUO被称为“内科的疑难杂症之王”。它不像阑尾炎疼在右下腹,也不像心梗有典型的心电图改变。它的病因可能有几百种:

感染性疾病: 占了大头(约53.3%),比如藏在心脏瓣膜上的细菌(心内膜炎)、或是隐蔽的脓肿。肿瘤: (约20.0%),淋巴瘤、白血病往往就以发热为首发症状。免疫系统疾病: (约16.7%),如红斑狼疮、成人斯蒂尔病,身体自己打自己,产生热量。其他: 药物热、甲亢…… 在急诊那种嘈杂、快节奏、信息不全(往往只有血常规和CT)的环境下,医生的大脑很容易过载。年轻医生往往会因为见过的病例少,思维局限在常见的“感冒发烧”里;而专家虽然经验丰富,也难免会有思维定势。

ChatGPT-4o的优势在于,它是一个没有感情、不知疲倦的“知识检索机器”。它不会因为那是深夜两点就犯困,也不会因为刚看了一个流感病人就觉得下一个也是流感。它能瞬间扫描数百万篇医学文献,把那些藏在角落里的罕见病因一个个列出来供医生参考。

05. 别急着欢呼,AI也有“软肋”

看到这里,你可能会问:那以后还要医生干嘛?直接弄个AI看病不就行了?

千万别这么想。这项研究也冷静地指出了AI目前的局限性。

第一,AI会“一本正经地胡说八道”。这种现象在AI界叫“幻觉”。在研究中,虽然是个例,但AI偶尔会把一些免疫系统疾病强行解释成感染,或者把药物引起的发热归咎于根本不存在的病毒。如果没有人类医生把关,这种错误可能是致命的。

第二,医学不仅仅是做题。这项研究是“回顾性”的,也就是看着冷冰冰的文字记录做判断。但在真实的急诊室里,医生要看病人的气色(是苍白还是潮红?),要听诊(肺里有没有啰音?),要触诊(肚子是软是硬?)。这些触觉、听觉和直觉的信息,目前的AI还无法获取。

第三,隐私与伦理。把病人的资料交给AI,数据安全怎么保证?如果AI诊错了,谁来负责?是开发AI的公司,还是采纳建议的医生?这些法律和伦理问题,比技术本身更难解决。

未来的看病模式变了

2026年的这项研究,实际上为我们推开了一扇通往未来医疗的大门。

我们可以预见,在不久的将来,急诊医生的电脑屏幕上会常驻一个AI助手窗口。当医生输入“中年男性,发热35天,抗生素无效”时,AI会立刻弹窗提示:“医生,请注意排查淋巴瘤和自身免疫性疾病,建议加做铁蛋白和免疫全套检查。”

对于我们普通患者来说,这更是一个天大的好消息。这意味着,哪怕我们在基层医院,遇到刚毕业的年轻医生,在AI的辅助下,我们也能获得接近大三甲专家的诊断水平。误诊率会降低,确诊时间会缩短,那些因为“查不出病因”而遭受的痛苦折磨,将大大减少。

人类医生的温情与直觉,加上AI的博学与冷静,这或许就是医学最美好的未来形态。

下次去医院,如果看见医生盯着电脑思考很久,别怪他动作慢,也许他正在和他的“AI合伙人”进行一场关乎你健康的深度会诊。

参考文献:Long H, et al. ChatGPT-4o assists emergency physicians in enhancing diagnostic accuracy for fever of unknown origin: retrospective analysis. BMC Emerg Med. 2026;26(1).

温馨提示: 本文内容基于临床研究分享,具体的治疗方案务必由主治医生根据患者个体情况制定。

文 | 医路悬壶