加州大学旧金山分校(UCSF)和韦恩州立大学的科学家在AI健康研究的早期真实测试中发现,生成式AI处理海量医疗数据集的速度远超传统计算机科学团队,部分情况下甚至能得出更优结果——而人类专家分析相同数据需耗时数月。

打开网易新闻 查看精彩图片

为直接对比性能,研究人员给不同团队分配了相同任务:利用1000多名孕妇的数据预测早产。令人惊讶的是,由UCSF硕士生Reuben Sarwal和高中生Victor Tarca组成的“新手组合”,在AI工具支持下成功开发出预测模型:AI系统几分钟内就能生成可用代码,而这通常需要资深程序员花费数小时甚至数天。

AI的优势在于能根据简短但精准的提示编写分析代码。不过并非所有AI系统表现都出色:8款AI聊天机器人中仅4款生成了可用代码,但成功的AI无需大型专家团队指导即可完成任务。凭借这种速度,这对新手研究者在数月内就完成了实验、验证结果并向期刊投稿。

UCSF儿科教授、Bakar计算健康科学研究所临时主任Marina Sirota博士表示:“这些AI工具能缓解数据科学最大的瓶颈之一——构建分析流程。对急需帮助的患者而言,这种提速来得正是时候。”该研究于2月17日发表在《Cell Reports Medicine》上,Sirota是共同资深作者。

一、早产研究为何重要

加速数据分析有望改善早产诊断工具——早产是新生儿死亡的首要原因,也是儿童长期运动和认知障碍的主要诱因。在美国,每天约有1000名婴儿早产。

研究人员尚未完全了解早产的成因。为探究潜在风险因素,Sirota团队整合了9项独立研究中约1200名孕妇的微生物组数据,这些孕妇的妊娠结局均被跟踪记录。UCSF BCHSI副教授、论文合著者Tomiko T. Oskotsky博士指出:“这类研究只有通过开放数据共享,汇集众多孕妇的经历和研究者的专业知识才能实现。”

二、从DREAM竞赛到AI测试:缩短2年研究周期的突破

分析如此庞大复杂的数据集极具挑战性,为此研究人员发起了名为DREAM(逆向工程评估与方法对话)的全球众包竞赛。Sirota联合主导了其中3项妊娠挑战之一,聚焦阴道微生物组数据。全球100多支团队参与,开发机器学习模型检测与早产相关的模式,多数团队在3个月竞赛期内完成工作,但整合结果并发表论文耗时近2年。

好奇生成式AI能否缩短这一周期,Sirota团队与韦恩州立大学Adi L. Tarca博士的团队合作(Tarca是另外两项DREAM妊娠挑战的负责人,聚焦妊娠阶段估算方法优化)。他们让8款AI系统独立使用3项DREAM挑战的相同数据集生成算法,无需人工直接编码。

AI聊天机器人收到精心编写的自然语言指令,类似ChatGPT,通过详细提示引导其以与人类参赛者可比的方式分析健康数据:一是分析阴道微生物组数据识别早产迹象,二是通过血液或胎盘样本估算胎龄(胎龄估算通常为近似值,但决定了孕妇孕期接受的护理类型,估算不准确会增加分娩准备难度)。

研究人员用DREAM数据集运行AI生成的代码后发现:8款工具中仅4款生成的模型性能与人类团队相当,部分AI模型表现更优。而整个AI研究从启动到论文投稿仅耗时6个月。

三、AI不是替代,而是解放:让研究者聚焦核心问题

科学家强调,AI仍需严格监督——这些系统可能产生误导性结果,人类专业知识依然不可或缺。但生成式AI能快速筛选海量健康数据,让研究者减少代码调试时间,更多精力用于解读结果和提出有意义的科学问题。

Tarca表示:“得益于生成式AI,数据科学背景有限的研究者无需组建大型合作团队或花费数小时调试代码,他们可以专注于回答关键的生物医学问题。”