As AI enters the operating room, reports arise of botched surgeries and misidentified body parts

医疗器械制造商正争相将人工智能融入其产品。尽管支持者声称这项新技术将彻底改变医疗行业,但监管机构接到的患者伤害投诉数量却在持续攀升。

打开网易新闻 查看精彩图片

2021年,医疗巨头强生旗下子公司宣布实现"重大突破":其用于治疗慢性鼻窦炎的医疗设备已整合人工智能技术。Acclarent公司表示,其TruDi导航系统的软件将采用机器学习算法,辅助耳鼻喉专科医生进行手术操作。

该设备此前已上市约三年。截至当时,美国食品药品监督管理局(FDA)收到七起未经核实的设备故障报告,另有一份患者受伤报告。自设备引入人工智能后,FDA已收到至少100起未经核实的故障及不良事件报告。

据报告显示,2021年底至2025年11月期间至少有10人受伤。多数事件据称涉及TruDi导航系统在手术中向医生误报器械在患者颅内的位置。

据报道,一名患者的脑脊液从鼻腔漏出。另一起案例中,外科医生误穿患者颅底。还有两起案例中,患者因主要动脉意外受损而分别罹患中风。

FDA设备报告可能不完整,且并非用于判定医疗事故原因,因此尚不清楚 AI 在这些事件中扮演何种角色。

两名中风受害者分别在得克萨斯州提起诉讼,指控TruDi系统的人工智能导致其受伤。其中一起诉讼指出:"在软件整合人工智能进行修改前,该产品的安全性可能反而高于修改后。"

路透社无法独立核实诉讼中的指控。

在被问及FDA关于TruDi设备的报告时,强生公司将问题转给了 ntegra LifeSciences,后者于2024年收购了Acclarent及其TruDi 导航系统。

Integra LifeSciences表示,这些报告"仅表明TruDi系统在发生不良事件的手术中被使用",并补充说"没有可靠证据显示TruDi导航系统、人工智能技术与任何所谓伤害之间存在因果关系。"

随着人工智能开始改变医疗保健领域,相关事故的内幕逐渐浮出水面。支持者预测这项新技术将有助于寻找罕见疾病的治疗方法、发现新药物、提升外科医生的技能并赋予患者更多自主权。

然而,路透社对安全与法律记录进行的审查,以及对医生、护士、科学家和监管机构的采访显示,在设备制造商、科技巨头和软件开发商竞相推出人工智能应用的同时,医疗领域的人工智能也暴露出一些风险。

美国食品药品监督管理局(FDA)目前已批准至少1357款采用人工智能技术的医疗设备,这一数字是截至2022年获批数量的两倍。

引发质疑的并非只有TruDi系统:FDA已收到涉及数十款其他AI增强设备的报告,其中包括一款据称漏检异常心跳的心脏监测仪,以及一款被指控错误识别胎儿身体部位的超声设备。

约翰斯·霍普金斯大学、乔治城大学和耶鲁大学的研究人员近期发现,60种经美国食品药品监督管理局(FDA)批准的人工智能医疗设备与182起产品召回事件存在关联。

这项发表于8月《美国医学会健康论坛》的研究显示,43%的召回发生在设备获批后不到一年内。研究指出,这一召回率约为FDA同类审批规则下所有设备召回率的两倍。

五名现任和前任美国食品药品监督管理局科学家向路透社透露,人工智能热潮给该机构带来了难题:在关键人员流失后,FDA正竭力应对寻求批准的AI增强医疗设备激增的浪潮。隶属于美国卫生与公众服务部的FDA发言人表示,正寻求提升该领域的监管能力。

另一种形式的人工智能——生成式AI聊天机器人,也正在进入医疗领域。如今许多医生利用 AI 来节省时间,例如转录患者病历。但医生们也表示,许多患者使用聊天机器人进行自我诊断或质疑专业建议,这带来了新的挑战和风险。

大约三年前,随着ChatGPT的推出,人工智能成为商业和社会领域的热门话题。ChatGPT以及谷歌的Gemini、Anthropic的Claude等其他流行聊天机器人,都运用所谓的生成式人工智能来创造内容。

这些工具基于大型语言模型(LLMs)构建,这些模型通过海量文本及其他数据训练,以理解和生成人类语言。如今,这类人工智能工具正被引入医疗领域,例如消费者健康应用程序。

人工智能的内涵远不止LLMs,这项技术早在AI聊天机器人出现之前就已进入医学领域。该领域的历史可追溯至70多年前:一个关键节点是1950年,英国数学家艾伦·图灵在其论文中提出"机器能思考吗?"

美国食品药品监督管理局于1995年首次批准了AI增强医疗设备——两款采用模式匹配软件筛查宫颈癌的系统。

当今医疗设备中应用的人工智能技术通常被称为机器学习,其子集深度学习通过数据训练执行特定任务。例如在放射学领域,该技术被用于增强和分析医学影像,能通过识别医生可能遗漏的肿瘤来辅助癌症诊断。

此类系统也应用于手术设备。2022年6月,德克萨斯州沃思堡一家医院的医生将微型球囊置入患者艾琳·拉尔夫的鼻窦腔。根据拉尔夫提起的诉讼,马克·迪恩医生当时正使用搭载AI的TruDi导航系统确认其器械在她颅内的位置。

该手术被称为球囊扩张术,是一种治疗慢性鼻窦炎的微创技术。通过球囊扩张扩大鼻窦腔开口,以改善引流并缓解炎症。

但根据拉尔夫在达拉斯县地方法院对Acclarent及其他被告提起的诉讼,TruDi系统"误导并错误引导"了迪恩。据称,一条向大脑、面部和颈部供血的颈动脉受损,导致血栓形成。

根据法庭文件,拉尔夫的律师告诉法官,迪恩自己的记录显示他"完全不知道自己靠近颈动脉"。路透社无法查阅这些记录,因其受司法保护令限制。

拉尔夫出院后,明显出现了中风症状。据为支持其康复发起的GoFundMe筹款活动信息显示,这位四个孩子的母亲重返医院,在重症监护室度过了五天。筹款页面说明,医生为她进行了部分颅骨切除手术,"以便为大脑肿胀留出空间"。

"我仍在接受康复治疗,"拉尔夫在一年多后接受一次关于中风患者的博客采访时表示。"不戴支架走路很困难,让我的左臂重新恢复功能也很艰难。"

2023年5月,迪恩在另一例鼻窦手术中使用TruDi系统时,患者唐娜·费尼奥夫的颈动脉据称发生"爆裂"。

根据费尼奥夫在沃思堡美国地方法院对Acclarent及多家制造商提起的诉讼,血液"喷溅得到处都是"——甚至溅到了正在观摩手术的Acclarent代表身上。费尼奥夫的一条颈动脉受损,诉状称她在手术当天就发生了中风。

诉讼指控称,Acclarent公司"明知或应知所谓的人工智能导致或加剧了集成导航系统产品存在不一致、不准确和不可靠的倾向"。

根据法庭文件显示,Acclarent 公司已对两起诉讼中的指控予以否认,目前案件仍在审理中。该公司在法庭文件中表示,其并未设计或制造TruDi系统,仅负责分销。

Acclarent的母公司Integra LifeSciences向路透社表示,没有证据表明人工智能技术与任何所谓的伤害存在关联。

根据追踪企业与医生财务关系的联邦数据库Open Payments显示,迪恩于2014年开始为Acclarent提供咨询,截至2024年已从该公司获得超过55万美元的咨询费。其中至少有13.5万美元与TruDi系统相关。

迪恩的律师表示,由于患者隐私和诉讼仍在进行中,医生无法置评。Integra公司称迪恩已不再是TruDi的顾问,收购Acclarent后支付给他的款项仅用于餐费。

2021年,时任Acclarent总裁的杰夫·霍普金斯曾力推将人工智能技术植入TruDi设备,据费尼霍夫的诉讼称,此举旨在将其包装为"营销工具",宣称该设备"拥有新颖独创的技术"。

据Acclarent在LinkedIn上发布的文章介绍,TruDi软件运用机器学习技术识别患者解剖结构的特定部位,并计算"医生指定的两点间最短有效路径"。该技术旨在简化手术规划,并在鼻窦手术等操作过程中提供实时反馈。

根据Fernihough的诉讼文件,Acclarent高管曾就引入人工智能的计划与Dean医生进行沟通。诉状指出,这位外科医生曾警告霍普金斯医院和Acclarent公司"存在亟待解决的问题"。

诉讼称,尽管收到警告,Acclarent仍"降低安全标准以加速新技术上市",并设定"部分新技术在整合至TruDi导航系统前仅需达到80%准确率"的目标。

路透社无法核实Dean医生是否发出过警告。由于相关材料受司法保护令限制,记者未能查阅Fernihough主张所依据的证明材料。

错误的身体部位

美国食品药品监督管理局提醒,不良事件和设备故障的报告信息有限:它们往往缺乏细节,为保护商业秘密而经过编辑,且不能单独用于归责。该机构有时还会收到针对同一事件的多份报告。

路透社发现,在2021年至2025年10月期间提交给美国食品药品监督管理局(FDA)的报告中,至少有1,401份涉及FDA清单上1,357种使用人工智能的医疗器械。该机构表示这份清单并不全面。在这些报告中,至少有115份提到了软件、算法或编程问题。

2025年6月的一份FDA报告指出,用于产前超声检查的人工智能软件存在误判胎儿身体部位的问题。这款名为Sonio Detect的软件采用机器学习技术辅助分析胎儿影像。

报告指出,“Sonio Detect 软件的人工智能算法存在缺陷,错误标记胎儿结构并将其与错误的身体部位关联”,但并未提及有患者因此受到伤害。Sonio Detect由三星电子旗下子公司三星麦迪逊所有。三星麦迪逊表示,美国食品药品监督管理局关于SonioDetect 的报告“并未指出任何安全问题,FDA也未要求Sonio采取任何行动”。

美国卫生与公众服务部发言人未就Sonio Detect相关问题作出回应。

至少有16份报告声称,医疗设备巨头美敦力公司生产的AI辅助心脏监护仪未能识别异常心律或停搏。这些报告均未提及人员受伤情况。美敦力向美国食品药品监督管理局表示,部分事件系"用户操作混淆"所致。

美敦力公司LINQ系列植入式心脏监护仪中的AI算法被描述为"深度学习人工智能"。据该公司网站介绍,这些算法大幅减少了误报,同时保留了真实的心脏事件警报。但该公司在其网站和产品资料中也指出,其AccuRhythm AI技术可能对实际异常心律或停搏进行错误分类。

美敦力公司向路透社表示,其已审查全部16起事件,并确认其设备仅漏检一次异常心律事件。"这些报告均未对患者造成伤害。"该公司称部分事件与数据显示问题相关,而非人工智能技术本身。美敦力拒绝就每起事件的具体故障原因作出全面说明。

美国卫生与公众服务部发言人表示,该机构不会讨论可能或正在进行的合规事宜。

特朗普任内FDA预算削减

在接受采访时,五位曾审查人工智能医疗设备的现任及前任FDA科学家向路透社透露,联邦监管机构如今应对新设备涌现的能力已大不如前。

大约四年前,FDA扩充了其人工智能专家团队,专门负责审查应用该技术的医学影像和放射学设备。许多新招募人员被分配至影像、诊断与软件可靠性部门(DIDSR)。

据一位现任和两位前FDA员工向路透社透露,该部门已成为评估医疗领域人工智能安全性的核心机构,去年初团队规模已扩展至约40人。

一位前员工表示:"部分资深监管人员完全不了解这些技术的运作原理。我们曾与高级监管人员密切沟通,向他们解释为何我们认为这项技术适合或不适合投入市场使用。"

吸引顶尖人才进入政府部门工作并非易事。招募计算机科学家通常需要说服他们放弃私营部门更高的薪酬。

一位前员工表示,科学家们在工作中试图"破解"这些设备的AI模型。他们会在各种临床情境下测试设备的算法,并检查AI性能是否会随时间推移而下降。

FDA官员在10月发表的论文中指出,他们还致力于减少"幻觉"现象——即AI模型有时会生成虚假信息。

但去年年初,特朗普政府开始解散人工智能团队,作为埃隆·马斯克削减成本行动的一部分,该行动由政府效率部(DOGE)负责。

据FDA内部人士透露,数字创新与战略资源部(DIDSR)的40名人工智能科学家中,约有15人被解雇或选择离职。

另一个负责制定使用人工智能设备政策的部门——数字健康卓越中心,其约30名员工中约有三分之一离职。

美国卫生与公众服务部发言人安德鲁·尼克松表示,美国食品药品监督管理局对采用机器学习及其他人工智能技术的医疗设备,正实施与任何产品同等严格的监管标准。

"患者安全是FDA的最高优先事项,也是我们保护并促进公众健康工作的核心,"尼克松表示。"FDA在数字健康领域看到了巨大的潜力,"包括搭载人工智能和机器学习的设备,"这些技术有助于诊断和治疗多种疾病。"他称FDA正持续招募并培养在数字健康、人工智能及其他新兴技术领域具备专长的人才。

据两名前员工透露,裁员后部分器械审查员的工作量几乎翻倍。一位去年离职的前器械审查员表示:"如果资源不足,疏漏就更可能发生。"

FDA要求新药进行临床试验,但医疗器械面临不同的审查标准。根据FDA规定,大多数上市的人工智能设备无需在患者身上进行测试。

华盛顿大学圣路易斯分校医学院讲师、医疗器械监管专家亚历山大·埃弗哈特博士指出,制造商通过引用先前已获批准但不具备人工智能功能的设备,即可满足FDA的监管要求。

将新设备定位为现有设备的更新版本,是一种长期存在的做法,但埃弗哈特表示,人工智能给现状带来了新的不确定性。

埃弗哈特对路透表示:"我认为美国食品药品监督管理局监管医疗设备的传统方法,不足以确保人工智能技术的安全性和有效性。我们依赖制造商做好产品上市工作,但我不确定FDA现有的监管措施是否构成了有效的防护栏。"

刊载:路透社

作者:杰米·道德尔、史蒂夫·斯特克洛、查德·特休恩、雷切尔·利维

https://www.reuters.com/investigations/ai-enters-operating-room-reports-arise-botched-surgeries-misidentified-body-2026-02-09/

编译:24时观象台