OpenAI 办了一场内部分享,主题是 ChatGPT HealthOpenAI for Healthcare

三位嘉宾,都是 OpenAI 的高管:

  • Kate Rouch ,OpenAI CMO,此前在 Coinbase 主导了超级碗弹跳二维码广告,在 Meta 待了十年

  • Nate Gross ,OpenAI 健康副总裁,医学博士,Doximity 和 Rock Health 联合创始人

  • James Hairston ,OpenAI 创新政策总监,负责健康、设备和机器人领域,此前在 Meta 领导 VR/AR 政策团队十年

Kate 站在台上,讲的第一件事,便是是自己过去一年的乳腺癌诊疗经历

 Kate Rouch,OpenAI CMO
打开网易新闻 查看精彩图片
Kate Rouch,OpenAI CMO

她说自己有很棒的医生,但分布在太多专科。有大量复杂的临床文献和临床决策,她需要有人用她能理解的水平解释清楚

她用 ChatGPT 做了这些事:

理解临床文献
问 ChatGPT 某篇论文的样本量是多少,统计显著性适不适用于她的特定乳腺癌亚型。她说这是「更高级的用法」,需要理解的不只是乳腺癌,还有具体亚型的研究现状

处理保险理赔
理赔被拒,让 ChatGPT 帮她重写申请,最终获批。她说诊断中的很多压力来自行政方面:理赔被拒、不理解保障内容

跟孩子沟通
她有三岁和六岁的孩子。问 ChatGPT「如何用适合三岁孩子的方式谈论癌症」,有什么书可以参考

准备专科就诊
帮她优先排列要问各位专家的最重要问题。她说与专科医生的时间很宝贵,必须确保问出最重要的问题

理解治疗副作用
某个症状是不是正在接受的治疗的副作用?人们通常怎么缓解这些症状?

Kate 在 UCSF 接受治疗,那里和 OpenAI 在同一条街上。她所有的医生都知道她在用 ChatGPT,会一起讨论她查到的东西、医生的看法

打开网易新闻 查看精彩图片

她说这让她「感到更知情、更有信心,理解自己一路上做出的决定」

插入个题外话:听了她的分享,我莫名想到了牢A的「斩杀线」理论,也莫名想到了绝命毒师中的老白

每天 4000 万人

Nate Gross 给了一组数据:

每周使用 ChatGPT 的 8 亿人中,四分之一会提交健康相关问题 相当于每天约 4000 万人
打开网易新闻 查看精彩图片
每天 4000 万人问健康问题

还有一个数据:九分之七的对话,发生在医生下班后

Nate 说大量医疗行为发生在就诊之外。预约前后的问题、迟迟才到的检查结果、围绕诊疗的各种文书和后勤工作。人们已经在用 ChatGPT 来准备、翻译、总结、核对这些环节中的信息

1 月初各家都在发医疗产品。OpenAI 1 月 7 日发 ChatGPT Health,Anthropic 1 月 11 日发 Claude for Healthcare,相隔四天

碎片化整合

Nate 说医疗系统是碎片化的、孤立的

部分原因是诊疗服务、商业模式、保险、监管环境各自演化的结果。部分原因是专业化带来的权衡,高级诊疗需要不同地方的不同专家

但最终,这些孤岛造成了知识断层和诊疗挑战

打开网易新闻 查看精彩图片

你的检验结果在这里,病历在那里,可穿戴设备的数据在另一个地方。互不连通,患者成了整个系统的集成层

ChatGPT Health 做的事情是打破这些孤岛

同步病历

通过 b.well 连接 220 万美国医疗机构和 320 个健康计划。用户可以选择同步分散在不同系统中的病历,这些系统今天互不连通

接入可穿戴设备

Apple Health、Peloton、MyFitnessPal、Function Health。Nate 说大多数医生没有时间或界面来轻松查看这些数据

个性化回答

搜索引擎每次都「失忆」,不知道你是 25 岁还是 75 岁。ChatGPT 的查询会基于用户选择分享的个人背景

Nate 举了个例子:去餐厅拍一张菜单照片,问 ChatGPT「我今晚点餐应该注意什么」

打开网易新闻 查看精彩图片

它会基于你的检验数据和健康目标给建议

他说 ChatGPT 是向「个人超级助手」迈出的又一步,能用信息和工具支持用户实现生活各方面的目标

目前 ChatGPT Health 是 waitlist 阶段

打开网易新闻 查看精彩图片

临床端

OpenAI for Healthcare 给医院和临床医生用

首发合作伙伴 8 家,覆盖不同诊疗场景:

  • • 儿童医院:波士顿儿童医院、Stanford Medicine Children's Health

  • • 学术医疗中心:UCSF

  • • 专科医院:纪念斯隆-凯特琳癌症中心

  • • 大型医疗服务系统:HCA Healthcare、Cedars-Sinai

Nate 自己是医生,他说临床医生可以用它做三件事:

基于证据的综合分析

回答植根于真实医学来源,包括同行评审研究、公共卫生指南、临床指南。带引用链接,可以验证标题、发表日期、期刊,点击阅读原文。AI 成为你仍可深入核实的合作伙伴

与机构政策对齐

美国各地诊疗实践不同。通过 SharePoint 集成,回答可以反映该医院批准的政策、诊疗路径和治疗方案,让团队遵循同一套规范

加速文档工作

出院摘要、患者须知、临床信件、转诊信、事先授权支持。还可以将患者材料调整为易读、翻译后的版本

 临床端逻辑
打开网易新闻 查看精彩图片
临床端逻辑

Nate 说医院最大的瓶颈是时间

临床医生没有足够时间阅读所有内容、解释清楚、跟上信息洪流。AI 做初步的繁重工作,综合知识、起草、翻译复杂信息

还有一个瓶颈是碎片化。诊疗越来越分散在不同专家、不同场所、不同 IT 系统之间,这些系统互不连通。AI 擅长汇集这些信号,病历、影像报告、检验结果、床位问题、可穿戴设备,呈现一个连贯的故事

还有一个现实:医院领导知道临床医生已经在用 ChatGPT 了

Nate 说需求是真实的,假装不知道只会制造行政和 IT 风险

打开网易新闻 查看精彩图片

机会在于把这种使用以安全、可审计、透明、符合机构政策的方式纳入企业

250 名医生参与训练

安全性方面,OpenAI 和超过 250 名医生合作改进模型处理健康问题的方式

训练内容包括:何时提出追问、如何表达不确定性、何时引导用户寻求专业诊疗

打开网易新闻 查看精彩图片

他们做了 HealthBench 评估。评分项包括:事实准确性、是否包含关键考量、是否遗漏重要风险。Nate 说这给了一个非常现实的信号,展示模型在真实医疗工作流中的表现,而非选择题式的考试评估

外部基准方面,OpenAI 的模型在 GPDVal 的所有健康职业领域优于行业专家

ChatGPT for Healthcare 发布前经历了 9 轮医生主导的红队测试,历时 5 个月

 安全性投入
打开网易新闻 查看精彩图片
安全性投入

Nate 说目标不是追求完美,是构建在高风险场景中始终表现得深思熟虑、保守、透明的系统

Q&A 环节

分享会后半段是观众问答,有几个有价值的问题

关于 EMR 集成

UCLA 儿科医学院的 Sharam Yazdani 问是否有计划直接集成到 Epic 等 EMR 系统

Nate 说技术已经有了,现在是部署挑战。科技行业和医疗行业长期以来像油和水,解决方案往往不完全契合工作流。他们和早期合作伙伴一起决定:在什么时刻,EMR 集成最有价值?

可能是开车上班时讨论患者名单。可能是整合一个从远方转诊来的、有大量分散数据点的患者

关于情感支持

有人问 AI 在情感上可以扮演什么角色,边界在哪里

Kate 说这个产品专注于身体健康。对于困难健康状况中的情感支持,会引导用户到产品之外的支持资源

但她认为诊断中的很多压力来自行政方面:保险理赔被拒、不理解保障内容。把产品定位在「帮我理解发生了什么、帮我准备就诊、帮我理解保障」这些事情上,实际上是减轻患者压力的核心

关于十年后的未来

有人问这次发布作为信号,预示十年后会怎样

Kate 说很难理解变化的速度。ChatGPT 本身才发布三年。如果想十年后,当然要脚踏实地,但全球数以百万计的人有可能获得变革性的结果

Nate 说医学一直是一套积木。ChatGPT Health 中构建的东西来自数十年的工作:两党政府团体为患者数据访问权所做的努力、数据交换标准、各种支撑 AI 和帮助翻译内容的底层技术

他希望这将成为又一块积木。医疗领域有太多挑战,没办法在一年内宣布任务完成,可能十年也不行

一年后的成功

James 问了一个问题:
一年后来说,成功会是什么样子?

Nate 说,对消费者,成功是「感觉不那么孤独、不那么不知所措,有一个可信赖的地方来理清事情,准备与临床医生的对话,理解自己的诊疗过程」

对临床医生,成功是「解脱」。更少时间损失在行政工作上,更有信心自己在基于正确的证据工作,减少倦怠,有更多时间陪孩子

对企业合作伙伴,成功是「信任」。知道 AI 的使用是安全的、可审计的、与临床判断保持一致的

Kate 说,帮助人们理解涌来的健康信息,把信息转化为更好的结果

她在台上的最后一句话:

产品团队做得很出色,确保使用这项技术的人的声音被纳入 我的声音是其中之一,但还有很多很多声音