智东西4月2日报道,今天,百度健康发布了国内首个医生版“龙虾”——有医助理,这是国内首款基于Claw框架打造的医生任务型AI助手。区别于市面上多数停留在医疗百科或通用问答的AI产品,有医助理首创“检索+任务”双引擎模式。
▲百度健康有医助理发布会
检索模式定位“中国版OpenEvidence”,底座整合了6000万+专业文献、20万+用药知识图谱、5万+权威指南共识、2万+医学书籍,主打每条结论可溯源至原文;任务模式则基于Claw框架,涵盖内容创作、学术检索、临床诊疗、科研论文、患者管理5大场景,共计800+项Skill。此外,百度健康还与中国抗癌协会达成战略合作,率先全量引入覆盖53大癌种的CACA指南及72项诊疗技术指南。
简单说,百度健康想让这个AI助手不只是能“回答问题”,还能真正帮医生“干活”。
听起来很诱人,实际表现如何?智东西围绕文献检索、科普写作、临床诊断三大核心场景进行了实测。
体验地址:
1、https://muzhi.baidu.com/workbench/web/main
2、百度健康工作台APP首页“问AI”
一、检索模式:医生几天的文献调研,AI一次对话完成
文献检索是医生日常最高频的需求之一。传统方式下,医生需要在多个数据库反复检索、逐篇筛选、手动整理,一次系统性的文献调研往往需要数天。有医助理的检索模式,试图将这个过程压缩到一次对话内完成,输入需求后,自动检索、筛选、汇总,并附上可溯源的引用。
针对检索能力,我们进行了如下测试。
提示词:我是一名神经外科的医生,我想找一些关于脑出血术后康复的文献,给我汇总出来。
有医助理很快就检索了27篇文献,并筛选其中的20篇进行了汇总整理,生成了一份结构化的“脑出血术后康复文献汇总报告”,涵盖概要、康复原则、治疗具体内容及影响因素等板块,层次清晰。
同时,还把文献放置在右边栏中,可查看引用段落,点开可以获取链接或PDF版文献,出处真实靠谱,中文文献能够直接下载,十分便捷。
后面,我还要求它以APA格式输出全部引用文献并附DOI,很快也完成了任务。
可以看到,文献均来自近五年的权威期刊,其中还包括中华神经外科杂志、中国医院药学杂志等北大核心期刊,专业性很强。
二、任务模式:医生版“龙虾”初现雏形,开始帮医生接活了
检索之外,文书工作也会占用医生很长时间。有医助理的任务模式,多少已经有点医生版“龙虾”的意思了,能直接帮医生接手部分工作。
下面,我们用一个科普写作需求来测试它的任务执行能力。
我们让有医助理撰写一篇面向2型糖尿病患者的饮食管理科普文章,要求语言通俗易懂,避免专业术语,列出常见饮食误区,字数控制在800-1200字,适合微信公众号发布。下面是它的回答:
从内容质量来看,专业性是有保障的,基本没有明显错误,核心原则也符合现有的糖尿病饮食管理建议,这些内容对患者来说很有价值。
不过,还是存在一些小问题。我们的提示词里要求“800-1200字,适合微信公众号发布”,但有医助理给我们的是一份结构化报告,字数也明显超出要求。如果一位医生希望直接拿这份输出去发公众号,还需要自己做很多改写和删减。
所以,有医助理在内容生成的专业性上还是有保障的,但对输出格式、篇幅等要求的理解还不够精准。看来医生版“小龙虾”更擅长“写报告”,不太擅长“做科普”。
三、检索与任务模式联动,辅助医生诊断
文献能查、文章能写,但医生最核心的工作始终是临床决策。
我们输入了一份包含主诉、现病史、既往史、查体及辅助检查的完整病历,让有医助理帮我们进行诊断。
58岁男性,间断性胸痛3天,加重6小时,压榨样,伴出汗恶心;高血压10年控制不佳,吸烟30年;心电图V4-V6导联ST段压低,肌钙蛋白轻度升高。
系统很快给出了一份诊断报告,把首要问题判断为非ST段抬高型急性冠脉综合征(NSTE-ACS),同时提到患者还存在高血压控制不佳的问题。
从这份结果来看,它的分析思路还是比较清楚的,不是只给结论,把判断依据也列了出来。
另外,它也没有把问题说得过于单一,而是进一步提醒医生注意几种不能漏掉的危险情况,尽量补充医生实际看诊时会关心的风险点。
当然,需要强调的是,有医助理在产品定位上也明确了自身是“辅助诊断”而非“替代诊断”。最终的临床决策仍然需要医生结合患者的具体情况做出判断。但作为一个“随时在线的会诊助手”,它在诊断推理的准确性和结构化呈现上,已经展现出了实用价值。
此外,有医助理还能辅助科研,提供论文选题、研究方向、研究方案设计等,不过论文写作这方面的任务还不能完成。
结语:医生版“龙虾”下一步,是真正进入医生的日常工作流
整体来看,有医助理已经长出医生版“龙虾”的样子,不只会聊天、会回答问题,同时具备“查”和“做”的能力,能够覆盖文献检索、病历整理、科研支持、患者管理等高频场景。不过,它离成熟稳定、真正深度进入医生日常工作流,还存在一定的提升空间。
从这次实测看,它在文献检索、信息整理和辅助判断上已经展现出一定实用价值。放到更大的医疗AI赛道里看,接下来真正值得关注的,不是谁更会答题,而是谁更能真正帮医生省时间、减负担,把AI从工具栏里的聊天框,推进到真实工作流里。
热门跟贴