出品 | 网易科技《态度》栏目

作者 | 袁宁

编辑 | 丁广胜

在医疗 AI 仍被质疑“能不能真的进医院”的当下,百川智能率先把门槛推倒了。

1月22日,百川智能发布医疗大模型 Baichuan-M3 Plus,并同步宣布“海纳百川”计划——向中国医疗服务机构免费开放 API。

这也意味着,无论是公立医院、民营医疗集团,还是区域医疗平台,都可以在不承担模型调用成本的情况下,直接接入百川的医疗大模型能力。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

在官方披露的数据中,M3不仅在 HealthBench、HealthBench Hard 等权威评测中登顶,还在低幻觉率这一 OpenAI 长期占优的核心指标上,以3.5%的幻觉率实现反超。

为解决医疗 AI 最致命的“胡说八道”问题,M3 Plus 首创了“证据锚定(Evidence Anchoring)”技术。它摒弃了笼统的文献引用,要求模型生成的每一句结论,必须精确“锚定”到原始指南或论文的具体段落。这种逐字溯源、逐条核验的能力,使结论与证据的匹配准确率超过95%,也让 AI 的判断变得可核验、可追责。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

“我们就是医生版的最强 ChatGPT 或 DeepSeek。”王小川在发布会上如此定义这款产品。

但技术超越并非终点。王小川指出,中国医生日均接诊上百人的高强度工作环境,与国外截然不同,这注定了中国医疗 AI 不能只做简单的工具。

百川之所以免费开放 API,是为了让技术真正渗透进诊疗环节,辅助医生高效工作,让行业“大海”中的更多机构加入,最终指向一个更宏大的终极目标——改善中国紧张的医患关系。

以下为王小川与《网易科技》等的交流,经不改变原意的编辑。

提问:海纳百川计划宣布API免费开放,这是一笔多大的支出?

王小川:要是全部临床医生都使用AI,我们觉得一年的成本也就是1亿左右。中国现在有500万的医学工作者,我们认为这种成本是可接受的,带来的行业变化会非常大。

提问:主要目的就是想让大家用起来是吗?

王小川:要让大家享受到今天世界上最好的模型,就是看到和体验。不只是我们一家能用上,海纳百川就是让行业“大海”中更多的机构都能够做好医学服务。

国家去年就一直在倡导AI+医疗,但今天美国跑得比我们快,医生都在使用OpenEvidence,ChatGPT可以让2亿患者用到,中国需要追赶上去,由于国情不一样,需要更多的机构参与,不管是厂商还是院外的服务,社会主义就是能够共创,我们认为这是应该承担的一种方式。

提问:“海纳百川计划”主要面向机构,但基层医生(如三四线城市)对AI不了解且有被替代的忧虑,如何让他们用起来?另外,美国OpenEvidence主要向医生收费,但中国医生很难付费,未来C端的营收模式怎么建?

王小川:我们对于机构的要求就是机构本身服务医务工作者,所以这是我们的限定。

今天患者付费或者生命模型涉及的药物研发更加长期,只要能够把医疗水平提上去,让患者受益,不管是患者还是药厂都能够得到新的商业模式。

并不是向医生收费,其实之前向医院、医生收费的商业模式已经被证明是不成立的。

提问:现在有多少医生在使用你们专业版的产品?他们使用的场景主要是什么?

王小川:我们看到医生的留存率还是蛮高的,更多的是年轻的医生在使用,更加拥抱AI,确实也有很多不懂的事情,面对需要决策场景的时候真正需要的是一个专家跟自己一起来做,但没有那么多专家,AI就充当了很好的角色。

我们看到非常有意思的Case就是医生说“我认为我的主任说得不对,这个病人不应该转院,我还有几分钟跟主任讨论,你给我一些证据支持我”,就是类似这样的场景。可以看到非常负责任、非常上进的年轻医生对于自己有很高的要求,需要更先进的工具支持,我们的服务是给他们提供帮助,最终还是患者受益。

提问:你们跟儿童医院、肿瘤医院合作的话,这一部分的AI应用是处于什么阶段?哪些事情AI能够做到,哪些事情AI做不到?

王小川:去年我们就在医院里面部署系统,肿瘤属于皇冠上的明珠,我们已经在和医院深入合作,不仅推动医院的使用,甚至把百川作为药厂进行Clinical Trial,就是注册开展研究,下次我们会再和大家分享这方面的进展,我们在最硬核的医学学科会有新的突破。

提问:API会不会成为比较重要的竞争入口?刚才提到价格降低70%,要是抛开免费计划的话,你们的成本在行业大概是什么水平?

王小川:API开放是我们战略的一部分,一方面是让行业有更多伙伴们,共同来服务医生,另一方面是改善医患关系,所以通过医生可以直接服务患者。我们跟其他厂商的想法不太一样,终极目标解决改善医患关系,开放目的也是让医疗机构拥抱AI,带来一些快速的理解,有利于医生与患者共同做好服务关系。国内没有我们这种做法,我们的重点主要是改善医患关系。

鞠强:我们的专业度肯定是最高的,成本要比通用模型的价格还要低,至于低多少,我们后续会正式汇报,肯定是比DeepSeek、千问模型的成本更低。

王小川:Token的成本是比DeepSeek更低,但是幻觉会引入额外的计算,同样的Query其实是比DeepSeek更贵,但医疗场景就不应该和DeepSeek对比。

提问:免费时间有大概的预期吗?

王小川:对于加入海纳百川计划的机构,我们是永久免费的,可以得到完整的生态服务。

提问:之前的M3模型更强调患者(To C),这次更强调To B(医生/机构),未来这两条线是并存还是阶段性的?最终是做制药吗?

王小川:我们的布局是很完整的,今天不会完全公开背后的思路,但M3不是给患者的,M3属于开源模型,本身就是为行业赋能,M3 Plus是前进了一步,能够更好地为医生、行业机构提供服务,再往下就会接触患者,不断地为大家公布产品。

今天医疗本身就是有患者、医生、药械、科研的整体,医学是一种不发达的科学,需要大量的数据积累才能提升医学性能,包括药物的有效性评价。

只有在行业中串联起来,我们有足够多的解决医学真实世界的痛点以后,我们就能够更好地帮助制药,因此要在真实世界使用才能获得数据。药厂的研发大概会有12亿美金,十年时间研发一款药物,只有10%的成功率,大部分的钱都是花在临床,所以临床就需要引入医生和患者,AI就是辅助真实世界。

提问:API服务的主要客户群体有哪些?量级多少?

王小川:M2本身就有医院在使用,也有一些是给医生提供科研能力的中小型企业,我们觉得还没有分析占比,M3 Plus发布以后结构可能会有很大变化,无论是降价还是合作伙伴关系。

原来通用集团也是我们的用户,我们认为科研、临床都会有使用。今天正好是一个分水岭的起点,M3 Plus就是足够在医疗临床可用的状态。

提问:在构建模型时,除了强化学习,在人类专家反馈(RLHF)和数据质量上做了哪些工作?

鞠强:我们与其他大模型公司最大的不同是有一个专门的医生团队。

其中有来自三甲医院的专业医生全职加入百川,还有跟我们合作的肿瘤医院也有医生长期驻厂,为我们提供医学指导。此外,我们还管理着涵盖各学科的数百人兼职医学专家团队,提供专业知识和数据反馈。

提问:AGI和造医生的关系是什么?您的观察和思考是什么?

王小川:大家应该会验证我们的观点是正确的,之前我们的观点都在被验证,包括共情、低幻觉、多模态、强记忆,这些都跟医生的需求一致。

大家没有共识的使用,可以引用哈萨比斯的分类方法,弱AGI,强AGI、ASI。弱AGI就是能够取代大多数今天人类的职业,可能写代码就是一个很大的辅助。医疗行业要是能够达到跟医生同样的水平,也能够上岗,代表着对于人类职业的Benchmark。

AI和代码是两个很好的场景,甚至AI比代码更加复杂。强AGI就是达到人类顶尖水平,就像爱因斯坦、贝多芬。ASI就是人类不能企及的了,所以要和人类职业和个体进行对比。

提问:您认为什么时候能够达到这种水平?

王小川:具身智能做手术会晚一点,要是表达、察言观色的话,应该是三年以内。

提问:刚才您提到美国医生对于AI的拥抱更快,中国比较偏保守,主要是因为模型层面的差别还是其它原因?

王小川:不是模型层面,我们的模型水平应该是超过OpenAI的,主要有几个原因:今天中国医生的工作环境不一样,中国医生太忙了,美国医生可能一天看十个病人,中国医生要看上百人,每个患者只有三五分钟时间,所以美国医生可以闲下来好好用AI,他们是预约制,头一天就知道第二天谁来看病,中国医生要用AI的话就会难很多。

中国没有像美国那么真实地表达进展,就像我们发布一个模型,我们说好的话大家都不信,美国人说大家才信。不管是公司还是媒体,很多时候没有那种求真的状态,假的东西太多了,真的东西出来也难以快速取得信任,成本就会高很多。

医疗行业需要大家更加真诚地评价表达自己真实的状态,发布M2的时候,我们说比GPT5要差,高于市面上的开源模型,我们真的是这样想、这样做、这样说,M3超过GPT5就是真正超过,M3 Plus幻觉真的低于OpenEvidence,但友商会说他们跟DeepSeek一样,其他厂商幻觉比OpenEvidence多2-3倍,大家不是真诚地拥抱这种环境,导致进展慢很多,会有很多新的成本产生。

一些行业媒体说是某些模型完败百川,其实不是认真严肃的,就像手机和汽车行业的黑公关很多,医疗行业同样有这种现象。张文宏说的是AI不能服务腰部医生,头部医生可以用。大家习惯了真实环境,医生造模型是挺扯的,都是更加相信国外,国内应该更加良性竞争,把医疗行业做得更真实,这样速度才会加快,否则就会有很多“皇帝的新衣”。

提问:现在推理成本很高,为什么还引入外部工具降低幻觉?

王小川:必须以模型为核心加上循证方式,我们力所能及走到今天,已经是最优的道路了,要是有更好的技术方式,可以跟我们讲一讲。

提问:具体技术层面的区别是什么?

鞠强:我们是从最能够快速降低幻觉,最应该去做的事情两个角度思考这个问题,为什么M2 Plus采用六源循证范式?

因为循证医学是现代医学的根基,经过专家共识的权威证据,确实就是降低幻觉最有效的方式。M2、M2 Plus已经发布了几个月,很多友商都在Follow我们的技术路线开发医疗AI,我们觉得这是好事情,应该从模型本身优化的角度继续去做硬核,M3 Plus本着负责任发布的态度,把我们已有的技术积累进行结合,然后做到细粒度证据等级的校验。今天已经发布API,接下去我们还会继续开发硬核技术,因为幻觉降低和通用完全不一样。

提问:未来百川有没有可能针对垂直专科(如MDT)做细分分析,帮助医生提效?

王小川:MDT一般都是大专家来做,对于AI的拥抱度不够,可能是我们自己的宣传和产品不匹配,但现在已经够用了,关键是怎么做到场景。我们是敦促行业伙伴更多地理解和使用这样的系统,所以要看其中有没有问题。

我自己对于技术是有信心的,但产品适配需要更多公司进来,海纳百川就是针对一些技术工作者用好这样的模型,不是等着这个事情。

提问:假如AI辅助下出现罕见疑难杂症的误诊,责任和风险怎么判定?

王小川:按照今天的现行法规,模型是不能直接给出最终诊断的,因此权力和责任都是医生的,医生可以一起负担责任。美国已经开始有了一些进步,犹他州可以直接让AI开出处方药,所以这是我们可以学习的。

提问:OpenEvidence在美国通过药企营销收费(取代医药代表),百川有无此计划?

王小川:应该会有一些不一样,需要符合中国国情。就像现在药厂打广告本身是不被允许的,通过学术会议进行营销,我们有机会渗入进去。

提问:医疗领域会不会有像AI代码工具那样巨大的商业机会?

王小川:中美不一样。美国医院有巨大的提效预算(2000多亿美金),中国医院没有这个市场空间。我们必须通过更符合中国国情的生态,从药物研发和患者服务中获得回报。

提问:关于AI制药,你们会做前端的分子发现吗?

王小川:我们不做分子发现,也不做传统的患者招募。而是药效评价、药物伴随、Digital Companion的体系提高药效,变成提高药物疗效的一部分。

提问:幻觉率有没有一个可接受的值?对标的是哪类医生?

王小川:全科、专科和基层我们都会判断,但概率多低是医院接受的事情,不是百川能够判断的,就像无人驾驶出一例事故可能就是特别大的事情,虽然人类司机的事故率远远高于无人驾驶。

我们是先给医生辅助,再给患者建议。以前大家要是用百度看病,医生直接把你赶出门,现在医生已经开始接受通过DeepSeek讨论,所以未来两三年接受度会有很大的提高,就是从国家政策到行业伙伴共同努力的事情。

提问:如何让更多医生使用?市场推广有什么计划?

王小川:我们在计划中,也希望媒体朋友多帮忙呼吁。

提问:AI发展会让医生焦虑,如何解决这个问题并分配利益?

王小川:焦不焦虑跟技术没有什么关系,没有AI,医生也会焦虑,比如别人比自己晋升更快,所以焦虑的问题我们解决不了,也不是AI能够解决的。

更多的是要有沟通机会,能够让医生用好,所以我们要有合作伙伴共创,可能“上船”以后就不焦虑了。现在一边说AI有问题,不能干这个不能干那个,一边又在焦虑,这个谁管得了?医生要接受AI有些方面比他们强,有些方面比他们弱,真实了就不焦虑了。

提问:模型训练中如何平衡安全性(不踩红线)和有效性?

王小川:我们给医生的都是安全的,医生已经把关之后,AI再给出提醒,明显是有意义的,但是不踩红线。

提问:你们API向医疗开发者开放,具体会有什么二次创新?有没有代表性的案例?毕竟医疗应用不像娱乐那么有感知。

王小川:我们希望能够有好的案例,今年是特别好的一年,就是技术Ready,希望医生不要自己造模型,更多的机构可以有更多的对话,更好地帮助医生。

提问:之前不是用专业厂商的模型,非要自己做模型的原因是什么?

王小川:我也不知道。

提问:今年会推出的C端产品收费吗?

王小川:会有收费模块,但针对患者或药企收费,不针对医生和医院。

提问:中国C端用户付费难,医疗入口收费真的可行吗?

王小川:患者对自己健康是负责的。以前不付费是因为没有好的供给。如果产品能创造真正的价值,患者是愿意付费的。我们有真实案例,患者因AI解决了长期困扰的用药问题而非常感激。

提问:竞品(如支付宝、阿里)也在做,如何占领用户心智?

王小川:竞品大多绕着“严肃医疗”走,做泛健康。

我们现在更多的是要把模型做得更加专业,因为有大量的模型数据,不是当成互联网产品来做研发,能够让医生和患者体验到我们是更加负责任、更加有医学推理、更加低幻觉,就像小朋友上学找最好的学校,去医院看病找最好的医生。

提问:目前同类产品都在争夺医院入口,你们会怎么介绍自己的产品?

王小川:我们就是医生版的最强ChatGPT或者DeepSeek,用过的都觉得挺好的。