打开网易新闻 查看精彩图片

2026,AI医疗已成燎原之势,但一线医护人员的体感,却常常被忽视。

无论模型如何更迭,能否被医生群体大规模采用,才是AI真正渗透医疗保健的关键。

但目前,临床一线“不敢用、不会用、不爱用AI”的情况仍普遍存在。

近期,张文宏教授拒绝把AI引入医院病历系统,成为舆论热点。

这背后,其实体现了广大中国医生对AI“幻觉”的高度警惕。

而在美国,OpenEvidence已经吸引了近半数的医生使用。

这揭示了一个关键现实:医生并非抗拒技术,而是渴望真正可用、可靠、可及的AI工具。

如何打动医生这一用户群体,成为推动中国AI医疗发展的关键命题。

而今天,百川智能给出了答案。

就在刚刚,百川智能Baichuan-M3 Plus正式发布。

这是继上周发布并开源最强医疗大模型Baichuan-M3后,又一次重大的升级。

新模型在幻觉控制能力上进一步提高,幻觉率降低至2.6%,刷新了M3所创下的世界纪录。

打开网易新闻 查看精彩图片

同时,首创“证据锚定”技术,让每一句结论,都可核验、可追责、可教学。

不仅如此,新模型使用成本进一步降低,仅为上一代M2 Plus的30%,扫清规模化应用障碍。

更加惊喜的是,百川宣布,全面开放M3 Plus的技术能力,API限时免费体验15天,所有开发者均可申请使用。

并且,百川正式发起「海纳百川」计划,面向所有为医务工作者提供服务的机构,免费提供M3 Plus的API。

这意味着,公司选择将全球最强的医疗AI能力交付给更多的生态伙伴,向行业打开了一个共赢的未来。

百川智能创始人王小川表示:“我们希望让更多人有机会体验并受益于当今全球最先进的大模型技术,让医疗行业这片‘大海’依托‘百川’的先进能力,全面提升医学服务水平。”

凭借极致的性能优化与普惠的开放精神,百川正在打通顶尖模型与真实诊疗场景的最后一公里。

而最终受益的,将是每一位对健康生活怀有期待的普通人。

三大突破,重新定义医疗大模型的“可用、可信、可及”

三大突破,重新定义医疗大模型的“可用、可信、可及”

1、幻觉率再创新低:坚守医疗AI可靠性红线,解决医生“不敢用”。

幻觉是大模型与生俱来的算法特性,但在医疗场景,幻觉意味着风险。

像deepseek、豆包这样的通用大模型,存在大量的幻觉,无法让医生建立信任。

出于对行业的深刻洞察,百川率先将“降低幻觉”列为重点目标。

去年发布的Baichuan-M2 Plus,百川首创了“六源循证”,将循证医学范式引入模型。

直接结果是,M2 Plus的幻觉率较通用大模型显著降低,仅为deepseek-r1的1/3,比肩资深临床专家。

而百川上周发布的Baichuan-M3,则再次大幅降低了幻觉,

团队首创了一套事实感知强化学习(Fact-Aware RL)架构,使得M3在不依赖任何外部工具的情况下,幻觉率降至3.5%。

这一数字,击败了最新的GPT-5.2,位列全球最好成绩。

本次推出的M3 Plus,在M3的底座上,融合了M2 Plus的灵魂——六源循证。

幻觉率进一步降低,仅为2.6%,相较GPT-5.2大幅下降超30%,也超越了Open Evidence。

2、首创“证据锚定”:每一句结论皆有据可依,使医生真正“信得过”。

在医疗中,对于证据的引用是“必选项”。

医生是否信任AI,往往取决于AI能否出真实、准确的文献出处。

长期以来,行业对引用的关注,流于表面。

即只要求“引用有”,不要求“引用对”。在准确性方面,缺乏重视。

这导致,当前医疗大模型在引用时常出现各种错误。

要么是引用编号存在,但文献内容对不上(张冠李戴)

要么是文献本身正确,但被引用的段落与结论并不匹配,甚至存在拼接、误读(内容冲突)。

为此,在M3 Plus的训练中,百川首创了“证据锚定(Evidence Anchoring)”技术。

简单说,就是在模型的每一次引用中,都加入明确的奖惩机制。

每当模型进行错误引用,惩罚机制就会介入,帮助修正。

让模型只能在“确实有证据支持”的空间中推理与生成,“引用正确性”被内化到模型训练的始终。

最终,结论与证据段落的匹配准确率超过95%,真正让AI的医学判断做到可核验、可追责、可教学。

打开网易新闻 查看精彩图片

3、价格下探70%:工程优化大幅降低成本,让医疗行业“用得起”。

医疗AI要广泛应用,效果可靠是门槛,成本才是命门。

即便是最先进的模型,如果跑不动、用不起,也无法在大规模临床中产生价值。

M3 Plus直面这一挑战,在不牺牲性能的前提下,将综合使用成本较上一代降低了70%。

这背后,是百川对模型架构和推理路径的极致优化。

所有这些努力,最终指向一个目标:让强大的医疗AI,用得起、跑得快、落得下。

超越OpenEvidence,百川做的更多、想的更远

超越OpenEvidence,百川做的更多、想的更远

在讨论AI医疗之时,一个绕不开的案例便是OpenEvidence。

这家公司专门为医生群体打造了一个可信赖的“医疗版ChatGPT”。

这款AI产品不接受互联网信息,只在专业医学期刊的高质量数据上训练,从源头上减少了幻觉问题。

短短几年,OpenEvidence便创造了医疗APP史上的增长神话。

如今,超过45%的美国医生使用OpenEvidence,每年超过1亿美国人接受了医生使用OpenEvidence进行治疗。

就在昨天,OpenEvidence宣布完成2.5亿美元D轮融资,最新估值达120亿美元。

OpenEvidence的成功,向行业传递出一个关键信号:

在医学信息爆炸式增长的今天,一款可靠、好用的AI助手,是医生群体的“必需品”。

而对于中国的医生来说,这一庞大的需求尚未满足。

瞄准这个痛点,百川不断实践,探索出一条更加符合中国国情的医疗AI落地之路。

在性能层面,团队做到了领跑全球,

凭借独创的六源循证技术与M3基座结合,M3 Plus将幻觉率降低至2.6%,优于Open Evidence。

在战略层面,百川更是降维打击。

与单纯做一款应用不同,百川选择了难度更高、意义更大的路径:

免费提供M3Plus的API,将全球幻觉最低的循证增强医疗大模型开放给整个医疗行业。

这意味着更多医疗机构、开发者可据此快速开发出适合自身需求的医疗AI应用。

这一行动,为AI医疗的应用提供了更多可能,触达更丰富多元的真实场景。

当前,医院仍是医疗服务的中心,医生仍是医疗过程的核心。

团队对此有深刻理解,选择用极致的技术透明和普惠精神,让大模型与医生、医院建立合作信任。

此次推出的「海纳百川」活动,便是上述理念的生动诠释。

王小川表示,希望通过免费、持续且长期的使用,让行业伙伴能够更加安心地探索与尝试,深入理解各类应用场景,最终为患者带来福祉。

最终,百川想要做的,是将顶尖医疗模型能力,转化为“医院能用、医生敢用、患者愿用”的基础设施,加速中国AI医疗的全面普及。

百川智能,为全球AI医疗树立标杆

百川智能,为全球AI医疗树立标杆

进入2026年,医疗已经成为AI比拼的主战场。

1月8日,OpenAI推出了旗下首款AI医疗产品ChatGPT Health,允许用户将医疗记录和健康应用连接至AI,打造“个人超级健康助手”。

1月11日,Anthropic官宣Claude for Healthcare,瞄准整个医疗系统、保险、患者、乃至上游药物研发等各个环节。

1月13日,谷歌发布最新开源医疗模型MedGemma 1.5,在多模态应用上实现重大突破。

AI巨头布局医疗健康的动作明显加快,印证了王小川之前的判断:医疗正迅速从「非共识」走向「共识」。

而百川智能,正是第一家探索AI与医疗如何高效结合的大模型公司。

一路走来,百川持续深耕医疗这一高度垂直的领域,在底层模型上具备深厚积累,并持续探索医疗AI落地路径。

当前,AI+医疗方兴未艾,于真实场景的应用更是处于早期。

通过开放合作构建宽广的创新生态,将蛋糕做得更大,最终带动整个行业的繁荣,是百川智能作为领军者的战略远见。

站在AI深度融入医疗健康的关键节点,百川愿与上下游合作伙伴深度协同,共同加速“天下无病”的到来。