打开网易新闻 查看精彩图片

出品 | 网易科技《态度》栏目

作者 | 袁宁

编辑 | 丁广胜

账上还躺着30亿人民币,王小川并不着急。

2026年开年,中国大模型行业进入了资本兑现期。曾经同属“六小虎”阵营的智谱 AI 和 MiniMax 接连上市,月之暗面也披露了5亿美元的新一轮融资。在这个同行们忙着敲钟、兑现投资人预期的冬天,王小川选择用产品回应外界的关注:

1月13日,王小川正式宣布百川智能发布医疗大模型 Baichuan-M3。在权威评测 HealthBench 中,M3以65.1分的综合成绩位列全球第一;在考验复杂决策能力的 HealthBench Hard 上,以44.4分夺冠,实现了对 GPT-5.2的技术超越。值得注意的是,在医疗场景最敏感的“幻觉”指标上,M3将幻觉率降低至3.5%,为目前全球最低水平。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

与此同时,王小川还披露:百川有出海的计划;今年会上线免费的 C 端应用;正在自研硬件,与睡眠相关;同时,百川未来也会走向上市。

这背后,是王小川对局势的预判。就在今年1月8号,OpenAI Health 正式上线功能;而就在我们采访的当天早上,Anthropic 也宣布进军医疗,发布了针对医疗计算和 Agent 的技术能力。国内,蚂蚁集团的阿福更是开始迅速获取用户。

巨头的动作,像是一声迟来的发令枪,印证了王小川在2025年“沉默”期间的判断。他等的风终于来了。

刚刚过去的2025年,在外界看来是百川“失声”的一年,裁员传闻、融资静默,而内部发生的是一场痛苦但必要的聚焦——砍掉所有杂念,只做医疗。

“2025年我觉得最重大的事情是在组织管理上非常清楚了,就是专门聚焦做医疗。以前是分散的,现在我们把精力都收回来了。”王小川告诉网易科技。同时他表示,目前的重点在慢病、儿科、肿瘤,这三个方向。王小川还透露,现在他会亲自面试每一个新人,要看“对医疗有没有感觉”。

整场采访王小川坐在媒体中,保持微笑。这种并不紧张与外界对百川“掉队”的猜测形成了某种微妙的错位。

他不再谈论通用的语言模型竞争,而是兴奋地描绘一个“患者掌握决策权”的未来。在他看来:“长期以来,决策权都在医生手里,患者签着免责书却听不懂方案。我们做 AI,不是为了让医生下岗,而是要让决策权从医生让渡给患者,让患者明明白白地做自己健康的第一责任人。”

“去年是模型本身的进步,我们走到了医学最高峰的问题里去。”王小川说,“行业到了爆发的节点,我们的产品也 Ready 了,可以交卷了。”

以下是《网易科技》等与王小川的对话实录,经不改变原意的编辑。

网易科技:之前您很少发声,为什么现在愿意跟大家多聊聊了?

王小川:之前从通用大模型转过来做医疗,确实被骂惨了,所以我选择闭关了一段时间。现在愿意出来,是因为行业到了爆发的节点,我们的产品也 Ready 了,可以交卷了。

其实我第一天就想做医疗,我研究生是学计算机高性能计算的,当时大家都在搞天气预报,我觉得那玩意儿太不靠谱,蝴蝶效应导致不可预测。后来大概2000年左右,我接触了人类基因组计划,发现生命虽然比天气更复杂,但背后是有规律的——一个细胞10个月能变成婴儿,这背后一定有数学模型。

前20年我干互联网,接下来的20年,我认为是生命科学和 AI 结合的突破期。现在的语言模型能解决“智力”问题,未来我们要解决的是“身体”的问题。

网易科技:虽然刚进入2026年,其实AI圈已经发生了很多大事件了,当下您会怎么评价现在的百川?回顾过去一年,您觉得百川做了哪几件关键的事?

王小川:去年我觉得最重大的事情是在组织管理上非常清楚了,就是专门聚焦做医疗。以前是分散的,现在我们把精力都收回来了。

在技术上,我们通过 M2、M3模型把“医疗最强”的概念留住了,特别是把“循证”和“会问”这两个核心能力拎起来了。除了全科和儿科,我们在肿瘤这个医学皇冠上的明珠领域也开了线。

提问:您提到的新产品“百小应”具体有什么不同?在和它交互时,用户能感受到什么差异?

王小川:大家体验一下新版“百小应”就能发现,它设计了两个模式。

一个是患者模式,针对普通人。比如你问“胸口长了个痘”,它不会上来就甩一堆专业名词,而是会像医生一样进行多轮追问,把信息收集全,避免被患者非专业的描述带偏,最后给出可行动的大白话建议。

另一个是医生模式,这有点像美国的 Open Evidence,回答非常标准化,像医学论文一样,引用的都是权威文献,而且保证引用真实存在,绝无幻觉。

我们的产品在全球是独一无二的,Open Evidence 只服务医生,而我们在中国把它增强了,既能服务医生,又能通过“翻译”和“决策辅助”服务患者。

提问:这背后涉及到的技术迭代,特别是 M3模型相比之前有哪些实质性的提升?

鞠强:M3相比 M2有三个实质性的技术进步。

首先是全动态强化学习。DeepSeek 时代证明了强化学习是大模型真正的技术红利,我们将80% 的算力都投入到了这里。以前 M2是半动态的,现在 M3实现了全动态,医生评价模型也是动态的,这让曲线能持续上升,极大提升了推理能力。

其次是原生降低幻觉。以前我们是靠外挂搜索工具来降幻觉,现在我们追求原生训练中降低幻觉,跑通了 Fact-aware 强化学习算法,在打压幻觉的同时没有降低推理能力。

最后是多轮问诊能力的突破,我们提出了 SPAIR 算法,解决了传统强化学习在长对话中容易失效的问题,让模型在多轮问诊中依然稳定高效。

提问:聊到技术就绕不开数据。现在行业里有一种声音,认为谁掌握了医院的高质量数据,谁就有壁垒。像阿福这种拥有海量 C 端用户反馈的应用,会不会因为数据量大,迭代速度比你们快?

王小川:我们要忘掉“数据决定一切”这件事。在医疗行业,大家谈了太多数据重要性,但鲜有成功案例。

大部分人都搞错了方向。用户反馈多能改善产品体验,但不代表能推动模型智力的进化。阿福更多是做生态、接保险、链接线下,这是流量红利,不是技术红利。

如果只是单纯拿医院数据去训练,很快会遇到瓶颈。因为医院的数据更多是做手术、执行、挂水的数据,全周期的健康管理并不发生在院内。

我们的壁垒在于算法和评价体系。算法是核心,数据是燃料,但评价体系是引擎。目前只有我们在真正做“模拟+评价”这套体系,通过医生构建的动态评价体系来驱动模型进化,这才是关键。

提问:但严肃医疗毕竟涉及权责问题,特别是像今天热搜上张文宏医生提到的,AI 可能会导致年轻医生缺乏系统训练,无法鉴别 AI 的对错。您怎么看这种“人机共生”后的矛盾?

王小川:在专业领域确实有这个问题,人机共生后,人会不会退化?

说点“伟光正”的话,能驾驭 AI 的医生才是好医生。但我的底层逻辑是,怎么做对患者最有帮助才是正道。

现在的痛点是医生没时间解释,患者听不懂。我们不碰诊断和治疗方案的红线,但我们要解决“让患者明明白白看医生”的问题。

我们将决策权拆解:诊疗建议由 AI 提供,最终决策权在患者。比如两个医院给了不同的方案,AI 可以帮你分析各自的优劣,比如生存期、痛苦程度、成本,这是医生没法帮你详细分析的,但 AI 可以把信息给足,让你自己决策。

提问:在商业化路径上,百川现在的策略是什么?合作的医院有哪些?

王小川:合作医院包括多家三甲医院,但更重要的是,我们是以“药厂”的身份在跟医院合作,注册 Clinical Trial(临床实验)。我们把 AI 产品当成药来看,验证它的安全性、有效性。据我所知,还没有哪家互联网 AI 公司在干这个。

商业化方面,只要能帮患者建立决策价值,收费是自然而然的。我们会在今年上半年入场,推出两款产品,产品内会有比价收费模块。

此外,我们还在探索“数字伴随”模式,比如药企的药有效性是70%,加上我们的 AI 管理服务能提到75%,这对药企来说相当于研发了一款新药,但成本极低。

提问:面对 OpenAI 或者国内其他大厂的竞争,百川的护城河到底在哪里?

王小川:与美国相比,中国虽然优质医生短缺,但这恰恰是 AI 的机会——填补空白。比如村医的诊断准确率可能只有26%,AI 只要比这高就是巨大的价值。

对于国内大厂,他们做传统业务很成功,做 AI 变革会有包袱。我们作为创业公司,更愿意切入那些难但正确的事情,比如严肃医疗问诊,而不是在挂号、轻问诊这些共识领域里卷。

网易科技:2026年百川的目标是什么?

王小川:2026年,我们的核心是应用落地。去年我们夯实了技术底座,今年要让 AI 医疗成为代码之外最重要的应用场景。我们相信 AI 医疗是肉眼可见的未来,我们会通过独特的产品形态和技术壁垒,把这件事做成。