出品 | 网易科技《态度》栏目
作者 | 袁宁
编辑 | 丁广胜
账上还躺着30亿人民币,王小川并不着急。
2026年开年,中国大模型行业进入了资本兑现期。曾经同属“六小虎”阵营的智谱 AI 和 MiniMax 接连上市,月之暗面也披露了5亿美元的新一轮融资。在这个同行们忙着敲钟、兑现投资人预期的冬天,王小川选择用产品回应外界的关注:
1月13日,王小川正式宣布百川智能发布医疗大模型 Baichuan-M3。在权威评测 HealthBench 中,M3以65.1分的综合成绩位列全球第一;在考验复杂决策能力的 HealthBench Hard 上,以44.4分夺冠,实现了对 GPT-5.2的技术超越。值得注意的是,在医疗场景最敏感的“幻觉”指标上,M3将幻觉率降低至3.5%,为目前全球最低水平。
与此同时,王小川还披露:百川有出海的计划;今年会上线免费的 C 端应用;正在自研硬件,与睡眠相关;同时,百川未来也会走向上市。
这背后,是王小川对局势的预判。就在今年1月8号,OpenAI Health 正式上线功能;而就在我们采访的当天早上,Anthropic 也宣布进军医疗,发布了针对医疗计算和 Agent 的技术能力。国内,蚂蚁集团的阿福更是开始迅速获取用户。
巨头的动作,像是一声迟来的发令枪,印证了王小川在2025年“沉默”期间的判断。他等的风终于来了。
刚刚过去的2025年,在外界看来是百川“失声”的一年,裁员传闻、融资静默,而内部发生的是一场痛苦但必要的聚焦——砍掉所有杂念,只做医疗。
“2025年我觉得最重大的事情是在组织管理上非常清楚了,就是专门聚焦做医疗。以前是分散的,现在我们把精力都收回来了。”王小川告诉网易科技。同时他表示,目前的重点在慢病、儿科、肿瘤,这三个方向。王小川还透露,现在他会亲自面试每一个新人,要看“对医疗有没有感觉”。
整场采访王小川坐在媒体中,保持微笑。这种并不紧张与外界对百川“掉队”的猜测形成了某种微妙的错位。
他不再谈论通用的语言模型竞争,而是兴奋地描绘一个“患者掌握决策权”的未来。在他看来:“长期以来,决策权都在医生手里,患者签着免责书却听不懂方案。我们做 AI,不是为了让医生下岗,而是要让决策权从医生让渡给患者,让患者明明白白地做自己健康的第一责任人。”
“去年是模型本身的进步,我们走到了医学最高峰的问题里去。”王小川说,“行业到了爆发的节点,我们的产品也 Ready 了,可以交卷了。”
以下是《网易科技》等与王小川的对话实录,经不改变原意的编辑。
网易科技:之前您很少发声,为什么现在愿意跟大家多聊聊了?
王小川:之前从通用大模型转过来做医疗,确实被骂惨了,所以我选择闭关了一段时间。现在愿意出来,是因为行业到了爆发的节点,我们的产品也 Ready 了,可以交卷了。
其实我第一天就想做医疗,我研究生是学计算机高性能计算的,当时大家都在搞天气预报,我觉得那玩意儿太不靠谱,蝴蝶效应导致不可预测。后来大概2000年左右,我接触了人类基因组计划,发现生命虽然比天气更复杂,但背后是有规律的——一个细胞10个月能变成婴儿,这背后一定有数学模型。
前20年我干互联网,接下来的20年,我认为是生命科学和 AI 结合的突破期。现在的语言模型能解决“智力”问题,未来我们要解决的是“身体”的问题。
网易科技:虽然刚进入2026年,其实AI圈已经发生了很多大事件了,当下您会怎么评价现在的百川?回顾过去一年,您觉得百川做了哪几件关键的事?
王小川:去年我觉得最重大的事情是在组织管理上非常清楚了,就是专门聚焦做医疗。以前是分散的,现在我们把精力都收回来了。
在技术上,我们通过 M2、M3模型把“医疗最强”的概念留住了,特别是把“循证”和“会问”这两个核心能力拎起来了。除了全科和儿科,我们在肿瘤这个医学皇冠上的明珠领域也开了线。
提问:您提到的新产品“百小应”具体有什么不同?在和它交互时,用户能感受到什么差异?
王小川:大家体验一下新版“百小应”就能发现,它设计了两个模式。
一个是患者模式,针对普通人。比如你问“胸口长了个痘”,它不会上来就甩一堆专业名词,而是会像医生一样进行多轮追问,把信息收集全,避免被患者非专业的描述带偏,最后给出可行动的大白话建议。
另一个是医生模式,这有点像美国的 Open Evidence,回答非常标准化,像医学论文一样,引用的都是权威文献,而且保证引用真实存在,绝无幻觉。
我们的产品在全球是独一无二的,Open Evidence 只服务医生,而我们在中国把它增强了,既能服务医生,又能通过“翻译”和“决策辅助”服务患者。
提问:这背后涉及到的技术迭代,特别是 M3模型相比之前有哪些实质性的提升?
鞠强:M3相比 M2有三个实质性的技术进步。
首先是全动态强化学习。DeepSeek 时代证明了强化学习是大模型真正的技术红利,我们将80% 的算力都投入到了这里。以前 M2是半动态的,现在 M3实现了全动态,医生评价模型也是动态的,这让曲线能持续上升,极大提升了推理能力。
其次是原生降低幻觉。以前我们是靠外挂搜索工具来降幻觉,现在我们追求原生训练中降低幻觉,跑通了 Fact-aware 强化学习算法,在打压幻觉的同时没有降低推理能力。
最后是多轮问诊能力的突破,我们提出了 SPAIR 算法,解决了传统强化学习在长对话中容易失效的问题,让模型在多轮问诊中依然稳定高效。
提问:聊到技术就绕不开数据。现在行业里有一种声音,认为谁掌握了医院的高质量数据,谁就有壁垒。像阿福这种拥有海量 C 端用户反馈的应用,会不会因为数据量大,迭代速度比你们快?
王小川:我们要忘掉“数据决定一切”这件事。在医疗行业,大家谈了太多数据重要性,但鲜有成功案例。
大部分人都搞错了方向。用户反馈多能改善产品体验,但不代表能推动模型智力的进化。阿福更多是做生态、接保险、链接线下,这是流量红利,不是技术红利。
如果只是单纯拿医院数据去训练,很快会遇到瓶颈。因为医院的数据更多是做手术、执行、挂水的数据,全周期的健康管理并不发生在院内。
我们的壁垒在于算法和评价体系。算法是核心,数据是燃料,但评价体系是引擎。目前只有我们在真正做“模拟+评价”这套体系,通过医生构建的动态评价体系来驱动模型进化,这才是关键。
提问:但严肃医疗毕竟涉及权责问题,特别是像今天热搜上张文宏医生提到的,AI 可能会导致年轻医生缺乏系统训练,无法鉴别 AI 的对错。您怎么看这种“人机共生”后的矛盾?
王小川:在专业领域确实有这个问题,人机共生后,人会不会退化?
说点“伟光正”的话,能驾驭 AI 的医生才是好医生。但我的底层逻辑是,怎么做对患者最有帮助才是正道。
现在的痛点是医生没时间解释,患者听不懂。我们不碰诊断和治疗方案的红线,但我们要解决“让患者明明白白看医生”的问题。
我们将决策权拆解:诊疗建议由 AI 提供,最终决策权在患者。比如两个医院给了不同的方案,AI 可以帮你分析各自的优劣,比如生存期、痛苦程度、成本,这是医生没法帮你详细分析的,但 AI 可以把信息给足,让你自己决策。
提问:在商业化路径上,百川现在的策略是什么?合作的医院有哪些?
王小川:合作医院包括多家三甲医院,但更重要的是,我们是以“药厂”的身份在跟医院合作,注册 Clinical Trial(临床实验)。我们把 AI 产品当成药来看,验证它的安全性、有效性。据我所知,还没有哪家互联网 AI 公司在干这个。
商业化方面,只要能帮患者建立决策价值,收费是自然而然的。我们会在今年上半年入场,推出两款产品,产品内会有比价收费模块。
此外,我们还在探索“数字伴随”模式,比如药企的药有效性是70%,加上我们的 AI 管理服务能提到75%,这对药企来说相当于研发了一款新药,但成本极低。
提问:面对 OpenAI 或者国内其他大厂的竞争,百川的护城河到底在哪里?
王小川:与美国相比,中国虽然优质医生短缺,但这恰恰是 AI 的机会——填补空白。比如村医的诊断准确率可能只有26%,AI 只要比这高就是巨大的价值。
对于国内大厂,他们做传统业务很成功,做 AI 变革会有包袱。我们作为创业公司,更愿意切入那些难但正确的事情,比如严肃医疗问诊,而不是在挂号、轻问诊这些共识领域里卷。
网易科技:2026年百川的目标是什么?
王小川:2026年,我们的核心是应用落地。去年我们夯实了技术底座,今年要让 AI 医疗成为代码之外最重要的应用场景。我们相信 AI 医疗是肉眼可见的未来,我们会通过独特的产品形态和技术壁垒,把这件事做成。
热门跟贴