临近春节医疗AI 赛道:阿里VS华为贴身肉搏到了什么程度呢?

连续三天,差距极小,

华为冲刺一把,

千问健康再次领跑,

取得目前最高分71.2分。

1. 千问 vs 华为:榜首争夺战

• 两家分数咬得很紧,差距仅 0.2-0.3 分

• 千问从 70.8→71.2,

• 华为从 69.7 → 71.0,

• 华为紧咬不放,千问重回榜首

2 国产模型主场优势:

Top 7全是中文医疗大模型,

说明医疗领域对中文语料、

国内临床指南的依赖很强。

3. 垂直赛道抢机会:

WiseDiag 这类创业公司能挤进前三,

证明医疗 AI 不是只有大厂能玩

4. 通用模型有短板:

Grok、Claude 分数偏低,

说明医疗需要专门的领域训练,

不能直接借力通用大模型

另外,MedBench是由 OpenCompass(司南),

推出的中文医疗大模型评测基准,

是国内最权威的医疗AI评测平台之一。

评测维度包括

• 医学知识问答:执业医师考试、医学考研等

• 临床病例分析:症状诊断、治疗方案推荐

• 医学文献理解:论文摘要、病历报告解读

• 医患对话:问诊场景模拟

#千问健康大模型

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片