临近春节医疗AI 赛道:阿里VS华为贴身肉搏到了什么程度呢?
连续三天,差距极小,
华为冲刺一把,
千问健康再次领跑,
取得目前最高分71.2分。
1. 千问 vs 华为:榜首争夺战
• 两家分数咬得很紧,差距仅 0.2-0.3 分
• 千问从 70.8→71.2,
• 华为从 69.7 → 71.0,
• 华为紧咬不放,千问重回榜首
2 国产模型主场优势:
Top 7全是中文医疗大模型,
说明医疗领域对中文语料、
国内临床指南的依赖很强。
3. 垂直赛道抢机会:
WiseDiag 这类创业公司能挤进前三,
证明医疗 AI 不是只有大厂能玩
4. 通用模型有短板:
Grok、Claude 分数偏低,
说明医疗需要专门的领域训练,
不能直接借力通用大模型
另外,MedBench是由 OpenCompass(司南),
推出的中文医疗大模型评测基准,
是国内最权威的医疗AI评测平台之一。
评测维度包括
• 医学知识问答:执业医师考试、医学考研等
• 临床病例分析:症状诊断、治疗方案推荐
• 医学文献理解:论文摘要、病历报告解读
• 医患对话:问诊场景模拟
#千问健康大模型
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
热门跟贴