港大牵头多校发布牙科大语言模型，基准测试超GPT-5三倍|基准|大语言模型|放射科|治疗|港大|牙科

图源：OralGPT-Omni: A Versatile Dental Multimodal Large Language Model

好的牙·讯｜近日，中国香港大学牙医学院研究团队联合深圳大学、中国香港科技大学（广州）等多所院校发表论文，介绍首个牙科专用多模态大语言模型 OralGPT-Omni。

该模型可处理口内照片、根尖片、头颅侧位片、病理切片、口内视频等8种牙科影像。覆盖病变诊断、CVM分期预测、治疗方案推荐、视频理解和牙位定位计数5类任务。

研究团队设计了TRACE-CoT（透明放射学分析与临床证据）推理模式，使AI模仿放射科医师的诊断思维过程。该推理模式包含5个步骤：影像检查、假设生成、医学专业知识参考、基于特征的验证、循证结论。两名牙医对300个TRACE-CoT数据样本进行质量评估，结果显示其具有较高的质量和可靠性。

图源：OralGPT-Omni: A Versatile Dental Multimodal Large Language Model

值得注意的是，研究团队从31个公开数据集和1家中国香港牙科医院收集数据，构建了包含约321万文本词汇、近6万张图像和90个视频的大型数据集。采用四阶段训练策略：牙科知识注入、牙科概念对齐、监督微调和强化学习调优。在强化学习阶段，团队还引入了难度感知数据选择策略和TRACE奖励机制。

此外，研究团队构建了MMOral-Uni基准测试，包含2809个经过专业牙医验证的开放式问答对，涵盖5种影像模态和5类任务。OralGPT-Omni在该基准测试中获得51.84分，在MMOral-OPG全景片基准测试中获得45.31分。而对比数据显示，GPT-5在MMOral-Uni基准测试中得分仅15.42分。

据悉，研究团队邀请了一位拥有超过10年经验的放射科医师对GPT-5、Lingshu-7B和OralGPT-Omni三个模型的输出进行了临床有效性评估。评估结果显示，OralGPT‑Omni在准确性和临床可用性方面获得较高评价。

研究团队指出，OralGPT-Omni在复杂治疗方案制定方面仍存在局限性。治疗方案需要考虑患者的整体健康状况、经济能力和治疗偏好等更多个体化因素。在训练数据中，治疗方案数据仅占0.006%。此外，研究团队表示，将公开所有代码、数据和模型。

【特别鸣谢】如果本文有错漏之处需要勘误，请联系我们的客服，届时我们会为您准备小礼物，感谢！

【免责声明】上述内容源于公开信息，可能存在不准确性，仅供参考。本文不构成对任何人的投资与决策建议，好的牙不对因使用本资料而导致的损失承担任何责任，并对本内容拥有最终解释权。

@好的牙口腔行业研究