8月24日-27日,第十七届全国知识图谱与语义计算大会(CCKS 2023)在沈阳成功举办。大会聚焦“知识图谱赋能通用AI”,邀请国内外知名学者、产业界知名发言人员介绍相关领域的最新进展和发展趋势,分享实战经验,促进产学研合作。大会期间,CCKS系列评测任务现场公布结果并进行颁奖,云知声在任务7:PromptCBLUE医疗大模型评测中夺得A、B榜双榜冠军,实力再获业界认可。

当前,以ChatGPT、GPT-4等为代表的大语言模型掀起了新一轮自然语言处理领域的研究浪潮,展现出了类通用人工智能(AGI)的能力,受到业界广泛关注。为推动LLM在医疗领域的发展和落地,华东师范大学王晓玲教授团队联合天池团队推出PromptCBLUE评测基准, 将CBLUE基准进行二次开发,将16种不同的医疗场景NLP任务全部转化为基于提示的语言生成任务,形成首个中文医疗场景的LLM评测基准,以此评估LLM在不同医疗任务的总体表现。

此次评测,云知声成功登顶排行榜的关键,是其基于山海大模型孵化的UNIGPT-MED 模型。

山海大模型是在云知声自有的Atlas集群上,使用自研UniScale框架训练完成的大模型。为了进一步增强其医疗能力,云知声团队使用其深耕医疗行业多年所积累的海量行业数据进行增量训练,这些数据包括医学文献、医学教材和病历数据等,最终得到医疗基座模型。

根据对评测任务的系统分析,云知声团队通过大赛官方提供的训练数据,对医疗基座模型进行指令微调,并采取数据增强、思维链等技术手段不断优化模型表现,再利用模型融合技术构建出 UNIGPT-MED 比赛模型。最终,基于UNIGPT-MED 比赛模型在各类医疗任务上的总体表现,云知声团队获得A榜73.96分、B榜73.91分的最终成绩,夺得双榜冠军。

作为中国AGI技术产业化的先驱之一,云知声于2016年开始打造Atlas人工智能基础设施,并以此为基础,构建云知大脑(UniBrain)技术中台——以山海(UniGPT)通用认知大模型为核心,结合多模态感知与生成、知识图谱、物联平台等智能组件,为云知声智慧物联、智慧医疗等业务提供高效的产品化支撑,持续推动“U(云知大脑)+X(应用场景)”战略布局,践行“通过通用人工智能(AGI)创建互联直觉的世界”的公司使命。

山海大模型作为云知大脑的核心,能力体系涵盖语言生成、语言理解、知识问答、 逻辑推理、代码能力、数学能力等。此外,为提高大模型在具体场景的应用落地水平,山海大模型在通用能力基础上,增强物联、医疗等行业能力,致力为客户提供更智能、更灵活的解决方案,加速千行百业的智慧化升级。

自5月24日发布以来,山海大模型不断迭代升级,专业能力持续突破。其中,其医疗能力在6月的MedQA任务上提升到了87.1%,超越Med-PaLM 2,临床执业医师资格考试提升至523(总分600分),超过了99%的考生水平。凭借山海在医疗领域的技术实力与场景落地能力,云知声更是接连获得北京市首批人工智能行业大模型应用案例、2023北京人工智能行业赋能典型案例等荣誉奖项。此次云知声夺得PromptCBLUE双榜冠军,再一次证实了山海大模型在医疗领域的突出实力,也将进一步推动云知声AGI技术底座的优化迭代,实现人工智能创新技术在多领域场景下的实际落地。

寻找不同产业落地场景,帮助从业者解决具体问题,是当前大模型入局者的共同追求,也是云知声一直致力推动的。接下来,云知声将继续加强前沿技术领域的研究投入,不断强化AGI底层能力,最大限度释放AGI场景活力,带动千行百业的“智慧蝶变”。