近日,中国地震局地球物理研究所(以下简称地球所)发布首个地震科普大模型(QuakeGPT),这是语言大模型在地震行业垂直领域落地的首个案例,也是大模型技术辅助地震科研和促进公众理解的首次尝试。该模型基于通义千问模型打造,并在地震科普数字人的问答应用中投入使用,同时在阿里云官网上线提供开放式的API服务。

地球所是我国重要的地学研究机构,拥有地震行业最大的文献资源,地球所陈石研究员表示,为了确保大模型在地震领域的卓越性能,地球所选用了通义千问模型作为基座,该模型不仅拥有庞大的参数规模,还采用了先进的对齐机制,在数据集评测中,其准确率在同类相近规模模型中名列前茅。

为了进一步提升模型的专业性,地球所团队从《中国震例》、地震科普问答等资料中,整理出了数万条地震知识问答对,建立了地震知识数据集、自我认知数据集、强化训练集、奖励模型数据集与地震知识库,通过RAG(Retrieval-AugmentedGeneration)技术增强大模型对地震领域知识的获取和应用能力,减少虚构内容,确保生成结果的准确性和可靠性。

目前,由QuakeGPT支撑的地震科普数字人已经投入使用,为公众提供更加丰富、智能的地震科普服务,并且在对于地震监测能力、对房屋造成的损失等问答方面,QuakeGPT比通用大模型笼统性的回答更清晰细致,更具专业性。

通义千问自2023年4月问世以来,始终专注于基础模型的技术研发,并在一年间发展出了业界领先的文生图、智能编码、文档解析、音视频理解等能力。5月9日,在通义大模型发布一周年之际,阿里云正式发布通义千问2.5,并开源1100亿参数模型Qwen1.5-110B。未来,随着大模型技术在防震减灾领域的深入应用,将对自然灾害科学研究和综合防灾减灾事业的发展起到积极的推动作用。