金融界2025年6月7日消息,国家知识产权局信息显示,作业帮教育科技(北京)有限公司申请一项名为“一种基于多模态语音识别模型预测语音内容的方法及装置”的专利,公开号CN120108387A,申请日期为2025年02月。
专利摘要显示,本发明公开一种基于多模态语音识别模型预测语音内容的方法及装置,多模态语音识别模型包括语音转文本大模型、模态适应层、Embedding层和大语言模型,多模态语音识别模型的训练流程包括:第一训练阶段:使用自动语音识别数据训练多模态语音识别模型,大语言模型和Embedding层的模型参数保持固定,对语音转文本大模型和模态适应层进行训练;第二训练阶段:第一训练阶段完成之后,将第一训练阶段训练得到的语音转文本大模型的模型参数保持固定,对大语言模型采用优化微调策略,使用与第一阶段相同的自动语音识别数据训练多模态语音识别模型。
天眼查资料显示,作业帮教育科技(北京)有限公司,成立于2015年,位于北京市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本200000万美元。通过天眼查大数据分析,作业帮教育科技(北京)有限公司共对外投资了3家企业,参与招投标项目5次,专利信息78条,此外企业还拥有行政许可15个。
本文源自:金融界
作者:情报员
热门跟贴