金融界2025年4月10日消息,国家知识产权局信息显示,广东亿迅科技有限公司申请一项名为“数字人音视频生成方法、系统、设备及介质”的专利,公开号 CN 119785820 A,申请日期为2024年12月。
专利摘要显示,本申请提供的一种数字人音视频生成方法、系统、设备及介质,所述方法包括:首先,获取文本信息和初始图像;基于情绪分析模型确定文本信息对应的情绪类别;识别初始图像中的人脸区域,得到初始图像中数字人对应的性别类别;基于情绪类别与性别类别生成数字人对应的音频数据;基于音频数据与初始图像生成数字人初始视频;将数字人初始视频输入唇形对齐模型中获得输出视频;输出视频中数字人的嘴型与音频数据对齐。利用情绪分析模型和图像识别技术,能够准确识别文本信息的情绪类别和初始图像中数字人的性别类别,生成具有情绪表达的数字人视频。
天眼查资料显示,广东亿迅科技有限公司,成立于2001年,位于广州市,是一家以从事专业技术服务业为主的企业。企业注册资本15000万人民币,实缴资本15000万人民币。通过天眼查大数据分析,广东亿迅科技有限公司共对外投资了1家企业,参与招投标项目5000次,财产线索方面有商标信息147条,专利信息471条,此外企业还拥有行政许可20个。
本文源自:金融界
作者:情报员
热门跟贴