国家知识产权局信息显示,杭州小影创新科技股份有限公司申请一项名为“语音驱动视频合成方法、设备及存储介质”的专利,公开号CN121037652A,申请日期为2025年10月。
专利摘要显示,本申请提供一种语音驱动视频合成方法、设备及存储介质,涉及计算机视觉与人工智能技术领域。该方法包括:根据原始说话视频中的多帧原始图像,分别确定多帧人脸区域图像以及对应的面部身份特征图像;采用人脸标准化模型,根据每帧面部身份特征图像,对对应的人脸区域图像进行身份特征和口型动作的解耦处理,输出对应的闭嘴人脸区域图像;采用口型合成模型,根据多帧闭嘴人脸区域图像,以及音频数据,生成多帧说话人脸区域图像;对多帧说话人脸区域图像和多帧原始图像进行融合处理,得到音频数据匹配的目标说话视频。消除原始口型的干扰,说话口型和音频数据的同步质量更高,进而显著提升了目标说话视频中口型与音频数据的同步性。
天眼查资料显示,杭州小影创新科技股份有限公司,成立于2012年,位于杭州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本4000万人民币。通过天眼查大数据分析,杭州小影创新科技股份有限公司共对外投资了6家企业,参与招投标项目5次,财产线索方面有商标信息243条,专利信息125条,此外企业还拥有行政许可7个。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
热门跟贴