国家知识产权局信息显示,速猿科技(湖南)有限公司申请一项名为“一种基于深度学习的音视频同步性检测方法及系统”的专利,公开号CN121691794A,申请日期为2025年12月。
专利摘要显示,本发明公开了一种基于深度学习的音视频同步性检测方法及系统,涉及数字音视频处理技术领域,包括将采集的待检测音视频文件,进行视频流与音频流分离,并利用人脸检测与特征提取,生成多模态音视频特征;根据纯净数据包,采用SyncNet深度双流网络进行同步性判别,分别提取唇动特征与语音特征,生成同步判别结果包;根据检测报告,采用时序对齐算法对音视频同步性进行校验,并通过时间戳锚定完成结果固化,获得同步性判定结果。本发明通过采用SyncNet深度双流网络进行同步性判别,结合深度学习实现了音视频唇动特征与语音特征的高效提取与同步性判定,有助于精准识别目标语音和口型之间的匹配程度,提升同步性检测的准确性。
天眼查资料显示,速猿科技(湖南)有限公司,成立于2021年,位于岳阳市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本1000万人民币。通过天眼查大数据分析,速猿科技(湖南)有限公司共对外投资了3家企业,专利信息4条,此外企业还拥有行政许可1个。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
热门跟贴