国家知识产权局信息显示,重庆小易智联智能技术有限公司申请一项名为“一种融合视频与语音的多模态实体识别方法”的专利,公开号CN121982608A,申请日期为2026年1月。
专利摘要显示,本发明公开了一种融合视频与语音的多模态实体识别方法,包括:首先分别从视频流中提取视觉候选实体集合,从音频流中提取听觉候选实体集合;接着通过可学习的时序对齐网络建立视觉与听觉特征之间的细粒度时序对应关系,生成跨模态对齐的联合特征表示;之后以候选实体为节点构建包含多种语义关系边的跨模态异质图,并利用图神经网络进行消息传播与节点特征更新;最后基于更新后的节点特征计算跨模态对齐置信度,融合指代同一实体的多模态候选实体,输出每个实体的类别、位置、时间区间及置信度。本发明实现了视频与语音的细粒度时序对齐与深度融合,显著提升了跨模态实体识别的准确性与鲁棒性。
天眼查资料显示,重庆小易智联智能技术有限公司,成立于2020年,位于重庆市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本636.8283万人民币。通过天眼查大数据分析,重庆小易智联智能技术有限公司共对外投资了6家企业,参与招投标项目21次,财产线索方面有商标信息34条,专利信息31条,此外企业还拥有行政许可4个。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
热门跟贴