国家知识产权局信息显示,穹界智能科技(杭州)有限公司申请一项名为“一种增强视觉语言模型细粒度感知的方法及装置”的专利,公开号CN122023980A,申请日期为2025年12月。
专利摘要显示,本发明公开了一种增强视觉语言模型细粒度感知的方法及装置。方法为:获取图像及候选区域的归一化坐标;并行利用主视觉编码器和辅助视觉编码器提取全局语义特征与细粒度视觉特征;通过混合细粒度区域编码器,利用特征金字塔对主特征进行多尺度变换,结合辅助特征进行拼接,并基于坐标利用线性投影生成几何位置嵌入向量,与拼接特征逐元素融合得到混合细粒度区域特征;最后将其投影为区域索引Token输入视觉语言模型,生成包含区域引用标签的文本响应。本发明通过双流特征互补及显式几何注入,解决了VLM定位精度低的问题,实现了精确的目标定位与区域理解,同时保留了模型的通用语义能力。
天眼查资料显示,穹界智能科技(杭州)有限公司,成立于2020年,位于杭州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本300万人民币。通过天眼查大数据分析,穹界智能科技(杭州)有限公司共对外投资了1家企业,财产线索方面有商标信息8条,专利信息34条。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
热门跟贴