国家知识产权局信息显示,深圳市有方科技股份有限公司申请一项名为“一种基于密度聚类与语义校验的中英文混合文本去重方法”的专利,公开号CN121996794A,申请日期为2025年12月。

专利摘要显示,本申请公开了一种基于密度聚类语义校验中英文混合文本去重方法。该方法包括:将各文本转换为各语义向量,基于密度聚类算法,得到第一聚类;基于二分查找框架结合大模型的语义校验,对第一聚类迭代优化,得到聚类阈值;基于聚类阈值更新第一聚类,得到多个第二聚类;基于预设的语义筛选算法和预设的表述筛选算法,对各第二聚类去重,得到去重后的文本列表。通过上述方式,本申请能够自动迭代优化得到最优的聚类阈值,无需人工设定聚类阈值,能够适配不同语义密度的中英文混合文本,实现了同一聚类中语义的一致性;通过预设的语义筛选算法和预设的表述筛选算法,能够保留语义独特性和表述多样性,避免因语言结构差异导致的表述相似度误判。

天眼查资料显示,深圳市有方科技股份有限公司,成立于2006年,位于深圳市,是一家以从事计算机、通信和其他电子设备制造业为主的企业。企业注册资本9290.882万人民币。通过天眼查大数据分析,深圳市有方科技股份有限公司共对外投资了23家企业,参与招投标项目210次,财产线索方面有商标信息42条,专利信息381条,此外企业还拥有行政许可22个。

声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。

本文源自:市场资讯

作者:情报员