国家知识产权局信息显示,湖南星汉数智科技有限公司申请一项名为“基于属性加权融合的多源异构文档去重方法及系统、设备、介质”的专利,公开号CN121960432A,申请日期为2025年12月。
专利摘要显示,本发明涉及数据清洗领域,公开了一种基于属性加权融合的多源异构文档去重方法及系统、设备、介质,该方法基于关键属性集合和映射表对两篇文档进行重复性判断,使得重复性判断过程聚焦并加权文档的核心属性,将去重问题从文本相似性比较转化为关键属性的判别力加权融合决策,忽略了文档间的非关键差异,对文档重复内容的识别更精准,提升了重复性判断的准确性和鲁棒性,并且权重机制允许在部分关键属性缺失或存在误差时,仍能基于现有关键属性做出可靠判断,降低了对信息完整性的苛刻依赖,在信息缺失场景下仍能实现高精度的重复内容识别。另外,通过配置不同的关键属性集合和映射表,可快速、灵活地适配到各种垂直领域,提升了通用性和泛化能力。
天眼查资料显示,湖南星汉数智科技有限公司,成立于2016年,位于长沙市,是一家以从事研究和试验发展为主的企业。企业注册资本1134.6939万人民币。通过天眼查大数据分析,湖南星汉数智科技有限公司共对外投资了3家企业,参与招投标项目8次,财产线索方面有商标信息107条,专利信息64条。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
热门跟贴