2026年首都信息申请基于多算法融合的文档快速去重方法及系统专利,提升大规模文档去重的准确率

首都信息申请基于多算法融合的文档快速去重方法及系统专利,提升大规模文档去重的准确率p id 4FHOLOK0 国家知识产权局信息显示 首都信息发展股份有限公司申请一项名为 基于多算法融合的文档快速去重方法及系统 的专利 公开号 CNA 申请日期为 2025 年 12 月 p p id 4FHOLOK1 专利摘要显示 本发明公开了种基于多算法融合的文档快速去重方法及系统 p

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



 

国家知识产权局信息显示,首都信息发展股份有限公司申请一项名为“基于多算法融合的文档快速去重方法及系统”的专利,公开号CNA,申请日期为2025年12月。

专利摘要显示,本发明公开了种基于多算法融合的文档快速去重方法及系统,该方法包括:对文档执行预处理,并生成去重词汇集合;通过布隆过滤器对去重词汇集合进行快速成员判定;对通过布隆过滤器的文档,并行生成局部敏感哈希指纹和概率签名;构建分带式局部敏感哈希索引,并从文档库中检索出候选相似文档集合;对每个候选相似文档分别计算标题维度、内容维度和元数据维度的相似度,并依据预设权重对各维度相似度进行加权融合,得到文档对应的综合相似度得分;将综合相似度得分与设定的相似度阈值进行比较,以根据比较结果判定文档是否重复。通过粗筛、索引与相似度融合决策的协同机制,在显著降低计算复杂度的同时,提升大规模文档去重的准确率。

天眼查资料显示,首都信息发展股份有限公司,成立于1998年,位于北京市,是一家以从事互联网和相关服务为主的企业。企业注册资本28980.8609万人民币。通过天眼查大数据分析,首都信息发展股份有限公司共对外投资了14家企业,参与招投标项目2768次,财产线索方面有商标信息80条,专利信息49条,此外企业还拥有行政许可10个。

声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。

本文源自:市场资讯

作者:情报员

小讯
上一篇 2026-04-17 09:57
下一篇 2026-04-17 09:55

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/266634.html