- 专利标题: 一种含数值类型的数据相似性检测方法及装置
-
申请号: CN202211146625.X申请日: 2022-09-21
-
公开(公告)号: CN115221857B公开(公告)日: 2023-01-13
- 发明人: 陆志鹏 , 胡成盛 , 刘国栋 , 国丽 , 朱立锋 , 郑曦 , 周崇毅 , 赵健 , 温彦龙 , 乔亲旺 , 范国浩 , 修心 , 章纯梓 , 林希明
- 申请人: 中国电子信息产业集团有限公司(CN)
- 申请人地址: 北京市海淀区中关村东路66号院甲1号(世纪科贸大厦A座)
- 专利权人: 中国电子信息产业集团有限公司(CN)
- 当前专利权人: 中国电子信息产业集团有限公司(CN)
- 当前专利权人地址: 北京市海淀区中关村东路66号院甲1号(世纪科贸大厦A座)
- 代理机构: 工业和信息化部电子专利中心
- 代理商 袁鸿
- 主分类号: G06F40/194
- IPC分类号: G06F40/194 ; G06F40/151 ; G06F40/279
摘要:
本申请公开了一种含数值类型的数据相似性检测方法及装置,所述相似性检测方法包括如下步骤:统一原始数据资源和数据元件结果中的数值类型数据的基线,并在统一基线后进行数值标准化变换;对数值标准化变换之后的原始数据资源和数据元件结果分别进行字符串转换;利用不同的距离判据计算原始数据资源以及数据元件结果对应的字符串之间的相似度。本申请实施例设计了数值标准化变换过程、数据资源和数据元件结果分别进行字符串转化过程,并利用利用不同的距离判据来计算两者的相似性,解决了传统文本相似性检测和哈希算法所存在不能检测数值变换相似性、漏检、低效等问题。
公开/授权文献
- CN115221857A 一种含数值类型的数据相似性检测方法及装置 公开/授权日:2022-10-21