发明授权
CN107480130B 基于WEB信息的关系数据的属性值同一性判定方法
失效 - 权利终止
- 专利标题: 基于WEB信息的关系数据的属性值同一性判定方法
-
申请号: CN201710608887.6申请日: 2017-07-25
-
公开(公告)号: CN107480130B公开(公告)日: 2020-09-08
- 发明人: 刘海龙 , 成阿茹 , 李战怀 , 张陶然 , 张国荣 , 刘文洁
- 申请人: 西北工业大学
- 申请人地址: 陕西省西安市友谊西路127号
- 专利权人: 西北工业大学
- 当前专利权人: 西北工业大学
- 当前专利权人地址: 陕西省西安市友谊西路127号
- 代理机构: 西北工业大学专利中心
- 代理商 王鲜凯
- 主分类号: G06F40/295
- IPC分类号: G06F40/295 ; G06F16/36
摘要:
本发明公开了一种基于WEB信息的关系数据的属性值同一性判定方法,用于解决现有属性值同一性判定方法准确率差的技术问题。技术方案是采用查询算法产生查询关键字,利用WEB对数据库中的信息进行扩展,利用自然语言处理方法和命名实体识别方法提取相关的实体;使用FPTree算法在检索的片段中提取出频繁项目集,并把其当做图的节点;通过共现和语义关系两种方法提取实体键间的关系并构建边;使用Durand‑Pasari算法从构建的实体关系图中提取包含待判定属性的最大公共子图;使用Durand‑Pasari提取最大公共子图的公共模式;根据关系模式匹配的结果判定属性值的相似度,提高了属性值同一性判定方法的准确率。
公开/授权文献
- CN107480130A 基于WEB信息的关系数据的属性值同一性判定方法 公开/授权日:2017-12-15