基于WEB信息的关系数据的属性值同一性判定方法
摘要:
本发明公开了一种基于WEB信息的关系数据的属性值同一性判定方法,用于解决现有属性值同一性判定方法准确率差的技术问题。技术方案是采用查询算法产生查询关键字,利用WEB对数据库中的信息进行扩展,利用自然语言处理方法和命名实体识别方法提取相关的实体;使用FPTree算法在检索的片段中提取出频繁项目集,并把其当做图的节点;通过共现和语义关系两种方法提取实体键间的关系并构建边;使用Durand‑Pasari算法从构建的实体关系图中提取包含待判定属性的最大公共子图;使用Durand‑Pasari提取最大公共子图的公共模式;根据关系模式匹配的结果判定属性值的相似度,提高了属性值同一性判定方法的准确率。
0/0