发明授权
- 专利标题: 一种知识图谱数据清洗方法及装置
-
申请号: CN202210605957.3申请日: 2022-05-31
-
公开(公告)号: CN114691896B公开(公告)日: 2022-09-13
- 发明人: 高云君 , 陈璐 , 汪鹏飞 , 葛丛丛 , 曾晓灿
- 申请人: 浙江大学
- 申请人地址: 浙江省杭州市西湖区余杭塘路866号
- 专利权人: 浙江大学
- 当前专利权人: 浙江大学
- 当前专利权人地址: 浙江省杭州市西湖区余杭塘路866号
- 代理机构: 杭州求是专利事务所有限公司
- 代理商 邱启旺
- 主分类号: G06F16/36
- IPC分类号: G06F16/36 ; G06F16/35 ; G06N3/04 ; G06N3/08
摘要:
本发明公开了一种知识图谱数据清洗方法及装置,该方法包括:获取待清洗知识图谱,所述待清洗知识图谱包括若干实体和关系,其中两个实体和它们之间的关系组成一个三元组;根据所述待清洗知识图谱和所述待清洗知识图谱中的所有三元组,训练一个知识图谱嵌入模型和一个三元组分类模型,其中所述知识图谱嵌入模型和所述三元组分类模型能相互促进;使用训练后的三元组分类模型对知识图谱中的三元组进行分类,得到错误的三元组;将所述错误的三元组输入训练后的知识图谱嵌入模型,得到所述错误的三元组的全局置信度;通过所述全局置信度对错误的三元组进行修复,以得到清洗后的知识图谱。
公开/授权文献
- CN114691896A 一种知识图谱数据清洗方法及装置 公开/授权日:2022-07-01