一种基于表示学习的医学知识图谱实体对齐方法
摘要:
本发明提供了一种基于表示学习的医学知识图谱实体对齐方法,实体的完全字符串匹配,去除公有实体得到待对齐实体;通过知识表示学习模型对两个知识图谱中的三元组进行训练,得到每个实体的嵌入向量;计算待对齐实体与标准实体的语义距离,找出语义距离值最高的前十个推荐实体;通过构造医学知识数据的词根集,去除词根完全不同的候选实体;判断待对齐实体与推荐实体是否为同一科室和部位,去除推荐实体中不可靠的结果;将最后获得的待对齐实体与推荐实体进行标注,找出推荐实体中与待对齐实体指向相同的实体,完成实体对齐。本发明在表示学习的基础上,根据医学领域知识的特点,加入词根和规则对候选实体进行筛选,得到更精确的实体对齐结果。
0/0