一种基于表示学习的医学知识图谱实体对齐方法

发明公开

CN111309930A 一种基于表示学习的医学知识图谱实体对齐方法有权

请登陆查看更多内容

专利标题： 一种基于表示学习的医学知识图谱实体对齐方法
申请号： CN202010151549.6

申请日： 2020-03-06
公开(公告)号： CN111309930A

公开(公告)日： 2020-06-19
发明人: 滕飞 , 钟文 , 许强 , 李天瑞
申请人： 西南交通大学
申请人地址： 四川省成都市二环路北一段
专利权人： 西南交通大学
当前专利权人： 西南交通大学
当前专利权人地址： 四川省成都市二环路北一段
代理机构： 成都正华专利代理事务所
代理商 李蕊
主分类号： G06F16/36
IPC分类号： G06F16/36

摘要：

本发明提供了一种基于表示学习的医学知识图谱实体对齐方法，实体的完全字符串匹配，去除公有实体得到待对齐实体；通过知识表示学习模型对两个知识图谱中的三元组进行训练，得到每个实体的嵌入向量；计算待对齐实体与标准实体的语义距离，找出语义距离值最高的前十个推荐实体；通过构造医学知识数据的词根集，去除词根完全不同的候选实体；判断待对齐实体与推荐实体是否为同一科室和部位，去除推荐实体中不可靠的结果；将最后获得的待对齐实体与推荐实体进行标注，找出推荐实体中与待对齐实体指向相同的实体，完成实体对齐。本发明在表示学习的基础上，根据医学领域知识的特点，加入词根和规则对候选实体进行筛选，得到更精确的实体对齐结果。

公开/授权文献

CN111309930B 一种基于表示学习的医学知识图谱实体对齐方法公开/授权日：2023-02-28

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06F	电数字数据处理（基于特定计算模型的计算机系统入G06N）
G06F16/00	信息检索；数据库结构；文件系统结构
G06F16/30	.•非结构文本数据（文档管理系统入G06F 16/93）
G06F16/36	..••语义工具的产生,例如,本体论或词典