-
公开(公告)号:CN111309930B
公开(公告)日:2023-02-28
申请号:CN202010151549.6
申请日:2020-03-06
申请人: 西南交通大学
IPC分类号: G06F16/36
摘要: 本发明提供了一种基于表示学习的医学知识图谱实体对齐方法,实体的完全字符串匹配,去除公有实体得到待对齐实体;通过知识表示学习模型对两个知识图谱中的三元组进行训练,得到每个实体的嵌入向量;计算待对齐实体与标准实体的语义距离,找出语义距离值最高的前十个推荐实体;通过构造医学知识数据的词根集,去除词根完全不同的候选实体;判断待对齐实体与推荐实体是否为同一科室和部位,去除推荐实体中不可靠的结果;将最后获得的待对齐实体与推荐实体进行标注,找出推荐实体中与待对齐实体指向相同的实体,完成实体对齐。本发明在表示学习的基础上,根据医学领域知识的特点,加入词根和规则对候选实体进行筛选,得到更精确的实体对齐结果。
-
公开(公告)号:CN110347847A
公开(公告)日:2019-10-18
申请号:CN201910663022.9
申请日:2019-07-22
申请人: 西南交通大学
摘要: 本发明实施例提供的一种基于神经网络的知识图谱补全方法,涉及自然语言处理技术领域,其包括:S1、在嵌入层将知识图谱K中的三元组(s,r,o)转换为句子[s r o],利用向量表示技术把句子[s r o]转换为k维稠密向量表示形式xi=[vs,vr,vo];S2、在循环层利用BiLSTM网络从输入特征向量xi中学习句子的长期依赖性,得到循环层特征向量hRNN;S3、在卷积层利用卷积神经网络从特征向量hRNN中学习局部结构信息,得到卷积层特征向量hCNN;S4、在全连接层将卷积层特征向量hCNN转化为每一个三元组(s,r,o)的得分。该知识图谱补全方法在不依靠任何外部数据的情况下,利用循环和卷积神经网络捕获知识图谱中事实的长期依赖性和局部结构信息,同时保留实体和关系的传递特征,学习能力更高。
-
公开(公告)号:CN110347847B
公开(公告)日:2021-09-28
申请号:CN201910663022.9
申请日:2019-07-22
申请人: 西南交通大学
摘要: 本发明实施例提供的一种基于神经网络的知识图谱补全方法,涉及自然语言处理技术领域,其包括:S1、在嵌入层将知识图谱K中的三元组(s,r,o)转换为句子[s r o],利用向量表示技术把句子[s r o]转换为k维稠密向量表示形式xi=[vs,vr,vo];S2、在循环层利用BiLSTM网络从输入特征向量xi中学习句子的长期依赖性,得到循环层特征向量hRNN;S3、在卷积层利用卷积神经网络从特征向量hRNN中学习局部结构信息,得到卷积层特征向量hCNN;S4、在全连接层将卷积层特征向量hCNN转化为每一个三元组(s,r,o)的得分。该知识图谱补全方法在不依靠任何外部数据的情况下,利用循环和卷积神经网络捕获知识图谱中事实的长期依赖性和局部结构信息,同时保留实体和关系的传递特征,学习能力更高。
-
公开(公告)号:CN111309930A
公开(公告)日:2020-06-19
申请号:CN202010151549.6
申请日:2020-03-06
申请人: 西南交通大学
IPC分类号: G06F16/36
摘要: 本发明提供了一种基于表示学习的医学知识图谱实体对齐方法,实体的完全字符串匹配,去除公有实体得到待对齐实体;通过知识表示学习模型对两个知识图谱中的三元组进行训练,得到每个实体的嵌入向量;计算待对齐实体与标准实体的语义距离,找出语义距离值最高的前十个推荐实体;通过构造医学知识数据的词根集,去除词根完全不同的候选实体;判断待对齐实体与推荐实体是否为同一科室和部位,去除推荐实体中不可靠的结果;将最后获得的待对齐实体与推荐实体进行标注,找出推荐实体中与待对齐实体指向相同的实体,完成实体对齐。本发明在表示学习的基础上,根据医学领域知识的特点,加入词根和规则对候选实体进行筛选,得到更精确的实体对齐结果。
-
-
-