-
公开(公告)号:CN114969359A
公开(公告)日:2022-08-30
申请号:CN202210508093.3
申请日:2022-05-10
Applicant: 国网上海市电力公司 , 中国科学院计算技术研究所
IPC: G06F16/36 , G06F16/901 , G06F40/30
Abstract: 本发明涉及一种基于机器阅读理解的实体关系联合抽取方法及系统,方法首先针对实体类型和关系类型分别设计实体抽取问题模板和关系抽取问题模板,并基于机器阅读理解进行非限定实体抽取;接着根据抽取的实体分别筛选正向抽取候选关系集合和逆向抽取候选关系集合,基于上述候选关系集合自动生成关系抽取问题模板,并基于机器阅读理解进行限定式双向关系抽取;对于推理过程,将正向和逆向抽取的实体关系三元组取交集和差集,交集直接作为最终结果,差集中概率大于阈值的三元组也并入到结果中。与现有技术相比,本发明可以有效地解决实体关系语义建模不全面,以及重叠三元组问题,最终为构建知识图谱提供高质量的实体关系三元组。
-
公开(公告)号:CN114969359B
公开(公告)日:2024-07-30
申请号:CN202210508093.3
申请日:2022-05-10
Applicant: 国网上海市电力公司 , 中国科学院计算技术研究所
IPC: G06F16/36 , G06F16/901 , G06F40/30
Abstract: 本发明涉及一种基于机器阅读理解的实体关系联合抽取方法及系统,方法首先针对实体类型和关系类型分别设计实体抽取问题模板和关系抽取问题模板,并基于机器阅读理解进行非限定实体抽取;接着根据抽取的实体分别筛选正向抽取候选关系集合和逆向抽取候选关系集合,基于上述候选关系集合自动生成关系抽取问题模板,并基于机器阅读理解进行限定式双向关系抽取;对于推理过程,将正向和逆向抽取的实体关系三元组取交集和差集,交集直接作为最终结果,差集中概率大于阈值的三元组也并入到结果中。与现有技术相比,本发明可以有效地解决实体关系语义建模不全面,以及重叠三元组问题,最终为构建知识图谱提供高质量的实体关系三元组。
-