发明公开
- 专利标题: 一种实体关系的抽取与预标注方法
-
申请号: CN202111274804.7申请日: 2021-10-29
-
公开(公告)号: CN114357270A公开(公告)日: 2022-04-15
- 发明人: 胡志强 , 马政 , 李志鹏 , 石珺
- 申请人: 深圳市网联安瑞网络科技有限公司
- 申请人地址: 广东省深圳市福田区华富街道新田社区深南大道1006号深圳国际创新中心(福田科技广场)D栋七层
- 专利权人: 深圳市网联安瑞网络科技有限公司
- 当前专利权人: 深圳市网联安瑞网络科技有限公司
- 当前专利权人地址: 广东省深圳市福田区华富街道新田社区深南大道1006号深圳国际创新中心(福田科技广场)D栋七层
- 代理机构: 广东普润知识产权代理有限公司
- 代理商 寇闯
- 主分类号: G06F16/951
- IPC分类号: G06F16/951 ; G06F16/28 ; G06F16/22
摘要:
本发明公开了一种实体关系的抽取与预标注方法,涉及知识图谱技术领域。根据实体类关键词作为头实体,抓取相关维基网页右侧信息框中的结构化数据;由以上头实体与信息框中各字段对应的尾实体,组成各三元组;根据各三元组的头尾实体在维基原文中匹配相应的句子,若匹配成功则进行下一步,匹配失败则跳过该三元组开始处理下一个实体关键词。将以上各三元组的关系对应的字段与关系类关键词进行匹配,若匹配成功,完成三元组头尾实体的抽取、预标注、实体类型与关系的确定;若匹配不成功,对头实体或尾实体进行预标注,实体间关系无法由关系类关键词判定时,关系的判定交给人工。本发明解决人工标注费时费力、成本高的问题。