发明公开
- 专利标题: 专利文本的知识图谱创建方法、装置、存储介质及设备
-
申请号: CN202211452940.5申请日: 2022-11-21
-
公开(公告)号: CN115757827A公开(公告)日: 2023-03-07
- 发明人: 严妍 , 汪敏 , 杨春宇 , 况海
- 申请人: 开普云信息科技股份有限公司 , 北京开普云信息科技有限公司
- 申请人地址: 广东省东莞市石龙镇中山东东升路1号汇星商业中心5栋2单元1805室;
- 专利权人: 开普云信息科技股份有限公司,北京开普云信息科技有限公司
- 当前专利权人: 开普云信息科技股份有限公司,北京开普云信息科技有限公司
- 当前专利权人地址: 广东省东莞市石龙镇中山东东升路1号汇星商业中心5栋2单元1805室;
- 代理机构: 北京德崇智捷知识产权代理有限公司
- 代理商 郭美丽
- 主分类号: G06F16/36
- IPC分类号: G06F16/36 ; G06F40/284 ; G06F40/289 ; G06N3/0442 ; G06N3/045 ; G06N3/08
摘要:
本申请公开了一种专利文本的知识图谱创建方法、装置、存储介质及设备,属于机器学习技术领域。方法包括:获取中医药领域的多篇专利文本中的字段,字段包括发明名称、摘要、权利要求书和说明书;利用训练好的实体提取模型从字段中提取实体,实体提取模型是基于Sentence‑BERT‑BiGRU‑CRF创建并训练的;基于整体概念‑成分概念以及物体概念‑效果概念的语言规则,从字段中提取实体和关系;基于实体提取模型提取到的实体以及语言规则提取到的实体和关系创建知识图谱。本申请通过实体识别模型提高了识别出实体的准确率;通过语言规则提取实体和关系,提高了知识获取的覆盖度,扩充了知识图谱的规模。