专利文本的知识图谱创建方法、装置、存储介质及设备
摘要:
本申请公开了一种专利文本的知识图谱创建方法、装置、存储介质及设备,属于机器学习技术领域。方法包括:获取中医药领域的多篇专利文本中的字段,字段包括发明名称、摘要、权利要求书和说明书;利用训练好的实体提取模型从字段中提取实体,实体提取模型是基于Sentence‑BERT‑BiGRU‑CRF创建并训练的;基于整体概念‑成分概念以及物体概念‑效果概念的语言规则,从字段中提取实体和关系;基于实体提取模型提取到的实体以及语言规则提取到的实体和关系创建知识图谱。本申请通过实体识别模型提高了识别出实体的准确率;通过语言规则提取实体和关系,提高了知识获取的覆盖度,扩充了知识图谱的规模。
0/0