-
公开(公告)号:CN113177124B
公开(公告)日:2023-05-02
申请号:CN202110511440.3
申请日:2021-05-11
Applicant: 北京邮电大学
IPC: G06F16/36 , G06F16/33 , G06F16/335 , G06F16/35 , G06F40/18 , G06N3/0442 , G06N3/08
Abstract: 本发明提供一种垂直领域知识图谱构建方法及系统,该方法包括:将产品文档输入到训练好的知识抽取模型中,训练好的知识抽取模型包括表格标注模型和文本知识抽取模型;通过表格标注模型对产品文档中的半结构化数据进行表格标注处理,得到产品文档的三元组,表格标注模型是通过序列标注后的半结构化样本数据,对神经网络进行训练得到的;通过文本知识抽取模型对产品文档中的非结构化数据进行知识抽取处理,得到产品文档的三元组,文本知识抽取模型是通过纯文本标注后的非结构化样本数据,对改进的语言模型进行训练得到的;根据三元组,构建产品文档的知识图谱。本发明提高了垂直领域知识图谱构建方法的专业性、准确性和高效性。
-
公开(公告)号:CN113177124A
公开(公告)日:2021-07-27
申请号:CN202110511440.3
申请日:2021-05-11
Applicant: 北京邮电大学
Abstract: 本发明提供一种垂直领域知识图谱构建方法及系统,该方法包括:将产品文档输入到训练好的知识抽取模型中,训练好的知识抽取模型包括表格标注模型和文本知识抽取模型;通过表格标注模型对产品文档中的半结构化数据进行表格标注处理,得到产品文档的三元组,表格标注模型是通过序列标注后的半结构化样本数据,对神经网络进行训练得到的;通过文本知识抽取模型对产品文档中的非结构化数据进行知识抽取处理,得到产品文档的三元组,文本知识抽取模型是通过纯文本标注后的非结构化样本数据,对改进的语言模型进行训练得到的;根据三元组,构建产品文档的知识图谱。本发明提高了垂直领域知识图谱构建方法的专业性、准确性和高效性。
-