-
公开(公告)号:CN116150393A
公开(公告)日:2023-05-23
申请号:CN202211601595.7
申请日:2022-12-13
Applicant: 南京大学
IPC: G06F16/36 , G06F40/253 , G06F40/211 , G06F40/30
Abstract: 本发明公开了一种文本依存句法分析的关系抽取及知识图谱构建方法,具体包括以下步骤:步骤一、数据预处理;步骤二、实体的预定义与抽取;步骤三、关系预定义和抽取;步骤四、知识图谱构建与应用,本发明涉及叙事型文本处理技术领域。该发明通过针对叙事性文本,构建时间事件、句子主干、句子枝干三种模型,无需特定领域的专家制定模板,迁移性较强,依存句法分析的方法聚焦于句子的语法结构出发,将句子中对应的依存关系进行一一抽取,最终将这些局部的依存关系按照语序表达组合后更简洁地还原原始语义,精度和稳定性都更高,语料覆盖程度有较大的提高,在简洁还原关系的基础上使得语义得到更丰富地表达。
-
公开(公告)号:CN115935995A
公开(公告)日:2023-04-07
申请号:CN202211601610.8
申请日:2022-12-13
Applicant: 南京大学
IPC: G06F40/295 , G06F40/289 , G06F40/242 , G06F40/268 , G06F16/36 , G06F16/35 , G06F18/23213 , G06F18/2321 , G06F18/2323 , G06N5/04 , G06N5/022
Abstract: 本发明公开了面向知识图谱生成的非遗丝织领域实体关系抽取方法,具体包括以下步骤:步骤一、实体识别;步骤二、关系抽取;步骤三、实例拓展;步骤四、图谱构建;本发明涉及非遗数字化保护技术领域。该面向知识图谱生成的非遗丝织领域实体关系抽取方法,通过利用成熟的自然语言处理工具和术语词典进行实体识别,通过无监督机器学习方法抽取实体关系,并采用半监督方式扩增标注实例,最后基于标注的关系三元组生成领域知识图谱,有效解决了标注数据缺乏、文本特征选择困难和应用深度较差的问题,适用于缺少学习语料和标注数据场景下面向大规模网络非结构化文本的实体关系抽取和应用。
-