-
公开(公告)号:CN115935995A
公开(公告)日:2023-04-07
申请号:CN202211601610.8
申请日:2022-12-13
Applicant: 南京大学
IPC: G06F40/295 , G06F40/289 , G06F40/242 , G06F40/268 , G06F16/36 , G06F16/35 , G06F18/23213 , G06F18/2321 , G06F18/2323 , G06N5/04 , G06N5/022
Abstract: 本发明公开了面向知识图谱生成的非遗丝织领域实体关系抽取方法,具体包括以下步骤:步骤一、实体识别;步骤二、关系抽取;步骤三、实例拓展;步骤四、图谱构建;本发明涉及非遗数字化保护技术领域。该面向知识图谱生成的非遗丝织领域实体关系抽取方法,通过利用成熟的自然语言处理工具和术语词典进行实体识别,通过无监督机器学习方法抽取实体关系,并采用半监督方式扩增标注实例,最后基于标注的关系三元组生成领域知识图谱,有效解决了标注数据缺乏、文本特征选择困难和应用深度较差的问题,适用于缺少学习语料和标注数据场景下面向大规模网络非结构化文本的实体关系抽取和应用。