-
公开(公告)号:CN113221539A
公开(公告)日:2021-08-06
申请号:CN202110772554.3
申请日:2021-07-08
申请人: 华东交通大学
IPC分类号: G06F40/211 , G06F40/216 , G06F40/295 , G06F40/30 , G06N3/04
摘要: 本发明提出一种集成句法信息的嵌套命名实体识别方法及系统,所述方法包括如下步骤:抽取给定句子中每个当前词对应的短语句法特征,集合短语句法特征以得到短语句法信息;以短语句法信息作为额外输入,并基于注意力机制构建得到边界检测模型,用于筛选出给定句子中包含命名实体的文本片段并加入到候选文本片段集中;抽取给定句子中每个当前词对应的依存句法特征,集合依存句法特征以得到依存句法信息;以依存句法信息作为额外输入,并基于注意力机制构建得到类别预测模型,类别预测模型用于预测候选文本片段为特定类别实体的概率以及不是实体的概率。本发明提出的集成句法信息的嵌套命名实体识别方法,可提高实际识别准确度。
-
公开(公告)号:CN113221539B
公开(公告)日:2021-09-24
申请号:CN202110772554.3
申请日:2021-07-08
申请人: 华东交通大学
IPC分类号: G06F40/211 , G06F40/216 , G06F40/295 , G06F40/30 , G06N3/04
摘要: 本发明提出一种集成句法信息的嵌套命名实体识别方法及系统,所述方法包括如下步骤:抽取给定句子中每个当前词对应的短语句法特征,集合短语句法特征以得到短语句法信息;以短语句法信息作为额外输入,并基于注意力机制构建得到边界检测模型,用于筛选出给定句子中包含命名实体的文本片段并加入到候选文本片段集中;抽取给定句子中每个当前词对应的依存句法特征,集合依存句法特征以得到依存句法信息;以依存句法信息作为额外输入,并基于注意力机制构建得到类别预测模型,类别预测模型用于预测候选文本片段为特定类别实体的概率以及不是实体的概率。本发明提出的集成句法信息的嵌套命名实体识别方法,可提高实际识别准确度。
-