基于动态时间步的实体链接方法及系统

    公开(公告)号:CN115392463A

    公开(公告)日:2022-11-25

    申请号:CN202211054245.3

    申请日:2022-08-30

    摘要: 本发明提供一种基于动态时间步的实体链接方法及系统,涉及自然语言处理技术领域,该方法包括:获取待分析文档中关联主题的多个实体提及;从知识库中获取各实体提及的候选实体,采用动态时间步的方法构建映射实体关联图,并从映射实体关联图中抽取全局主题一致性特征;根据全局主题一致性特征从所述候选实体中获取各实体提及的目标实体,将各实体提及与对应的目标实体关联。这样,通过采用动态时间步的方法构建映射实体关联图,在每一个时间步中,选择与主题相关的候选实体作为映射实体关联图的映射实体,以从映射实体关联图中抽取出正确的全局主题一致性特征,从而提高实体链接的精度。

    一种基于序列标注的文本关系抽取方法

    公开(公告)号:CN113191118B

    公开(公告)日:2023-07-18

    申请号:CN202110501103.6

    申请日:2021-05-08

    摘要: 本发明涉及数据处理技术领域,具体地涉及一种基于序列标注的文本关系抽取方法,包括构建与预测数据相近的训练数据集,预设所有可能的双向实体关系以及三种固定的依存关系;将输入语句切分为单词序列,并输入到预训练模型中,得到每个句中单词的表示向量;对单词向量序列使用类似握手的方式组成唯一单词对序列;将得到的向量对序列输入到神经网络分类层中;计算损失并进行反向传播;即判断每个单词对的类别,判断单词对是否有该位置对应的关系;根据该对应关系使用附图中展示的伪代码来解码最终结果,最终得到抽取到的所有三元组。本发明能够同时完成两个任务:实体识别和关系分类。在抽取的准确率和召回率方面均有显著提高,具有较大提升。

    基于多实体主题一致性抽取的实体链接方法及系统

    公开(公告)号:CN115640508A

    公开(公告)日:2023-01-24

    申请号:CN202211102340.6

    申请日:2022-09-09

    摘要: 本发明涉及实体链接技术领域,提供了基于多实体主题一致性抽取的实体链接方法及系统,包括:获取文档,将文档的所有提及划分到若干个稀疏图,每个稀疏图对应一个主题,对每个主题构建一个提及实体关联图,并计算每个提及实体关联图的整图表示;基于每个提及实体关联图的整图表示,并结合每个提及的候选实体集合,得到每个主题的全局一致性特征;基于每个主题的全局一致性特征,计算每个提及与其候选实体的分数,并将提及链接到分数最大的候选实体。提高了实体链接的准确性。

    一种基于序列标注的文本关系抽取方法

    公开(公告)号:CN113191118A

    公开(公告)日:2021-07-30

    申请号:CN202110501103.6

    申请日:2021-05-08

    摘要: 本发明涉及数据处理技术领域,具体地涉及一种基于序列标注的文本关系抽取方法,包括构建与预测数据相近的训练数据集,预设所有可能的双向实体关系以及三种固定的依存关系;将输入语句切分为单词序列,并输入到预训练模型中,得到每个句中单词的表示向量;对单词向量序列使用类似握手的方式组成唯一单词对序列;将得到的向量对序列输入到神经网络分类层中;计算损失并进行反向传播;即判断每个单词对的类别,判断单词对是否有该位置对应的关系;根据该对应关系使用附图中展示的伪代码来解码最终结果,最终得到抽取到的所有三元组。本发明能够同时完成两个任务:实体识别和关系分类。在抽取的准确率和召回率方面均有显著提高,具有较大提升。