一种事件检测方法和系统

    公开(公告)号:CN113779358B

    公开(公告)日:2024-05-24

    申请号:CN202111075599.1

    申请日:2021-09-14

    Inventor: 黄伟鹏

    Abstract: 本说明书公开了一种事件检测方法和系统,所述方法包括:获取待处理文本;基于抽取模型从待处理文本中抽取一组或多组实例数据;基于一组或多组实例数据,确定一个或多个抽取三元组,进而得到抽取图谱;获取一个或多个候选事件的图谱本体定义数据,并基于此得到对应每个候选事件的本体定义图谱;确定抽取图谱分别与一个或多个候选事件的本体定义图谱的相似度;基于各相似度,从一个或多个候选事件中确定待处理文本对应的事件。

    语义相似度确定方法、装置及处理设备

    公开(公告)号:CN111241851A

    公开(公告)日:2020-06-05

    申请号:CN202010329730.1

    申请日:2020-04-24

    Abstract: 本说明书提供一种语义相似度确定方法、装置及处理设备,预先建立的语义相似度模型从两个不同的角度处理句子对,既考虑了文本句子的维度,又结合了文本单词级交叉矩阵的角度。在需要对待处理文本进行语义相似度的计算时,可以直接利用建立好的语义相似度模型中的语句语义确定子模型对待处理文本分别进行语义编码,将待处理文本分别转换为向量表示,基于转换后的向量对待处理文本进行相似度计算。在确保语义相似度计算效率的基础上,提高了语义相似度计算的准确性。

    一种分词方法、多模式分词模型和系统

    公开(公告)号:CN112199952B

    公开(公告)日:2021-03-23

    申请号:CN202011397544.8

    申请日:2020-12-04

    Abstract: 本说明书实施例公开了一种分词方法、多模式分词模型和系统。该方法包括:获取待处理文本;利用多模式分词模型对所述待处理文本进行以下处理,以确定对所述待处理文本的分词结果:通过特征提取层处理所述待处理文本,获得对应于所述待处理文本的特征序列;基于所述待处理文本所属的领域类型,通过对应所述领域类型的至少一个映射层处理所述特征序列,获得至少一个映射特征;通过预测层基于所述至少一个映射特征确定对所述待处理文本的所述分词结果。

    一种分词方法、多模式分词模型和系统

    公开(公告)号:CN112199952A

    公开(公告)日:2021-01-08

    申请号:CN202011397544.8

    申请日:2020-12-04

    Abstract: 本说明书实施例公开了一种分词方法、多模式分词模型和系统。该方法包括:获取待处理文本;利用多模式分词模型对所述待处理文本进行以下处理,以确定对所述待处理文本的分词结果:通过特征提取层处理所述待处理文本,获得对应于所述待处理文本的特征序列;基于所述待处理文本所属的领域类型,通过对应所述领域类型的至少一个映射层处理所述特征序列,获得至少一个映射特征;通过预测层基于所述至少一个映射特征确定对所述待处理文本的所述分词结果。

    一种事件抽取方法和系统及实体分类模型

    公开(公告)号:CN111368175B

    公开(公告)日:2020-08-28

    申请号:CN202010461711.4

    申请日:2020-05-27

    Inventor: 黄伟鹏 徐军 王峰

    Abstract: 本说明书实施例提供一种事件抽取方法和系统及实体分类模型。所述方法包括:获取待处理文本中的一个或多个实体,所述待处理文本为包含两个或以上句子的篇章级文本;确定所述一个或多个实体中每个实体的局部特征,所述局部特征反映实体与所述待处理文本中至少一个句子之间的关联关系;基于所述一个或多个实体的所述局部特征,确定每个实体的全局特征,所述全局特征反映实体与所述待处理文本的整体关联关系;对于所述一个或多个实体中每个实体,基于该实体的全局特征确定该实体的事件要素类型;基于所述一个或多个实体的事件要素类型,抽取所述待处理文本中的一个或多个事件以及对应的实体。

    一种事件检测方法和系统

    公开(公告)号:CN113779358A

    公开(公告)日:2021-12-10

    申请号:CN202111075599.1

    申请日:2021-09-14

    Inventor: 黄伟鹏

    Abstract: 本说明书公开了一种事件检测方法和系统,所述方法包括:获取待处理文本;基于抽取模型从待处理文本中抽取一组或多组实例数据;基于一组或多组实例数据,确定一个或多个抽取三元组,进而得到抽取图谱;获取一个或多个候选事件的图谱本体定义数据,并基于此得到对应每个候选事件的本体定义图谱;确定抽取图谱分别与一个或多个候选事件的本体定义图谱的相似度;基于各相似度,从一个或多个候选事件中确定待处理文本对应的事件。

    用于事件检测的网络训练方法及装置

    公开(公告)号:CN112199950A

    公开(公告)日:2021-01-08

    申请号:CN202011111486.8

    申请日:2020-10-16

    Abstract: 本说明书实施例提供了一种用于事件检测的网络训练方法及装置。其中包括动态感知网络和目标反馈网络。动态感知网络包含顺序排列的多个备选的计算层,在对动态感知网络进行训练时,针对获取的样本文本中的任意一个词,从动态感知网络中逐渐增加地选择前若干个计算层,并通过前若干个计算层和该词的初始特征向量确定该词的中间特征向量,基于第一分类器和该词的中间特征向量确定第一预测标签,当第一预测标签与对应的标注标签的第一差异小于第一预设阈值时,将前若干个计算层作为与该词对应的计算层,将该词的中间特征向量作为该词的第一特征向量,基于第一差异确定第一预测损失,向减小第一预测损失的方向,调整与该词对应的计算层中的模型参数。

    一种事件抽取方法和系统及实体分类模型

    公开(公告)号:CN111368175A

    公开(公告)日:2020-07-03

    申请号:CN202010461711.4

    申请日:2020-05-27

    Inventor: 黄伟鹏 徐军 王峰

    Abstract: 本说明书实施例提供一种事件抽取方法和系统及实体分类模型。所述方法包括:获取待处理文本中的一个或多个实体,所述待处理文本为包含两个或以上句子的篇章级文本;确定所述一个或多个实体中每个实体的局部特征,所述局部特征反映实体与所述待处理文本中至少一个句子之间的关联关系;基于所述一个或多个实体的所述局部特征,确定每个实体的全局特征,所述全局特征反映实体与所述待处理文本的整体关联关系;对于所述一个或多个实体中每个实体,基于该实体的全局特征确定该实体的事件要素类型;基于所述一个或多个实体的事件要素类型,抽取所述待处理文本中的一个或多个事件以及对应的实体。

Patent Agency Ranking