一种文本事件关系提取方法、装置

    公开(公告)号:CN118917405A

    公开(公告)日:2024-11-08

    申请号:CN202410917317.5

    申请日:2024-07-09

    IPC分类号: G06N5/025 G06N20/00 G06N5/04

    摘要: 一种文本事件关系提取方法,包括:获取用于进行事件关系提取的数据样本;其中,所述数据样本包含文本、以及用于指示从所述文本中提取至少一个目标文本事件的指令;所述目标文本事件为与指定的文本事件具有目标类型的文本事件关系的文本事件;所述目标类型的文本事件关系为从多种类型的文本事件关系中指定的文本事件关系类型;将所述数据样本输入至LLM模型,以由所述LLM模型响应于所述指令,针对所述文本进行逻辑推理,从所述文本包含的文本事件中选择出所述至少一个目标文本事件,以完成针对所述文本的事件关系提取。

    事件抽取方法、装置、计算机程序产品、存储介质及设备

    公开(公告)号:CN115048486A

    公开(公告)日:2022-09-13

    申请号:CN202210580427.8

    申请日:2022-05-24

    摘要: 本申请公开了一种事件抽取方法、装置、计算机程序产品、存储介质及设备,其中方法包括:识别目标文本中的至少一个触发词,获取至少一个触发词分别对应的触发词向量,基于各触发词对应的触发词向量、各触发词对应的事件类型向量以及各触发词对应的相对位置向量,在目标文本中确定与各触发词对应的事件类型相关联的要素词信息,要素词信息包括至少一个要素词中各要素词对应的位置信息和各要素词之间的要素关系,基于各要素词的位置信息以及各要素词之间的要素关系,生成目标文本对应的事件抽取结果,各触发词对应的事件类型向量表示目标触发词对应的事件类型,各触发词对应的相对位置向量表示目标文本中各单词和各触发词之间的相对位置关系。

    文本侵权检测方法、装置和电子设备

    公开(公告)号:CN113673216A

    公开(公告)日:2021-11-19

    申请号:CN202111222905.X

    申请日:2021-10-20

    IPC分类号: G06F40/194 G06F40/279

    摘要: 一种文本侵权检测方法、装置和电子设备,该方法包括:从目标文本中提取关键句子,并对关键句子进行向量化处理,得到与关键句子对应的关键句子向量;计算关键句子向量和原创句子向量之间的向量相似度,并基于向量相似度,确定与关键句子相似的候选句子;原创句子向量包括对原创文本中的原创句子进行向量化处理,得到的与原创句子对应的句子向量;基于关键句子向量和与候选句子对应的原创句子向量之间的向量相似度,计算目标文本和候选句子所属的候选文本之间的文本相似度,并基于文本相似度,确定目标文本是否为候选文本的侵权文本,以在目标文本为候选文本的侵权文本时,将候选句子作为目标文本针对候选文本的侵权细节,发布至区块链进行存证。

    一种序列标注方法和系统
    5.
    发明公开

    公开(公告)号:CN113435191A

    公开(公告)日:2021-09-24

    申请号:CN202110844271.5

    申请日:2021-07-26

    发明人: 徐军 王峰

    摘要: 本说明书实施例公开了一种序列标注方法和系统,该方法包括:获取待识别文本,待识别文本包括多个字或词;利用预先训练好的序列标注模型对待识别文本进行处理,确定待识别文本的标注序列,其中,所述处理包括:确定待识别文本中各个字或词对应的第一输入向量表示;利用编码网络对各个字或词对应的第一输入向量表示进行处理,确定各个字或词对应的语义向量表示;获取各个字或词对应的同义词向量表示;基于各个字或词对应的语义向量表示和同义词向量表示,确定待识别文本的标注序列。

    用于事件检测的网络训练方法及装置

    公开(公告)号:CN112199950A

    公开(公告)日:2021-01-08

    申请号:CN202011111486.8

    申请日:2020-10-16

    摘要: 本说明书实施例提供了一种用于事件检测的网络训练方法及装置。其中包括动态感知网络和目标反馈网络。动态感知网络包含顺序排列的多个备选的计算层,在对动态感知网络进行训练时,针对获取的样本文本中的任意一个词,从动态感知网络中逐渐增加地选择前若干个计算层,并通过前若干个计算层和该词的初始特征向量确定该词的中间特征向量,基于第一分类器和该词的中间特征向量确定第一预测标签,当第一预测标签与对应的标注标签的第一差异小于第一预设阈值时,将前若干个计算层作为与该词对应的计算层,将该词的中间特征向量作为该词的第一特征向量,基于第一差异确定第一预测损失,向减小第一预测损失的方向,调整与该词对应的计算层中的模型参数。

    一种事件抽取方法和系统及实体分类模型

    公开(公告)号:CN111368175A

    公开(公告)日:2020-07-03

    申请号:CN202010461711.4

    申请日:2020-05-27

    发明人: 黄伟鹏 徐军 王峰

    摘要: 本说明书实施例提供一种事件抽取方法和系统及实体分类模型。所述方法包括:获取待处理文本中的一个或多个实体,所述待处理文本为包含两个或以上句子的篇章级文本;确定所述一个或多个实体中每个实体的局部特征,所述局部特征反映实体与所述待处理文本中至少一个句子之间的关联关系;基于所述一个或多个实体的所述局部特征,确定每个实体的全局特征,所述全局特征反映实体与所述待处理文本的整体关联关系;对于所述一个或多个实体中每个实体,基于该实体的全局特征确定该实体的事件要素类型;基于所述一个或多个实体的事件要素类型,抽取所述待处理文本中的一个或多个事件以及对应的实体。

    文本侵权检测方法、装置和电子设备

    公开(公告)号:CN113673216B

    公开(公告)日:2022-02-01

    申请号:CN202111222905.X

    申请日:2021-10-20

    IPC分类号: G06F40/194 G06F40/279

    摘要: 一种文本侵权检测方法、装置和电子设备,该方法包括:从目标文本中提取关键句子,并对关键句子进行向量化处理,得到与关键句子对应的关键句子向量;计算关键句子向量和原创句子向量之间的向量相似度,并基于向量相似度,确定与关键句子相似的候选句子;原创句子向量包括对原创文本中的原创句子进行向量化处理,得到的与原创句子对应的句子向量;基于关键句子向量和与候选句子对应的原创句子向量之间的向量相似度,计算目标文本和候选句子所属的候选文本之间的文本相似度,并基于文本相似度,确定目标文本是否为候选文本的侵权文本,以在目标文本为候选文本的侵权文本时,将候选句子作为目标文本针对候选文本的侵权细节,发布至区块链进行存证。

    一种事件抽取方法和系统及实体分类模型

    公开(公告)号:CN111368175B

    公开(公告)日:2020-08-28

    申请号:CN202010461711.4

    申请日:2020-05-27

    发明人: 黄伟鹏 徐军 王峰

    摘要: 本说明书实施例提供一种事件抽取方法和系统及实体分类模型。所述方法包括:获取待处理文本中的一个或多个实体,所述待处理文本为包含两个或以上句子的篇章级文本;确定所述一个或多个实体中每个实体的局部特征,所述局部特征反映实体与所述待处理文本中至少一个句子之间的关联关系;基于所述一个或多个实体的所述局部特征,确定每个实体的全局特征,所述全局特征反映实体与所述待处理文本的整体关联关系;对于所述一个或多个实体中每个实体,基于该实体的全局特征确定该实体的事件要素类型;基于所述一个或多个实体的事件要素类型,抽取所述待处理文本中的一个或多个事件以及对应的实体。

    事件抽取方法、装置、计算机程序产品、存储介质及设备

    公开(公告)号:CN115048486B

    公开(公告)日:2024-05-31

    申请号:CN202210580427.8

    申请日:2022-05-24

    摘要: 本申请公开了一种事件抽取方法、装置、计算机程序产品、存储介质及设备,其中方法包括:识别目标文本中的至少一个触发词,获取至少一个触发词分别对应的触发词向量,基于各触发词对应的触发词向量、各触发词对应的事件类型向量以及各触发词对应的相对位置向量,在目标文本中确定与各触发词对应的事件类型相关联的要素词信息,要素词信息包括至少一个要素词中各要素词对应的位置信息和各要素词之间的要素关系,基于各要素词的位置信息以及各要素词之间的要素关系,生成目标文本对应的事件抽取结果,各触发词对应的事件类型向量表示目标触发词对应的事件类型,各触发词对应的相对位置向量表示目标文本中各单词和各触发词之间的相对位置关系。