面向检索增强语言模型的知识冲突分析缓解方法

    公开(公告)号:CN118606444A

    公开(公告)日:2024-09-06

    申请号:CN202410656522.0

    申请日:2024-05-24

    Abstract: 本发明涉及自然语言处理技术领域,提供一种面向检索增强语言模型的知识冲突分析缓解方法,利用模型内部记忆答案、外部来源答案和回复结果,从回复结果的正确性、忠实性和模型记忆性中至少一个角度,对检索增强语言模型进行知识冲突分析,得到分析结果,如此可以更加清晰的确定出检索增强语言模型存在的问题。在分析结果是检索增强语言模型存在知识冲突的情况下,利用问题样本及其对应于知识冲突的类型的答案样本,对检索增强语言模型进行训练,以缓解检索增强语言模型的知识冲突问题,提高其平均召回率,更好地校准检索增强语言模型的置信度水平,提高其在面对知识冲突时的决策质量,确保检索增强语言模型能够在面对复杂的信息时做出准确判断。

    基于离散扩散的复杂事件模式归纳模型的训练方法、装置

    公开(公告)号:CN118485075A

    公开(公告)日:2024-08-13

    申请号:CN202410497324.4

    申请日:2024-04-24

    Abstract: 本发明提供一种基于离散扩散的复杂事件模式归纳模型的训练方法、装置,该方法包括:获取样本复杂事件,基于样本复杂事件,确定样本实例图,对样本实例图的初始事件骨架图进行离散扩散,得到扩散事件骨架图,基于扩散事件骨架图的骨架特征以及初始事件预测模型,同时预测扩散事件骨架图对应的复杂事件骨架图;基于样本实例图以及初始实体关系预测模型,预测得到补全实例图;基于迭代完成的事件预测模型以及实体关系预测模型,得到最终的复杂事件模式归纳模型。本发明提供的方法、装置,实现了事件骨架图、实体关系的准确预测,提升了复杂事件模式归纳模型生成的复杂事件模式的准确性、有效性。

    基于角色扮演的因果关系解释生成方法、装置

    公开(公告)号:CN118396129A

    公开(公告)日:2024-07-26

    申请号:CN202410403374.1

    申请日:2024-04-03

    Abstract: 本发明提供一种基于角色扮演的因果关系解释生成方法、装置,该方法包括:获取待解释的因果对;分别基于预设的任务提示,以及各推理角色的扮演者,对待解释的因果对进行与推理角色对应的分析,得到与待解释的因果对相关的细粒度知识;推理角色的扮演者包括原因分析者、结果分析者、疑问解答者;基于生成者,生成待解释的因果对的初始解释,以及,基于细粒度知识、待解释的因果对、批评者,生成初始解释的反馈结果,基于生成者以及反馈结果,对初始解释进行迭代,直至得到待解释的因果对最后的因果关系解释;本发明提供的方法,通过多个扮演角色实现推理逻辑正确、有深度的高质量解释生成,进而提升基于解释生成的下游自然语言任务的准确性。

    事件因果关系识别方法、装置、电子设备与存储介质

    公开(公告)号:CN113779190B

    公开(公告)日:2023-08-18

    申请号:CN202110819756.9

    申请日:2021-07-20

    Abstract: 本发明提供一种事件因果关系识别方法、装置、电子设备与存储介质,所述方法包括:基于待识别的事件对所在的文本,确定所述事件对的上下文表示;将所述事件对的上下文表示,以及与所述事件对相关的描述性知识和关联性知识输入至因果关系识别模型,得到所述因果关系识别模型输出的所述事件对的因果关系;其中,所述因果关系识别模型是基于样本事件对的上下文表示,与所述样本事件对相关的样本描述性知识和样本关联性知识,以及所述样本事件对的因果关系训练得到的。本发明提供的方法、装置、电子设备与存储介质,能够充分挖掘事件对之间的因果关系信息,避免显式线索缺乏导致事件因果关系无法识别的问题,极大地提高事件因果关系识别的准确性。

    基于噪声感知机制的命名实体识别方法、装置及设备

    公开(公告)号:CN113761925B

    公开(公告)日:2022-10-28

    申请号:CN202110837136.8

    申请日:2021-07-23

    Abstract: 本发明提供一种基于噪声感知机制的命名实体识别方法、装置及设备,其中方法包括:确定待识别文本;将待识别文本输入至命名实体识别模型,得到命名实体识别模型输出的识别结果;命名实体识别模型是基于干净样本集合训练得到的,干净样本集合是基于原始样本集合中各样本文本的训练统计量,对原始样本集合进行噪声筛除得到的,训练统计量是在基于样本文本进行训练过程中统计的预测结果和标签之间的差异。本发明提供的方法、装置、电子设备和存储介质,能够通过获取待识别文本的识别结果,根据识别结果对待识别文本进行命名实体类型判定,克服了命名实体识别数据集中正确样本和噪声样本难以区分的问题,实现了待识别文本的命名实体类型的精确识别。

    事件因果关系识别方法、装置、电子设备与存储介质

    公开(公告)号:CN113779190A

    公开(公告)日:2021-12-10

    申请号:CN202110819756.9

    申请日:2021-07-20

    Abstract: 本发明提供一种事件因果关系识别方法、装置、电子设备与存储介质,所述方法包括:基于待识别的事件对所在的文本,确定所述事件对的上下文表示;将所述事件对的上下文表示,以及与所述事件对相关的描述性知识和关联性知识输入至因果关系识别模型,得到所述因果关系识别模型输出的所述事件对的因果关系;其中,所述因果关系识别模型是基于样本事件对的上下文表示,与所述样本事件对相关的样本描述性知识和样本关联性知识,以及所述样本事件对的因果关系训练得到的。本发明提供的方法、装置、电子设备与存储介质,能够充分挖掘事件对之间的因果关系信息,避免显式线索缺乏导致事件因果关系无法识别的问题,极大地提高事件因果关系识别的准确性。

    事件事实性预测方法、装置、电子设备与存储介质

    公开(公告)号:CN113761874A

    公开(公告)日:2021-12-07

    申请号:CN202110815460.X

    申请日:2021-07-19

    Abstract: 本发明提供一种事件事实性预测方法、装置、电子设备与存储介质,所述方法包括:确定待分析的句子;将所述句子输入至事实性预测模型,得到事实性预测模型输出的所述句子中各个事件触发词的事实性取值;其中,所述事实性预测模型基于稀疏自注意力机制提取所述句子的语义图,并基于所述句子的语义图和句法图进行事实性预测;所述句法图是对所述句子进行句法分析得到的;所述事实性预测模型是基于样本句子以及所述样本句子中各个样本事件触发词的样本事实性取值训练得到的。本发明提供的方法、装置、电子设备与存储介质,能够极大地提高事件事实性预测的准确性,减轻句法分析工具带来的误差累积问题。

    基于屏蔽泛化机制的事件因果关系识别方法、系统、装置

    公开(公告)号:CN111881688B

    公开(公告)日:2021-09-14

    申请号:CN202010801363.0

    申请日:2020-08-11

    Abstract: 本发明属于自然语言处理技术领域,具体涉及一种基于屏蔽泛化机制的事件因果关系识别方法、系统、装置,旨在解决模型训练困难以及事件因果关系识别鲁棒性较差的问题。本发明方法包括:获取待识别事件因果关系的文本,作为输入文本;通过BERT模型提取输入文本与因果事件的实体信息对应的三元组集合融合后的特征,作为第一特征;通过BERT模型提取输入文本中未屏蔽信息的特征,作为第二特征;将第一特征、第二特征进行融合,将融合后的特征作为第三特征;基于第三特征,通过预构建的分类模型获取输入文本中事件因果关系的识别结果。本发明简化了模型训练的难度,并提高了事件因果关系识别的鲁棒性。

    基于知识巩固的增量事件识别方法、系统、装置

    公开(公告)号:CN112101484A

    公开(公告)日:2020-12-18

    申请号:CN202011244409.X

    申请日:2020-11-10

    Abstract: 本发明属于自然语言处理技术领域,具体涉及一种基于知识巩固的增量事件识别方法、系统、装置,旨在解决现有的事件识别方法在微调模型后识别新类别的事件时,容易出现灾难遗忘,导致识别精度较低的问题。本系统方法包括获取待识别事件的文本,作为输入文本;通过预训练的语言模型提取输入文本中各单词的上下文特征;基于所述上下文特征,通过多层感知器模型得到待识别事件的类别。本发明提高了事件识别的精度。

    基于图网络融入词典的中文命名实体识别方法

    公开(公告)号:CN111046671A

    公开(公告)日:2020-04-21

    申请号:CN201911275401.7

    申请日:2019-12-12

    Abstract: 本发明属于自然语言处理技术领域,具体涉及一种基于图网络融入词典的中文命名实体识别方法、系统、装置,旨在解决基于字的模型的中文命名实体识别方法没有利用词的信息,导致命名实体的识别精度较低的问题。本系统方法包括获取待识别语句的字向量表示,基于字向量表示,通过双向长短期记忆网络得到待识别语句的句子表示;基于待识别语句,获取其与预设的词典匹配的词的向量表示;将句子表示、词的向量表示进行拼接,通过图网络获取融合多种词典知识的句子表示;基于融合多种词典知识的句子表示,采用条件随机场算法和维特比解码算法获取命名实体的识别结果。本发明提高了中文命名实体的识别精度。

Patent Agency Ranking