-
公开(公告)号:CN115687609A
公开(公告)日:2023-02-03
申请号:CN202211082703.4
申请日:2022-09-06
申请人: 北京交通大学
IPC分类号: G06F16/35 , G06F40/289 , G06F40/30 , G06F18/2415 , G06F18/25 , G06N3/045 , G06N3/08
摘要: 本发明提供了一种基于Prompt多模板融合的零样本关系抽取方法。该方法包括:将需要抽取关系的文本数据与预先定义的Prompt模板进行组合后,输入到预训练语言模型中,输出完形填空任务的结果,将这个结果的词嵌入输出转换成关系表示;将需要抽取关系的文本数据按照重复操作输入到不同类型的预训练语言模型中,得到多种关系表示,根据关系描述文本中的词性与不同Prompt模板之间的关系权重,对多种关系表示进行融合;将融合后的多种关系表示与关系描述文本生成的词嵌入进行欧式距离的比较,将距离转化为对应关系的概率,输出最大概率的所述需要抽取关系的文本数据的零样本关系类别。本发明方法优化了模型生成表示的能力,提高了零样本关系抽取任务的F1值。
-
公开(公告)号:CN116595189A
公开(公告)日:2023-08-15
申请号:CN202310534905.6
申请日:2023-05-12
申请人: 北京交通大学
IPC分类号: G06F16/36 , G06F16/35 , G06F40/205
摘要: 本发明提供一种基于两阶段的零样本关系三元组抽取方法及系统,属于人工智能与自然语言处理技术领域,将给定句子与Prompt模板结合起来,利用预训练的语言模型来预测句子中包含的关系的位置的嵌入表示,作为句子表示;将每个关系的文本描述输入到同一个预训练语言模型中,获得关系表示;将句子表示与每个关系表示进行比较,确定哪些关系是候选关系;利用提示驱动的生成模型来实现对比三元组提取,识别每个匹配关系的主体和客体。本发明利用提示驱动的零样本文本分类确定哪些是看不见的关系与给定句子相匹配;利用提示驱动的生成模型实现对比三元组提取,识别每个匹配关系的主客体;缓解了样本生成带来的误差传递,提高了零样本关系三元抽取任务的F1值。
-