-
公开(公告)号:CN117852523A
公开(公告)日:2024-04-09
申请号:CN202311564750.7
申请日:2023-11-22
Applicant: 中国科学院信息工程研究所
IPC: G06F40/205 , G06F40/279 , G06F40/30 , G06N3/045 , G06N3/0895 , G06N3/09 , G06N3/0464 , G06F18/213 , G06F18/10 , G06N3/082
Abstract: 本发明涉及一种学习鉴别性语义和多视角上下文的跨域小样本关系抽取方法和装置。该方法包括:进行数据预处理,将语义提示模板拼接在数据集中每个句子的尾部;构建特征提取网络、语义对比学习网络、多视角上下文学习网络和关系分类网络,多视角上下文学习网络中包含信息过滤机制;通过语义对比学习损失和关系分类损失训练模型,并利用验证集获得最优模型;利用最优模型抽取目标域的句子中的关系。本发明利用语义对比学习提高模型识别具有相似实体语义的不同关系的能力,通过多视角的上下文学习模块提高模型利用上下文信息区分不同关系的能力,并通过权重自适应的信息过滤机制避免学习上下文的过程中过度关注实体从而获得更全面的上下文知识。
-
公开(公告)号:CN118674036A
公开(公告)日:2024-09-20
申请号:CN202410728857.9
申请日:2024-06-06
Applicant: 中国科学院信息工程研究所
IPC: G06N5/025 , G06F40/16 , G06N3/042 , G06N3/045 , G06N3/0464 , G06N3/082 , G06N3/0895
Abstract: 本发明涉及一种学习细粒度通用知识的跨域小样本关系抽取方法和装置。该方法包括:进行数据预处理,包括将语义提示模板拼接在数据集中每个句子的尾部;构建跨域小样本关系抽取模型,包含特征提取网络、双通道通用知识学习网络、关系对比学习网络和关系分类网络,双通道通用知识学习网络包含隐式通用知识学习网络和显式通用知识学习网络;利用训练集,通过隐式通用知识学习网络的损失函数、关系对比学习损失函数和关系分类损失函数训练跨域小样本关系抽取模型,并利用验证集获得最优模型;利用最优模型抽取目标域的句子中的关系。本发明能够精准地捕捉和利用跨领域的通用知识,减少对源域独有知识的依赖,提高在目标域中的关系抽取性能。
-
公开(公告)号:CN118349820A
公开(公告)日:2024-07-16
申请号:CN202410529092.6
申请日:2024-04-29
Applicant: 中国科学院信息工程研究所
IPC: G06F18/211 , G06F18/214 , G06F18/2431 , G06F18/22 , G06N3/0455 , G06N3/084 , G06N3/094 , G06F40/30 , G06F16/35 , G06N3/048
Abstract: 本发明涉及一种基于协同自适应特征变换的跨域小样本关系抽取方法和系统。该方法包括:对支持集、查询集中的样本进行编码,得到样本的初步特征;将编码得到的样本的初步特征输入域感知变换模块,所述域感知变换模块利用目标域数据的分布特征对源域数据进行特征变换,得到领域感知特征;利用领域感知特征,通过协同自适应原型网络计算出支持集中各个类别的关系原型特征;计算查询样本与各个类别的关系原型特征之间的距离,选择距离最近的关系原型特征所属的类别作为查询样本的关系类别。本发明能够提高模型在不同领域间的泛化能力,能够显著提升模型对于目标域特征的理解和适应性,从而能够在目标域中获得更好的性能。
-
公开(公告)号:CN118245796A
公开(公告)日:2024-06-25
申请号:CN202410279277.6
申请日:2024-03-12
Applicant: 中国科学院信息工程研究所
IPC: G06F18/214 , G06F18/24 , G06N20/00 , G06F11/34
Abstract: 本发明公开一种面向API异常检测的数据集生成方法及系统,属于API异常检测技术领域。所述方法包括:构建包含正常样本和异常样本的专家数据集,并初始化一合成数据集;在专家数据集和合成数据集中进行样本采样,并基于生成的示例数据集引导大模型学习示例的格式特征后,得到伪造数据样本;生成伪造数据样本的第一质量分数;生成伪造数据样本的第二质量分数;根据第一质量分数和第二质量分数对伪造数据样本进行筛选,并将筛选结果放入到合成数据集中;循环上述步骤,直至得到最终数据集。本发明可以利用已有的小规模API请求专家数据集和大语言模型生成大量高质量的API异常检测数据集。
-
-
-