一种学习细粒度通用知识的跨域小样本关系抽取方法和装置

    公开(公告)号:CN118674036A

    公开(公告)日:2024-09-20

    申请号:CN202410728857.9

    申请日:2024-06-06

    Abstract: 本发明涉及一种学习细粒度通用知识的跨域小样本关系抽取方法和装置。该方法包括:进行数据预处理,包括将语义提示模板拼接在数据集中每个句子的尾部;构建跨域小样本关系抽取模型,包含特征提取网络、双通道通用知识学习网络、关系对比学习网络和关系分类网络,双通道通用知识学习网络包含隐式通用知识学习网络和显式通用知识学习网络;利用训练集,通过隐式通用知识学习网络的损失函数、关系对比学习损失函数和关系分类损失函数训练跨域小样本关系抽取模型,并利用验证集获得最优模型;利用最优模型抽取目标域的句子中的关系。本发明能够精准地捕捉和利用跨领域的通用知识,减少对源域独有知识的依赖,提高在目标域中的关系抽取性能。

    面向API异常检测的数据集生成方法及系统

    公开(公告)号:CN118245796A

    公开(公告)日:2024-06-25

    申请号:CN202410279277.6

    申请日:2024-03-12

    Abstract: 本发明公开一种面向API异常检测的数据集生成方法及系统,属于API异常检测技术领域。所述方法包括:构建包含正常样本和异常样本的专家数据集,并初始化一合成数据集;在专家数据集和合成数据集中进行样本采样,并基于生成的示例数据集引导大模型学习示例的格式特征后,得到伪造数据样本;生成伪造数据样本的第一质量分数;生成伪造数据样本的第二质量分数;根据第一质量分数和第二质量分数对伪造数据样本进行筛选,并将筛选结果放入到合成数据集中;循环上述步骤,直至得到最终数据集。本发明可以利用已有的小规模API请求专家数据集和大语言模型生成大量高质量的API异常检测数据集。

Patent Agency Ranking