-
公开(公告)号:CN114219017B
公开(公告)日:2025-04-22
申请号:CN202111459333.7
申请日:2021-12-02
Applicant: 中国科学院信息工程研究所
IPC: G06F18/214 , G06F16/36 , G06F18/24 , G06N5/022 , G06N3/096
Abstract: 本发明公开了一种隐式语义数据增强方法。本发明第一阶段利用原始数据训练特征提取器和分类器,然后利用分类器构建知识图谱,并基于提取的特征计算每个类别的类中心和协方差矩阵;第二阶段利用构建的知识图谱识别出尾部类别的相似类别,然后将相似类别的特征变换方向迁移到每个尾部样本上进行特征变化。通过挖掘类别之间的相关关系,极大地丰富了尾部类别多样性。最后,对每个样本沿着迁移的协方差矩阵进行变化方向的无限次高斯分布采样可以获得无穷样本,通过优化无限样本损失函数的上界,得到一个新的基于推理的隐式语义数据增强损失进行模型训练。
-
公开(公告)号:CN119378601A
公开(公告)日:2025-01-28
申请号:CN202411291948.7
申请日:2024-09-14
Applicant: 中国科学院信息工程研究所
Abstract: 本发明属于人工智能技术领域,涉及一种基于表示蒸馏的深度哈希模型对抗训练方法和系统。该方法的步骤包括:1)利用干净样本训练与学生模型具有相同网络结构的深度哈希模型,作为教师模型;2)以最大化与教师模型输出的语义表示的距离为损失函数来迭代更新对抗样本;3)给定生成的对抗样本和原始干净样本,利用哈希码对齐损失函数和特征对齐损失函数实现从教师模型到学生模型的语义表示蒸馏,以指导学生模型的对抗训练过程;4)步骤2)和步骤3)交替进行,直到达到最大的迭代轮次。本发明能够充分保存教师模型从干净样本中学习到的判别性和可泛化性语义信息,从而解决现有方法无法充分学习这些语义信息而导致的模型鲁棒泛化性较差的问题。
-
公开(公告)号:CN119179797A
公开(公告)日:2024-12-24
申请号:CN202411192024.1
申请日:2024-08-28
Applicant: 中国科学院信息工程研究所
IPC: G06F16/583 , G06V10/44 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/0985
Abstract: 本发明公开一种基于特征细化与特征矫正的持续视觉检索方法及系统,属于视觉检索技术领域。所述方法包括:构建视觉检索模型,所述视觉检索模型包括:骨干网络、特征细化模块、特征矫正模块、嵌入层和分类器,所述特征细化模块用于揭示所述骨干网络输出的特征图谱M中的重要区域,所述特征矫正模块用于训练所述视觉检索模型时抑制新类别中与旧类别重叠的语义;构建第t个阶段的训练数据集,并在第t个阶段的训练数据集上训练视觉检索模型ft,得到视觉检索模型ft+1;基于训练后的视觉检索模型ft+1获取目标图像的视觉检索结果。本发明可以解决持续视觉检索任务中遗忘问题,提升视觉检索模型在面对动态变化的数据环境时的可持续扩展能力。
-
公开(公告)号:CN118350480A
公开(公告)日:2024-07-16
申请号:CN202410394143.9
申请日:2024-04-02
Applicant: 中国科学院信息工程研究所
IPC: G06N20/00 , G06F18/213 , G06F18/214 , G06F18/24 , G06F21/62
Abstract: 本发明公开一种基于元知识进行数据增强的联邦学习方法及系统,属于联邦学习技术领域。所述方法包括第一阶段执行传统的联邦学习训练以及第二阶段的利用特征协方差矩阵来捕获类语义特征变换并据此进行数据增强的联邦学习训练。本发明可以减小联邦学习中不同客户端之间的特征差异,得到性能更优的模型。
-
公开(公告)号:CN117852523A
公开(公告)日:2024-04-09
申请号:CN202311564750.7
申请日:2023-11-22
Applicant: 中国科学院信息工程研究所
IPC: G06F40/205 , G06F40/279 , G06F40/30 , G06N3/045 , G06N3/0895 , G06N3/09 , G06N3/0464 , G06F18/213 , G06F18/10 , G06N3/082
Abstract: 本发明涉及一种学习鉴别性语义和多视角上下文的跨域小样本关系抽取方法和装置。该方法包括:进行数据预处理,将语义提示模板拼接在数据集中每个句子的尾部;构建特征提取网络、语义对比学习网络、多视角上下文学习网络和关系分类网络,多视角上下文学习网络中包含信息过滤机制;通过语义对比学习损失和关系分类损失训练模型,并利用验证集获得最优模型;利用最优模型抽取目标域的句子中的关系。本发明利用语义对比学习提高模型识别具有相似实体语义的不同关系的能力,通过多视角的上下文学习模块提高模型利用上下文信息区分不同关系的能力,并通过权重自适应的信息过滤机制避免学习上下文的过程中过度关注实体从而获得更全面的上下文知识。
-
公开(公告)号:CN113627479B
公开(公告)日:2024-02-20
申请号:CN202110775393.3
申请日:2021-07-09
Applicant: 中国科学院信息工程研究所
IPC: G06V10/774 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0895
Abstract: 本发明公开了一种基于半监督学习的图数据异常检测方法。本方法为:1)数据分批采样模块将图数据样本进行分批,然后对于每一批图数据样本,以每一图数据样本中的每个边为目标边,依据设定采样跳数h以及每跳所要选取的边数Si对该目标边的邻居进行采样,得到该目标边的h阶邻域信息;2)利用边卷积神经网络依次对每一阶邻域信息加权求和,实现对目标边的邻域信息融合;重构该目标边并计算重构误差;若该目标边的重构误差超过设定阈值,则判定该目标边为异常;3)基于重构误差设计异常检测模型的损失函数,并利用步骤2)处理后的结果对图数据样本的边进行标注后训练异常检测模型;4)利用训练后的异常检测模型对待检测的图数据进行检测。
-
公开(公告)号:CN117540770A
公开(公告)日:2024-02-09
申请号:CN202311546499.1
申请日:2023-11-20
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种用来提升低度顶点上链路预测性能的损失函数赋权方法和系统。该方法包括:定量分析顶点级正负样本数量上的差异;以平衡顶点级正负样本数量上的差异和保持整体上正负样本数量的均衡为目标进行加权操作,并对权重进行平滑操作以降低加权操作对高度顶点的影响,得到加权方法;采用所述加权方法对损失函数中每一个负样本项进行加权,得到链路预测损失函数;将所述链路预测损失函数应用于链路预测任务,通过训练图神经网络实现链路预测。本发明以一种普遍存在于基于图神经网络的链路预测模型上的性能问题为出发点,提出了一种非参数且一般化的损失函数赋权方案,能够明显的提升低度顶点上的链路预测性能。
-
公开(公告)号:CN117375807A
公开(公告)日:2024-01-09
申请号:CN202311146348.7
申请日:2023-09-06
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于属性加密的多用户可搜索对称加密方法,其步骤包括:1)为数据所有者生成系统密钥和属性加密密钥对;设置用户的权限及与权限相匹配的用户属性;数据所有者配置每一加密列的访问控制策略,并生成密钥K1、K2,用主私钥加密K1得到EKey,将Ekey和K2上传到云服务提供商;2)数据所有者加密具有敏感信息的各列数据并生成密态索引,将索引和密文上传至提供商;3)数据所有者审核用户申请并授权;4)用户将查询条件转换为查询令牌进行查询,解密云服务提供商返回的检索结果,得到文档标识符;5)云服务提供商根据文档标识符找到对应文档数据及密钥发送至用户,用户属性解密得到解密密钥,恢复文档明文数据。
-
公开(公告)号:CN117315712A
公开(公告)日:2023-12-29
申请号:CN202310824455.4
申请日:2023-07-06
Applicant: 中国科学院信息工程研究所
Abstract: 本发明提出了一种基于跨相机原型学习的行人重识别方法及装置,所述方法包括:利用有标注的相机内监督信息,学习每个相机下行人的行人原型,以进行行人重识别模型的相机内训练;匹配跨相机之间相同的行人原型,并基于匹配到的行人原型,拉近不同相机之间相同的行人原型并推远不同的行人原型,以进行行人重识别模型的跨相机间训练;基于完成相机内训练和跨相机间训练的行人重识别模型进行行人重识别的预测。本发明可以消除相机背景、光线、角度等影响因素对行人重识别模型带来的影响。
-
公开(公告)号:CN115641609A
公开(公告)日:2023-01-24
申请号:CN202211241919.0
申请日:2022-10-11
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种用于行人重识别的基于样本孤立机制的身份隐私保护方法和系统。该方法包括:给定干净图像,通过生成器学习扰动以生成相应的对抗图像;将对抗图像和干净图像输入目标模型中,分别获得对抗特征和干净特征;针对目标模型,利用对抗特征和干净特征,采用身份隔离损失、错误分类损失和错误排序损失对生成器进行训练,以生成最佳扰动;将生成的最佳扰动添加到目标人物的图像中,得到目标人物的对抗图像;通过对抗图像保护目标人物以防御恶意查询。本发明提出了一种身份隔离机制,将对抗性图像明确限制在一个孤立的位置,使得目标人物既远离原始身份,也远离任何其他身份,从而保护其不会被非法查询检索到。
-
-
-
-
-
-
-
-
-