基于文本模态对齐的跨模态行人重识别方法及装置

    公开(公告)号:CN118447530A

    公开(公告)日:2024-08-06

    申请号:CN202410300121.1

    申请日:2024-03-15

    Abstract: 本发明公开一种基于文本模态对齐的跨模态行人重识别方法及装置,属于人工智能技术领域。所述方法包括:训练一可学习向量来捕捉红外图像和可见光图像中与身份相关的模态共享信息;结合训练后的可学习向量获取每个行人ID的文本模态表示,并使用图像编码器提取红外图像和可见光图像中该行人ID的红外模态表示和可见光模态表示;基于所述文本模态表示、所述红外模态表示和所述可见光模态表示之间的彼此对齐来训练该图像编码器;基于训练后的图像编码器对目标红外图像或目标可见光图像中的行人进行编码,并通过对编码结果的分类,得到跨模态的行人重识别结果。本发明可以提升跨模态行人重识别模型的精度。

    一种基于稳定扩散模型的人脸隐私保护方法和系统

    公开(公告)号:CN118430078A

    公开(公告)日:2024-08-02

    申请号:CN202410376819.1

    申请日:2024-03-29

    Abstract: 本发明属于人脸隐私保护技术领域,涉及一种基于稳定扩散模型的人脸隐私保护方法和系统。该方法在目标图像嵌入阶段使用文本逆转方法训练能够保存目标图像语义信息的文本嵌入;在对抗样本生成阶段,利用目标图像嵌入阶段得到的文本嵌入对保护图像的去噪过程进行去噪引导,将目标图像的语义信息注入保护图像中,并通过DDIM反转得到原始图像和目标图像在稳定扩散模型隐空间的编码,以在保护图像的去噪过程中提供对抗引导;通过去噪引导和对抗引导生成保护图像,实现人脸隐私保护。本发明能够解决目前人脸隐私保护领域对抗样本不自然、与原图像视觉不一致、对抗扰动易被感知等问题,并能够提高在目标黑盒模型上的迁移性攻击能力。

    基于分化注意力和去噪过程引导的多目标图像生成方法

    公开(公告)号:CN119722833A

    公开(公告)日:2025-03-28

    申请号:CN202411591540.1

    申请日:2024-11-08

    Abstract: 本发明公开了一种基于分化注意力和去噪过程引导的多目标图像生成方法,其步骤包括:1)针对给定包括N个目标词的文本提示y以及一初始隐编码zT,利用稳定扩散模型生成文本提示y中每一目标词与zT之间的交叉注意力图CAT;2)通过设定损失函数优化初始隐编码zT;3)稳定扩散模型生成文本提示y中每一目标词与优化后的初始隐编码zT之间的最优交叉注意力图#imgabs0#4)稳定扩散模型对优化后的初始隐编码zT进行迭代去噪并对设定时间步生成的交叉注意力图进行插值;然后对迭代去噪结束所得隐编码z0进行解码生成该文本提示y对应的图像。本发明有效提高生成图像与给定文本提示之间的语义匹配性。

    一种基于解耦空间对齐的黑盒模型逆向重建方法

    公开(公告)号:CN118644728A

    公开(公告)日:2024-09-13

    申请号:CN202410809839.3

    申请日:2024-06-21

    Abstract: 本发明公开了一种基于预测向量映射的黑盒模型逆向重建方法,属于图像处理与机器学习领域。本发明在数据挑选阶段,通过从公共数据集中选择具有最高置信度的图像和对应预测向量,构成训练集;在训练阶段,训练一个从预测向量到StyleGAN潜在空间再到图像的逆向模型,并引入多种损失函数确保重建图像与真实图像的相似性;在攻击阶段,通过预测集成攻击方法,增强目标身份的特征,实现有效的图像重建。本发明解决了现有方法中计算成本高、效率低的问题,通过解耦潜在空间的对齐,提升了重建图像的质量和精度。本发明取得了高效攻击过程、语义连续的面部嵌入、增强的特征对齐和更高的重建性能等效果。

    一种基于表示蒸馏的深度哈希模型对抗训练方法和系统

    公开(公告)号:CN119378601A

    公开(公告)日:2025-01-28

    申请号:CN202411291948.7

    申请日:2024-09-14

    Abstract: 本发明属于人工智能技术领域,涉及一种基于表示蒸馏的深度哈希模型对抗训练方法和系统。该方法的步骤包括:1)利用干净样本训练与学生模型具有相同网络结构的深度哈希模型,作为教师模型;2)以最大化与教师模型输出的语义表示的距离为损失函数来迭代更新对抗样本;3)给定生成的对抗样本和原始干净样本,利用哈希码对齐损失函数和特征对齐损失函数实现从教师模型到学生模型的语义表示蒸馏,以指导学生模型的对抗训练过程;4)步骤2)和步骤3)交替进行,直到达到最大的迭代轮次。本发明能够充分保存教师模型从干净样本中学习到的判别性和可泛化性语义信息,从而解决现有方法无法充分学习这些语义信息而导致的模型鲁棒泛化性较差的问题。

    一种用于行人重识别的基于样本孤立机制的身份隐私保护方法和系统

    公开(公告)号:CN115641609A

    公开(公告)日:2023-01-24

    申请号:CN202211241919.0

    申请日:2022-10-11

    Abstract: 本发明涉及一种用于行人重识别的基于样本孤立机制的身份隐私保护方法和系统。该方法包括:给定干净图像,通过生成器学习扰动以生成相应的对抗图像;将对抗图像和干净图像输入目标模型中,分别获得对抗特征和干净特征;针对目标模型,利用对抗特征和干净特征,采用身份隔离损失、错误分类损失和错误排序损失对生成器进行训练,以生成最佳扰动;将生成的最佳扰动添加到目标人物的图像中,得到目标人物的对抗图像;通过对抗图像保护目标人物以防御恶意查询。本发明提出了一种身份隔离机制,将对抗性图像明确限制在一个孤立的位置,使得目标人物既远离原始身份,也远离任何其他身份,从而保护其不会被非法查询检索到。

Patent Agency Ranking