一种基于对抗补丁的Grad-CAM攻击方法
摘要:
本发明提供一种基于对抗补丁的Grad‑CAM攻击方法。该方法包括:步骤1:初始化扰动z,并根据设定的二值化掩码m在输入图像x上生成对抗补丁,得到含有对抗补丁的对抗图像x′;步骤2:采用Grad‑CAM方法生成所述对抗图像x′的显著图;步骤3:计算损失函数;其中,所述损失函数的优化目标包括:使得所述对抗图像x′的类别和所述输入图像x的原始类别相一致;引导所述对抗图像x′的显著图偏向对抗补丁所在区域;步骤4:利用计算得到的损失函数更新扰动z以生成新的对抗图像x′;步骤5:重复步骤2至步骤4,直至达到设定的迭代次数,将此时的对抗图像x′作为最终的对抗图像。
公开/授权文献
0/0