一种面向人工智能安全的物理灯光后门攻击的训练方法

    公开(公告)号:CN116664978A

    公开(公告)日:2023-08-29

    申请号:CN202310652261.0

    申请日:2023-06-02

    摘要: 本发明属于人工智能安全领域,并公开了一种面向人工智能安全的物理灯光后门攻击的训练方法,包括:对目标对象进行灯光后门攻击,根据灯光颜色在目标对象上产生对应的灯光触发器,基于灯光触发器生成后门图像数据;获取干净图像数据,基于后门图像数据和所述干净图像数据分别构建训练集;干净图像数据为未产生灯光触发器的原始图像;构建后门模型,所述后门模型为深度学习模型,基于所述训练集对所述后门模型进行训练,得到训练后的后门模型;构建测试集,基于所述测试集对所述训练后的后门模型进行评估,得到灯光后门攻击的攻击成功率数据和干净准确率数据。本发明所述技术方案拥有较高攻击成功率的同时实现了更加隐蔽的物理后门攻击。