基于遗忘学习的可解释图推荐系统后门防御方法及系统
摘要:
本发明公开了一种基于遗忘学习的可解释图推荐系统后门防御方法及系统,通过触发器还原算法还原潜在的图触发器,并通过遗忘学习遗忘后门触发器特征,从而将后门模型净化为正常模型。本发明首先利用一定比例的干净数据集,通过可解释的图后门还原算法,恢复后门模型中的后门触发器子图。随后,将后门触发器子图添加至正常样本,通过基于知识蒸馏的遗忘学习算法,遗忘后门触发器特征并保持模型在正常任务上的精度,以此来净化后门模型。本发明能够有效解决攻击者通过修改用户之间的关系,改变用户信息操作得到中毒子图,用户使用中毒数据训练的后门模型时,遭受如恶意广告侵扰等问题,有助于提升服务质量和用户体验。
0/0