一种面向代码模型中分类任务的后门攻击方法及系统
摘要:
本发明公开了一种面向代码模型中分类任务的后门攻击方法及系统。后门攻击方法包括:S1、收集并预处理干净样本,得到重要性变量名;S2、在干净样本中,按照标签类别对变量名分类,得到多个触发集;同时从干净样本中选取目标标签;S3、将目标标签对应的触发集中的变量名进行C分数计算;在干净样本中,将C分数最大的变量名替换重要性变量名,预测替换后的标签,重复上述过程直至标签变化为目标标签,此时替换后的干净样本为中毒样本,将中毒样本中替换产生的变量名作为触发器;S4、将中毒样本中的触发器随机插入干净样本,形成负样本;采用基于负样本、中毒样本、干净样本得到的攻击模型进行攻击。本发明具有简单、隐蔽性强、误触率低的特点。
0/0