针对文本分类器的自然对抗样本生成方法及相关装置
摘要:
本公开提供一种针对文本分类器的自然对抗样本生成方法及相关装置,将文本样本所对应的离散向量映射到连续空间中,并利用梯度在连续空间中寻找通用扰动,并通过控制噪声的更新阈值来进一步平衡攻击率和自然性之间的关系。通过这种通用扰动生成对抗样本,能够保证样本集中任意样本添加通用扰动后,均具有良好的自然语言特性,并保持了与原始样本高度的相似性,由此高效和准确的实现了针对文本分类器的自然对抗样本的生成。
0/0