基于样本差异的代码分类深度学习模型解释方法及系统
摘要:
本发明涉及一种基于样本差异的代码分类深度学习模型解释方法及系统,该方法包括:离线解释器模型训练步骤:对训练集中的每个代码样本,构造代码变换生成差异样本,通过删除特征生成差异样本并计算特征重要分数,通过片段截取生成差异样本并计算特征重要分数,将原始样本、差异样本与特征重要分数输入神经网络进行训练,得到训练好的解释器;在线代码样本解释步骤:对目标代码样本片段使用解释器提取代码样本中的重要特征,然后使用基于影响函数的方法查找训练集中对测试样本预测贡献最大的训练样本,比较得到的重要特征和对预测贡献最大的训练样本,最后生成目标样本的解释结果。该系统包括离线解释器模型训练模块和在线代码样本解释模块。
0/0