一种软件源代码缺陷自动定位方法及系统
摘要:
本发明提出一种软件源代码缺陷自动定位方法及系统,属于代码缺陷定位技术领域。在训练阶段,数据集构建模块通过构建基于MRC的缺陷定位数据集,包含编号、上下文、问题、答案,而后经过数据增强策略进行增强数据集的构建。缺陷定位模型接受缺陷定位数据集输入,首先通过预编码模块对数据集中样本进行嵌入编码,而后通过缺陷定位模块定位缺陷位置,进行模型的训练。在测试阶段,通过缺陷定位数据集构建模块获得适用于缺陷定位任务的数据集,而后通过训练好的缺陷定位模型得到缺陷定位结果。本发明具备高效的自动化能力和高定位准确度,可以帮助安全研究人员更加准确地定位和分析潜在的安全问题,从而更好地评估软件的安全性。
0/0