一种基于嵌入技术的函数级缺陷定位方法
摘要:
本发明公开了一种基于嵌入技术的函数级缺陷定位方法,该方法使用基于抽象语法树的代码嵌入技术表征函数代码功能语义,使用词嵌入技术表征缺陷报告问题语义。最后使用卷积神经网络对函数和缺陷报告的语义特征进行融合并预测与给定缺陷相关的可疑函数。为了解决训练数据有限的问题,本发明提出使用预训练模型对缺陷报告和代码进行特征表示;同时,针对类实例数不平衡的问题,提出使用随机过采样的方法对其进行处理。通过在三个主流Java项目上试验发现,在推荐列表为10时,本发明所提方法的准确率能达到12.5%‑40%,在细粒度缺陷定位领域展示了较大的潜力,在主流Java软件项目上具有较大的潜在应用价值。
公开/授权文献
0/0