一种基于代码知识图谱的缺陷定位方法及系统
摘要:
本发明公开了一种基于代码知识图谱的缺陷定位方法及系统,从Git版本控制系统中提取源代码,对源代码进行解析生成抽象语法树,基于抽象语法树构建代码知识图谱,同时对Bugzilla缺陷跟踪系统中爬取的缺陷报告的摘要和描述预处理后,进行命名实体识别,以识别出和缺陷相关的实体序列,再将代码知识图谱与缺陷实体序列通过嵌入算法转换为向量化表示,计算两者之间的余弦相似度,按相似度得分降序,生成可疑方法列表,过滤了源代码中陈宇信息的同时,明确缺陷报告中和缺陷相关的实体元素,保留缺陷相关信息,提升缺陷定位的准确性,减少维护人员定位软件缺陷所耗费的时间和精力,提高软件维护的效率。
0/0