一种基于代码修改模式差异的缺陷纠错方法

    公开(公告)号:CN109918127B

    公开(公告)日:2022-02-11

    申请号:CN201910170495.5

    申请日:2019-03-07

    申请人: 扬州大学

    发明人: 魏颖 孙小兵 李斌

    IPC分类号: G06F8/75

    摘要: 本发明提供了软件维护技术领域内的一种基于代码修改模式差异的缺陷纠错方法,包括以下步骤:先通过爬虫获取缺陷检索平台Bugzilla中状态为已解决的缺陷报告,按照缺陷报告ID的顺序将以不重复关系连接起来的缺陷报告形成一个簇;再利用TF‑IDF算法对各簇内缺陷的标题和描述进行关键词提取,并对其余缺陷报告进行关键词提取,并加入相应关键词的簇中;其次,对比每两个报告提交的源代码,得到代码克隆对,查找出每个缺陷报告中有源代码克隆部分的diff信息,分别对每份diff信息做修改模式差异图;最后,计算差异比例,判断缺陷的修改是否存在问题;本发明帮助开发人员更快速便捷地查找出已修改缺陷存在的问题。

    一种基于图的语句级程序修复方法及系统

    公开(公告)号:CN113741886A

    公开(公告)日:2021-12-03

    申请号:CN202110879818.5

    申请日:2021-08-02

    申请人: 扬州大学

    摘要: 本发明公开了一种基于图的语句级程序修复方法及系统,属于软件调试领域。本发明首先提取缺陷代码及补丁、规范代码以构建训练及预训练的数据集;对数据集预处理并预训练编程语言模型;利用编程语言模型进行数据嵌入,构建并训练基于Graph‑to‑Sequence架构的翻译模型;使用训练完成的翻译模型生成缺陷语句的补丁。本发明使用融合源代码多种特征的代码图表征代码,结合了预训练模型学习代码规范并加快翻译模型训练收敛速度,可以优化缺陷语句的上下文表示,使翻译模型能够更好地学习缺陷语句与正确语句之间的语法语义关联信息,从而更好地表征缺陷修复的语义,生成遵循编程语言规范的高质量修复补丁以自动化地修复缺陷程序,能够极大降低缺陷修复的成本。

    一种基于谱重建的监督多集相关特征融合方法

    公开(公告)号:CN112966735A

    公开(公告)日:2021-06-15

    申请号:CN202110235178.4

    申请日:2021-03-03

    申请人: 扬州大学

    摘要: 本发明公开了一种基于谱重建的监督多集相关特征融合方法,包括1)定义训练样本集的投影方向;2)计算训练样本的组间类内相关矩阵和自协方差矩阵;3)组间类内相关矩阵做奇异值分解,自协方差矩阵做特征值分解;4)重构分数阶组间类内相关矩阵和分数阶自协方差矩阵;5)构建FDMCCA的最优化模型;6)求解特征向量矩阵,形成投影矩阵;7)融合降维后的特征;8)选取不同数量的图像分别做训练集和测试集,计算识别率。本发明能够有效地处理多个视图数据的信息融合问题,同时分数阶参数的引入削弱了因噪声干扰和有限训练样本带来的影响,提高了系统识别的准确率。

    基于多标签学习的UI元素的Web代码生成方法

    公开(公告)号:CN112379878A

    公开(公告)日:2021-02-19

    申请号:CN202011131833.3

    申请日:2020-10-21

    申请人: 扬州大学

    IPC分类号: G06F8/38 G06F8/33 G06F16/958

    摘要: 本发明公开了一种基于多标签学习的UI元素的Web代码生成方法,包括:获取UI元素图片及其代码的数据集;对每一个UI元素图片进行预处理,获得处理后的图片;对预处理后的图片进行特征提取,获得特征向量v;基于向量v,训练一个HTML标签分类器、HTML属性的分类器,n'个对应离散CSS属性值的分类器和m'个连续CSS属性值回归器,之后利用各分类器、回归器预测新的UI元素图片,对预测后的结果进行代码组装,获得该图片对应的代码。本发明方法能够获得UI元素图片到Web代码的生成模型M,对M输入待处理的UI元素图片,便能生成相应的Web代码,普适性和通用性更强,可以取代实际开发中的部分环节,使实际使用成本更低、应用领域更广。

    基于LSTM的漏洞自动分类方法、系统和计算机设备

    公开(公告)号:CN112115476A

    公开(公告)日:2020-12-22

    申请号:CN202010785734.0

    申请日:2020-08-06

    申请人: 扬州大学

    摘要: 本发明公开了一种基于LSTM的漏洞自动分类方法、系统和计算机设备,方法包括以下过程:训练长短期记忆网络LSTM;利用训练好的LSTM网络处理待分类的漏洞代码;基于NVD树图构建映射矩阵;根据所述映射矩阵以及待分类的漏洞代码对应的LSTM网络的输出,进行矩阵运算,获得待分类漏洞代码的类别。本发明将漏洞矩阵运用到漏洞分类技术中,利用了漏洞矩阵的结构特性,方便化了分类工作。以CWE·NVD为分类标准,在NVD类路径基础上进行漏洞的自动分类,解决了漏洞代码的模糊匹配问题,实现了标准缺陷漏洞库的矩阵化使用以及LSTM特性的极大化利用,同时实现了缺陷预测的自动化,具有较强的方便性,一定程度上为信息安全领域提供了帮助。

    面向第三方库依赖的知识图谱构建方法及系统

    公开(公告)号:CN111881300A

    公开(公告)日:2020-11-03

    申请号:CN202010629991.5

    申请日:2020-07-03

    申请人: 扬州大学

    摘要: 本发明公开了一种面向第三方库依赖的知识图谱构建方法及系统,方法包括以下步骤:采集若干应用程序项目,从中提取所依赖的第三方库;爬取所述第三方库的漏洞报告;从所述漏洞报告中提取实体;从所述漏洞报告中抽取关系;对所述实体进行对齐,之后结合所述关系构建完整的知识图谱。本发明的方法提供了一种能够帮助开发者对第三方库依赖进行全方位漏洞及功能分析的数据语义网络,使用构建知识图谱的方法全方位存储第三方库漏洞、功能等信息,为进一步的对第三方库的功能、风险分析提供结构化数据,使开发人员能快速、准确、高效的掌握第三方库信息,提高开发的效率与质量。

    基于分数阶多集偏最小二乘的人脸图像超分辨率识别方法

    公开(公告)号:CN111611962A

    公开(公告)日:2020-09-01

    申请号:CN202010473054.5

    申请日:2020-05-29

    申请人: 扬州大学

    IPC分类号: G06K9/00 G06K9/62

    摘要: 本发明公开了基于分数阶多集偏最小二乘的人脸图像超分辨率识别方法,步骤1在训练阶段利用训练集学习不同分辨率视图之间的相关关系,使用PCA对图像降维,利用分数阶思想重新估计组内及组间协方差矩阵,并计算FMPLS投影矩阵,将主成分特征投影到FMPLS的一致相干子空间;步骤2在测试阶段,提取输入的多种低分辨率图像的主成分特征,并投影到相应的FMPLS子空间,通过邻域重建策略重建出输入的低分辨率图像的高分辨率特征;步骤3最后利用最近邻分类器进行人脸识别。本发明利用分数阶多集偏最小二乘,可以同时学习不同分辨率人脸视图之间的多种特定分辨率的映射,同时借助分数阶思想,重新估计协方差矩阵,以减少由样本数量不足、噪声等因素带来的影响。

    相似缺陷报告推荐方法、系统、计算机设备和存储介质

    公开(公告)号:CN111309865A

    公开(公告)日:2020-06-19

    申请号:CN202010087760.6

    申请日:2020-02-12

    申请人: 扬州大学

    发明人: 李斌 余笙 孙小兵

    摘要: 本发明公开了一种相似缺陷报告推荐方法、系统、计算机设备和存储介质,方法包括:对新缺陷报告进行预处理,构建该缺陷报告的第一实体集合S1;计算集合S1中每个实体的TF-IDF值,并按照TF-IDF值对实体进行降序排列,构建第二实体集合S2;针对集合S2中的每个实体S,结合缺陷知识图谱,查询与新缺陷报告通过实体S相关联的缺陷报告,构建第一缺陷报告集合Buglist1;针对集合Buglist1中的每个关联缺陷报告b,求取其与新缺陷报告的余弦相似度,构建第二缺陷报告集合Buglist2;求取集合Buglist1与Buglist2对应位置元素的相似度值,构建第三缺陷报告集合Buglist3;结合集合Buglist3和缺陷知识图谱,返回新缺陷报告的相似缺陷报告列表。本发明能显著提高相似缺陷报告推荐的准确度。

    基于生成对抗和卷积神经网络的UI生成Web代码的方法

    公开(公告)号:CN110377282A

    公开(公告)日:2019-10-25

    申请号:CN201910562411.2

    申请日:2019-06-26

    申请人: 扬州大学

    发明人: 孙小兵 徐勇 李斌

    摘要: 本发明公开了一种基于生成对抗和卷积神经网络的UI生成Web代码的方法,包括:构建HTML元素显示效果与其源代码的映射关系;识别图片I中HTML元素的位置;生成I完整的HTML代码;求取人工编写的HTML代码与生成的HTML代码的相似度Sim1;求取图片I与经生成的HTML代码生成的图片I1的相似度Sim2;将Sim1和Sim2平衡为Sim0,判别Sim0与阈值t的关系,若Sim0小于t,重复上述过程,反之,执行下一步;经过上一步训练,获得图片到HTML代码的生成模型M,将待处理的UI图片输入模型M即得到相应的HTML代码。本发明方法能够获得图片到HTML代码的生成模型M,对M输入待处理的UI图片,便能生成相应的HTML代码,普适性和通用性更强,可以取代实际开发中的部分环节,使实际使用成本更低、应用领域更广。