-
公开(公告)号:CN112465009B
公开(公告)日:2023-10-31
申请号:CN202011340593.8
申请日:2020-11-25
申请人: 重庆大学
IPC分类号: G06F18/2431 , G06F18/214 , G06F11/36
摘要: 本发明公开了一种软件崩溃故障位置定位方法,该方法基于谱聚类的算法将崩溃实例的原始特征集划分为若干个簇,基于最大信息系数方法计算每个簇中的特征和标签之间的相关性,然后每个簇只保留最大信息系数值最大的特征作为最终的特征子集的成员,最后基于简化的深度森林构建分类模型,对新的软件崩溃实例的位置进行预测,给出实例位置在堆栈迹中的概率值,从而识别出崩溃故障的位置。利用新颖的混合特征选择方法和简化的深度森林构建分类模型来识别崩溃故障的位置,可以运用至实际的软件测试场景,提高崩溃故障位置识别的效果,为提高软件的质量和加速测试效率做出贡献。
-
公开(公告)号:CN111274494B
公开(公告)日:2022-09-23
申请号:CN202010062726.3
申请日:2020-01-20
申请人: 重庆大学
IPC分类号: G06F16/9536 , G06F16/9538 , G06F16/955 , G06F40/284 , G06N3/04 , G06N3/08
摘要: 本发明涉及结合深度学习和协同过滤技术的复合标签推荐方法,包括如下步骤:从目标软件信息站点收集历史软件项目,进行预处理得到规范化描述的矩阵;建立TagDC‑DL模型和TagDC‑CF模型,将所有规范化描述的矩阵作为输入,分别得到所有标签的多标签可信度列表和基于相似度的置信概率列表,利用线性加权模块得到每个标签的最终置信概率列表;给定新的软件项目,先进行预处理再输入上述两个模型,计算新的软件项目中每个标签的最终置信概率列表,通过得到的最终置信概率列表中的概率值进行排序,概率值最大的N个标签则为推荐标签。该方法利用软件项目之间的语义相似性及其自身的深层语义特征可获得更准确的标签推荐。
-
公开(公告)号:CN111488137A
公开(公告)日:2020-08-04
申请号:CN202010267172.0
申请日:2020-04-07
申请人: 重庆大学
IPC分类号: G06F8/20 , G06F16/903 , G06N3/04 , G06N3/08
摘要: 本发明涉及一种基于共同注意力表征学习的代码搜索方法,包括取每个代码特征和该代码所对应的描述;分别采用三个独立的CNN神经网络嵌入方法名、词语和描述,用LSTM网络嵌入API序列得到相应的特征矩阵;然后将方法名,API序列和词语对应的特征矩阵合并为一个矩阵作为每个代码的特征矩阵;引入经神经网络学习的参数矩阵,得到用于代码和其描述的共同注意力表征;将大量相互匹配的代码和描述作为模型输入,同步更新网络参数,得到优化的模型;代码搜索预测,将相关度排在前k个的向量c所对应的代码作为推荐列表输出。该方法在MRR方面表现优异,而且本发明模型结构简单,在模型训练上的运行速度和相应速度上都很快。
-
公开(公告)号:CN111274494A
公开(公告)日:2020-06-12
申请号:CN202010062726.3
申请日:2020-01-20
申请人: 重庆大学
IPC分类号: G06F16/9536 , G06F16/9538 , G06F16/955 , G06F40/284 , G06N3/04 , G06N3/08
摘要: 本发明涉及结合深度学习和协同过滤技术的复合标签推荐方法,包括如下步骤:从目标软件信息站点收集历史软件项目,进行预处理得到规范化描述的矩阵;建立TagDC-DL模型和TagDC-CF模型,将所有规范化描述的矩阵作为输入,分别得到所有标签的多标签可信度列表和基于相似度的置信概率列表,利用线性加权模块得到每个标签的最终置信概率列表;给定新的软件项目,先进行预处理再输入上述两个模型,计算新的软件项目中每个标签的最终置信概率列表,通过得到的最终置信概率列表中的概率值进行排序,概率值最大的N个标签则为推荐标签。该方法利用软件项目之间的语义相似性及其自身的深层语义特征可获得更准确的标签推荐。
-
公开(公告)号:CN112346974B
公开(公告)日:2023-08-22
申请号:CN202011234649.1
申请日:2020-11-07
申请人: 重庆大学
IPC分类号: G06F11/36 , G06F18/214 , G06N3/0464
摘要: 本发明涉及基于深度特征嵌入的跨移动应用程序即时缺陷预测方法,包括如下步骤:S101构建源移动应用程序和目标移动应用程序的即时缺陷数据集;S102对两个移动应用程序的数据进行预处理;S103利用跨三元组的深度特征嵌入方法学习高层次的特征表示;S104使用逻辑回归分类器构建预测模型;S105预测目标移动应用程序中的代码提交实例是否会引入缺陷。本发明方法从特征学习的角度出发,利用一个基于三元组损失的深度特征嵌入方法将两个移动应用程序的缺陷数据映射到一个高层次的空间,在这个空间中具有相同标签的实例尽可能靠近,而标签不同的实例尽可能远离,从而提高目标移动应用程序的即时缺陷预测效果。
-
公开(公告)号:CN112800172B
公开(公告)日:2022-07-12
申请号:CN202110167463.7
申请日:2021-02-07
申请人: 重庆大学
摘要: 本发明公开了一种基于两阶段注意力机制的代码搜索方法,具体包括如下步骤:选取一代码片段,从代码片段中所包含的函数名和函数体中提取文本特征及结构特征;根据所提取的文本特征和结构特征构建这两种特征的特征矩阵;融合文本特征矩阵和结构特征矩阵得到本代码片段的代码特征矩阵;从查询的语句中提取相关特征构建查询特征矩阵;利用代码特征矩阵和查询特征矩阵建立代码与查询的相关矩阵;通过计算相关矩阵得到所需的向量参数,最后根据向量参数与特征矩阵得出与查询语句最匹配的代码片段。
-
公开(公告)号:CN112685327A
公开(公告)日:2021-04-20
申请号:CN202110115994.1
申请日:2021-01-28
申请人: 重庆大学
摘要: 本发明涉及一种模型域的失败测试用例生成方法,该方法首先定义了一个最小可疑集合,从所有失败测试用例中抽取共同的特征,之后对于模型域中每一个失败的测试用例在保留失败测试用例的共同特征的基础上对非共同特征的信息进行变异,从而产生新的模型域的失败测试用例。最后,将新增的模型域的失败测试用例融入原有测试用例集中并进行缺陷的定位。本发明方法使用变异的最近邻算法来生成模型域的失败测试用例向量,从而达到提升缺陷定位效果的目的,和传统的从输入域生成测试用例的方法不同,本发明方法要更加简单有效,它不用通过程序执行来获取一个失败的标签。
-
公开(公告)号:CN112346974A
公开(公告)日:2021-02-09
申请号:CN202011234649.1
申请日:2020-11-07
申请人: 重庆大学
摘要: 本发明涉及基于深度特征嵌入的跨移动应用程序即时缺陷预测方法,包括如下步骤:S101构建源移动应用程序和目标移动应用程序的即时缺陷数据集;S102对两个移动应用程序的数据进行预处理;S103利用跨三元组的深度特征嵌入方法学习高层次的特征表示;S104使用逻辑回归分类器构建预测模型;S105预测目标移动应用程序中的代码提交实例是否会引入缺陷。本发明方法从特征学习的角度出发,利用一个基于三元组损失的深度特征嵌入方法将两个移动应用程序的缺陷数据映射到一个高层次的空间,在这个空间中具有相同标签的实例尽可能靠近,而标签不同的实例尽可能远离,从而提高目标移动应用程序的即时缺陷预测效果。
-
公开(公告)号:CN111949480A
公开(公告)日:2020-11-17
申请号:CN202010795863.8
申请日:2020-08-10
申请人: 重庆大学
摘要: 本发明涉及基于组件感知的日志异常检测方法,该方法将目标软件的日志消息转换为日志模板序列和组件序列,然后进行模型训练,将两个LSTM模型组合使用,两个LSTM模型训练使用相同的损失函数,采用梯度下降优化算法更行参数值,训练完成得到由日志检测模型和组件检测模型构成的组合模型;将t-h到t-1时刻的所有日志数据的参考日志模板序列和参考组件序列输入组合模型得到可能日志模板集和可能组件模板集;当t时刻日志消息mt的待测日志模板序列在可能日志模板集中,且t时刻日志消息mt的待测组件序列在可能组件模板集Cg中,则认为日志消息mt为正常日志,否则产生系统告。试验结果表明,本发明方法的召回率和F值更高,表现更好。
-
公开(公告)号:CN111949480B
公开(公告)日:2023-08-11
申请号:CN202010795863.8
申请日:2020-08-10
申请人: 重庆大学
IPC分类号: G06F11/30 , G06F16/35 , G06N3/0442 , G06N3/045 , G06N3/084
摘要: 本发明涉及基于组件感知的日志异常检测方法,该方法将目标软件的日志消息转换为日志模板序列和组件序列,然后进行模型训练,将两个LSTM模型组合使用,两个LSTM模型训练使用相同的损失函数,采用梯度下降优化算法更行参数值,训练完成得到由日志检测模型和组件检测模型构成的组合模型;将t‑h到t‑1时刻的所有日志数据的参考日志模板序列和参考组件序列输入组合模型得到可能日志模板集和可能组件模板集;当t时刻日志消息mt的待测日志模板序列在可能日志模板集中,且t时刻日志消息mt的待测组件序列在可能组件模板集Cg中,则认为日志消息mt为正常日志,否则产生系统告。试验结果表明,本发明方法的召回率和F值更高,表现更好。
-
-
-
-
-
-
-
-
-