基于LDA模型和PageRank算法建立特征接口有向图的方法

    公开(公告)号:CN103927177A

    公开(公告)日:2014-07-16

    申请号:CN201410156746.1

    申请日:2014-04-18

    申请人: 扬州大学

    IPC分类号: G06F9/44

    摘要: 本发明公开了软件工程领域内的基于LDA模型和PageRank算法建立特征接口有向图的方法,包括如下步骤:1)选取适当的开源软件库作为代码支持;2)通过LDA主题模型提取出项目对应的主题作为该项目的特征集合;3)检索各项目中的接口信息,与各项目对应的特征集合建立联系,构成由项目特征集合指向项目接口集合的特征-接口有向图,利用PageRank算法计算接口在项目内部的调用次数作为特征-接口有向图中边的权值;4)在构成特征-接口有向图后,程序开发人员根据待开发项目的特征与所述特征-接口有向图中的特征进行匹配,根据有向图边的指向关系推荐可能的最优接口列表供开发人员选择使用,本发明提高了软件开发的效率,可用于软件开发中。

    一种基于概念格的软件多错误定位方法

    公开(公告)号:CN103176902A

    公开(公告)日:2013-06-26

    申请号:CN201310074961.2

    申请日:2013-03-08

    申请人: 扬州大学

    发明人: 孙小兵

    IPC分类号: G06F11/36

    摘要: 本发明是一种基于概念格的软件多错误定位方法,该方法能够有效地表示出错误测试和导致程序出错元素之间的关联关系,能够更加有效地找出软件中存在的错误。该技术在实际应用中不受程序语言约束,可以应用于各种编程语言程序中,提高了该技术可应用的范围。根据概念格的层次特性提出一种新的程序元素的可疑程度SD模型,而SD是针对概念格上的每一个节点k进行度量的,即, 其中,Failed表示失效测试用例,Passed表示正确测试用例,Distance表示两个节点间的最短距离,有了该可疑程度度量后,按照该可疑程度从高到低的顺序检查哪些元素是导致测试用例的失效,从而实现软件中的多错误定位。

    一种恶意软件包检测方法、系统、设备及存储介质

    公开(公告)号:CN118520459A

    公开(公告)日:2024-08-20

    申请号:CN202410408182.X

    申请日:2024-04-07

    申请人: 扬州大学

    摘要: 本发明公开了一种恶意软件包检测方法、系统、设备及存储介质,方法包括:从公开网站获取良性包,作为训练样本;对训练样本内的代码进行分析,生成对应代码的调用图和控制流图;根据所述调用图和控制流图,训练得到标准化代码行为序列;结合标准化代码行为序列,调整SecureBERT模型,筛选出可能具有恶意行为的软件包,并对SecureBERT模型进行训练;根据人工收集的专家知识,形成恶意特征集,通过对特征进行抽取,训练基于朴素贝叶斯分类器的二分类器;根据训练后SecureBERT模型,结合所述二分类器,生成集成分类器,通过集成分类器对恶意软件包完成检测与识别;本发明能够自适应的检测可疑的代码行为、避免客观因素对检测结果造成影响。

    一种基于双视图因果推理的可解释漏洞检测方法及系统

    公开(公告)号:CN117763560A

    公开(公告)日:2024-03-26

    申请号:CN202311689060.4

    申请日:2023-12-08

    申请人: 扬州大学

    IPC分类号: G06F21/57 G06N5/04

    摘要: 本发明公开了一种基于双视图因果推理的可解释漏洞检测方法及系统,所述漏洞检测方法包括以下步骤:S1、获取代码样本,所述代码样本包括训练样本和待检测样本,将所述训练样本依次经过数据增强、静态分析、构建代码属性图、特征抽取后得到训练数据集;将所述待检测样本依次经过静态分析、构建代码属性图、特征抽取后得到待检测数据集;S2、基于混合对比学习法处理所述训练数据集,建立漏洞检测模型;将所述待检测数据集输入所述漏洞检测模型,输出漏洞代码;S3、对所述漏洞代码进行因果推理,输出漏洞检测解释。本发明具有鲁棒性高、准确性高、简洁性强的特点。

    一种面向预训练代码模型的防御方法及系统

    公开(公告)号:CN117763540A

    公开(公告)日:2024-03-26

    申请号:CN202311487322.9

    申请日:2023-11-09

    申请人: 扬州大学

    IPC分类号: G06F21/55 G06F21/56 G06N20/00

    摘要: 本发明公开了一种面向预训练代码模型的防御方法及系统。该防御方法包括以下步骤:S1、获取并预处理代码数据集,生成对抗代码样本。S2、对对抗代码样本进行数据增强,得到训练集。S3、获取预训练模型,所述预训练模型包括掩码语言模型,基于所述训练集和预训练模型生成异常检测模型。S4、获取待检测代码文件,基于异常检测模型对待检测代码文件进行检测,识别出具有对抗性的代码文件的异常变量名。S5、基于掩码语言模型将所述异常变量名替换并修复,输出防御修复代码文件。防御系统包括数据获取模块、数据增强模块、异常检测模型生成模块、异常变量名提取模块、代码文件替换修复模块。本发明具有考虑静态分析、准确性高、速度快的特点。

    基于自适应权重加权的公平性联邦学习方法及系统

    公开(公告)号:CN117422152A

    公开(公告)日:2024-01-19

    申请号:CN202311525326.1

    申请日:2023-11-15

    申请人: 扬州大学

    IPC分类号: G06N20/00

    摘要: 本发明公开了一种基于自适应权重加权的公平性联邦学习方法及系统,方法包括:中央服务器初始化基础分布数量以及对应的基础模型参数;各客户端分别从中央服务器下载基础模型,初始化对每个基础模型的初始权重,每个客户端将公平性差距作为惩罚项引入模型训练,损失函数包括精度损失和公平性损失;各客户端利用本地自适应加权算法完成本地公平训练,完成本地训练后,客户端将更新后的模型参数和EOP差距上传至服务器聚合;中央服务器对每个基础模型从贡献度和公平性两个部分进行公平性聚合,得到新一轮的基础模型发送给各个客户端。本发明从本地和全局两个维度出发,保障了联邦学习在异构环境下高精度和高公平性。

    一种基于生成式大语言模型的缺陷报告重构的方法及系统

    公开(公告)号:CN117421226A

    公开(公告)日:2024-01-19

    申请号:CN202311420321.2

    申请日:2023-10-27

    申请人: 扬州大学

    摘要: 本发明公开了一种基于生成式大语言模型的缺陷报告重构的方法及系统,该方法包括以下步骤:采集并预处理语句集和报告集、利用语句集建立分类决策模型、利用分类决策模型评估报告集中缺陷报告的质量、并将低质量的缺陷报告用建立的提示模板基于生成式大语言模型重构,输出得到新的缺陷报告。该系统则包括数据采集模块、评估前数据处理模块、缺陷报告评估模块、输入文本建立模块、缺陷报告重构模块,与现有技术相比,本发明具有实用性强、精确度高的特点。

    一种基于开发者画像的软件工程任务推荐方法

    公开(公告)号:CN109299473B

    公开(公告)日:2024-01-09

    申请号:CN201811361276.7

    申请日:2018-11-15

    申请人: 扬州大学

    摘要: 本发明公开了一种基于开发者画像的软件工程任务推荐方法,包括以下步骤:首先获取软件工程任务的描述文本、紧急程度E以及质量要求Q;之后提取描述文本的主题词并确定软件工程任务关键词T;然后对E、Q进行等级划分;之后通过GitHub和Stack Overflow中的数据获取开发者画像包括技能S、活跃度A、贡献度C和信誉度R;再对A、C、R进行等级划分;然后求取S和T之间的相似度Rdev,并求取每个开发者能完成所述软件工程任务的概率P;最后根据E、Q、A、C、R和P,对所有开发者进行优劣排序,选取最优的开发者完成软件工程任务。本发明有效地结合了开发者完成软件工程任务的历史记录以及开发者画像的更新功能,从而实时推荐出最合适的完成任务的开发者。

    面向软件缺陷知识的知识搜索方法

    公开(公告)号:CN110413732B

    公开(公告)日:2023-11-24

    申请号:CN201910641797.6

    申请日:2019-07-16

    申请人: 扬州大学

    IPC分类号: G06F16/33 G06F16/36 G06F11/36

    摘要: 本发明公开了一种面向软件缺陷知识的知识搜索方法,属于软件开发与维护领域,包括以下步骤:对用户输入的搜索问句进行预处理以形成问句的语法依赖树;根据语法依赖树抽取问题语义三元组,该三元组包括主语、关系与宾语;将问题语义三元组与现有的软件缺陷知识图谱三元组库进行匹配,获得匹配三元组集合;根据匹配三元组集合构建搜索结果子图,并返回给用户。本发明方法针对软件缺陷领域用户可能会搜索的问题条件进行语义分析,并结合知识图谱、自然语言处理这些日益成熟的技术将用户的问题转化成结构化的查询语言并和已有的知识图谱相关联,能够实现更好的搜索交互过程,为软件开发和维护领域提供良好的缺陷信息搜索平台,辅助修复过程。

    基于LSTM的漏洞自动分类方法、系统和计算机设备

    公开(公告)号:CN112115476B

    公开(公告)日:2023-10-24

    申请号:CN202010785734.0

    申请日:2020-08-06

    申请人: 扬州大学

    摘要: 本发明公开了一种基于LSTM的漏洞自动分类方法、系统和计算机设备,方法包括以下过程:训练长短期记忆网络LSTM;利用训练好的LSTM网络处理待分类的漏洞代码;基于NVD树图构建映射矩阵;根据所述映射矩阵以及待分类的漏洞代码对应的LSTM网络的输出,进行矩阵运算,获得待分类漏洞代码的类别。本发明将漏洞矩阵运用到漏洞分类技术中,利用了漏洞矩阵的结构特性,方便化了分类工作。以CWE·NVD为分类标准,在NVD类路径基础上进行漏洞的自动分类,解决了漏洞代码的模糊匹配问题,实现了标准缺陷漏洞库的矩阵化使用以及LSTM特性的极大化利用,同时实现了缺陷预测的自动化,具有较强的方便性,一定程度上为信息安全领域提供了帮助。