一种恶意软件包检测方法、系统、设备及存储介质

    公开(公告)号:CN118520459A

    公开(公告)日:2024-08-20

    申请号:CN202410408182.X

    申请日:2024-04-07

    申请人: 扬州大学

    摘要: 本发明公开了一种恶意软件包检测方法、系统、设备及存储介质,方法包括:从公开网站获取良性包,作为训练样本;对训练样本内的代码进行分析,生成对应代码的调用图和控制流图;根据所述调用图和控制流图,训练得到标准化代码行为序列;结合标准化代码行为序列,调整SecureBERT模型,筛选出可能具有恶意行为的软件包,并对SecureBERT模型进行训练;根据人工收集的专家知识,形成恶意特征集,通过对特征进行抽取,训练基于朴素贝叶斯分类器的二分类器;根据训练后SecureBERT模型,结合所述二分类器,生成集成分类器,通过集成分类器对恶意软件包完成检测与识别;本发明能够自适应的检测可疑的代码行为、避免客观因素对检测结果造成影响。

    一种基于双视图因果推理的可解释漏洞检测方法及系统

    公开(公告)号:CN117763560A

    公开(公告)日:2024-03-26

    申请号:CN202311689060.4

    申请日:2023-12-08

    申请人: 扬州大学

    IPC分类号: G06F21/57 G06N5/04

    摘要: 本发明公开了一种基于双视图因果推理的可解释漏洞检测方法及系统,所述漏洞检测方法包括以下步骤:S1、获取代码样本,所述代码样本包括训练样本和待检测样本,将所述训练样本依次经过数据增强、静态分析、构建代码属性图、特征抽取后得到训练数据集;将所述待检测样本依次经过静态分析、构建代码属性图、特征抽取后得到待检测数据集;S2、基于混合对比学习法处理所述训练数据集,建立漏洞检测模型;将所述待检测数据集输入所述漏洞检测模型,输出漏洞代码;S3、对所述漏洞代码进行因果推理,输出漏洞检测解释。本发明具有鲁棒性高、准确性高、简洁性强的特点。

    基于强化学习的Java反序列化漏洞检测系统及方法

    公开(公告)号:CN114462043A

    公开(公告)日:2022-05-10

    申请号:CN202111629096.4

    申请日:2021-12-28

    摘要: 本发明公开了一种基于强化学习的Java反序列化漏洞检测系统及方法,包括:漏洞数据采集;构建序列化感知的代码属性图SCPG,挖掘潜在漏洞调用链;利用强化学习对模糊测试的种子调度过程进行建模,训练模糊决策模型;对待检测的JAVA文件进行静态分析,构建序列化感知的代码属性图SCPG并识别潜在漏洞调用链,使用模糊决策模型对潜在漏洞调用链进行验证,输出存在利用风险的反序列化漏洞调用链。本发明可以一定程度上解决传统JAVA反序列化漏洞调用链挖掘方法中人工开销大、精度不高的问题;并且相较于基于变量可控性分析的JAVA反序列化漏洞调用链自动挖掘方法,本发明可以通过模糊测试对挖掘得到的潜在漏洞调用链进行验证,使得实际应用领域更广、精度更高。

    基于软件开发过程度量的软件安全性缺陷预测方法及装置

    公开(公告)号:CN111506504A

    公开(公告)日:2020-08-07

    申请号:CN202010286267.7

    申请日:2020-04-13

    申请人: 扬州大学

    IPC分类号: G06F11/36 G06K9/62

    摘要: 本发明公开了一种基于软件开发过程度量的软件安全性缺陷预测方法及装置。本发明通过构造文件开发者图和项目代码修改图,表达了软件开发过程中开发者活动和代码修改的信息;同时使用图神经网络训练嵌入模型对图结构分别进行嵌入操作,获取其对应的特征向量作为度量元,保留了图结构中的大量信息;将获得的文件开发者度量元和文件修改度量元这两种度量元作为特征,利用缺陷数据库中的数据进行数据标注,训练分类模型,获得最终的预测模型,利用该模型进行安全性缺陷预测,在文件粒度上给出预测结果,且预测准确度高。

    数据驱动的内存泄漏智能化检测方法及系统

    公开(公告)号:CN113326187B

    公开(公告)日:2023-11-24

    申请号:CN202110569646.1

    申请日:2021-05-25

    申请人: 扬州大学

    IPC分类号: G06F11/36 G06F21/57 G06N3/042

    摘要: 本发明公开了一种数据驱动的内存泄漏智能化检测方法及系统,方法包括以下步骤:漏洞数据采集;构造程序间价值流图IVFG,提取漏洞特征;利用多关系图卷积网络COMPGCN,训练漏洞检测模型;对待检测文件进行预处理,并利用检测模型检测是否存在内存泄漏,报告发生内存泄漏的漏洞函数及可疑的漏洞语句。本发明可以更好地利用内存泄漏漏洞特有的代码语法和语义信息,充分挖掘漏洞代码与调用上下文、全局变量等敏感对象的关系,达到对潜在内存泄漏的代码的判别并输出可疑的漏洞语句,针对性更强,可以一定程度上解决传统静态或动态方法检测内存泄漏的不足,并且相较于目前流行的基于深度学习的漏洞检测方法,可以输出存在内存泄漏的可疑语句,使实际应用领域更广、精度更高、定(56)对比文件孔维星.基于图网络的源代码漏洞检测研究《.中国优秀硕士学位论文全文数据库 (信息科技辑)》.2021,(第2期),全文.Xiao Cheng.Static Detection ofControl-Flow-Related VulnerabilitiesUsing Graph Embedding《.2019 24thInternational Conference on Engineeringof Complex Computer Systems (ICECCS)》.2019,全文.朱亚伟.C程序内存泄漏的智能化检测方法.《中国优秀硕士学位论文全文数据库 (信息科技辑)》.2019,(第7期),17-49.孙小兵.面向软件安全性缺陷的开发者推荐方法《.软件学报》.2018,第29卷(第8期),全文.Xiaobing Sun.An Empirical Study onReal Bugs for Machine Learning Programs.《2017 24th Asia-Pacific SoftwareEngineering Conference (APSEC)》.2018,全文.Hua Yan.Automated memory leak fixingon value-flow slices for C programs《.SAC‘16:Proceedings of the 31st Annual ACMSymposium on Applied Computing》.2016,全文.

    可解释性的软件漏洞检测与推荐方法及系统

    公开(公告)号:CN112364352B

    公开(公告)日:2023-11-24

    申请号:CN202011131831.4

    申请日:2020-10-21

    申请人: 扬州大学

    摘要: 本发明公开了一种可解释性的软件漏洞检测与推荐方法及系统,方法包括以下步骤:构建漏洞数据集;进行漏洞代码图嵌入,将代码转化为可供神经网络学习的图形结构;进行漏洞特征学习,提取不同类型的特征;进行漏洞数据集平衡,合成少数类数据;构建漏洞检测模型,利用该模型检测待测漏洞实例所含漏洞并为其推荐漏洞样例。本发明可以更好地利用漏洞代码的语法、语义信息,充分挖掘漏洞代码与上下文的关系,达到对多种漏洞类型的判别与输出,普适性和通用性更强,可以取代实际代码审计中人工制定漏洞指标的环节,并推荐与检测代码所含漏洞类似的已知漏洞,使实际应用领域更广、精度更高、可解释性强。

    基于图神经网络的漏洞识别与预测方法、系统、计算机设备和存储介质

    公开(公告)号:CN111274134B

    公开(公告)日:2023-07-11

    申请号:CN202010053062.4

    申请日:2020-01-17

    申请人: 扬州大学

    摘要: 本发明公开了一种基于图神经网络的漏洞识别与预测方法、系统、计算机设备和存储介质,方法包括:构建漏洞数据集;将漏洞数据集划分为训练集和测试集;漏洞文件代码图表示;漏洞特征提取;构建预测器,并利用该预测器预测代码文件中的漏洞。系统用于实现上述方法过程,计算机设备和存储介质通过执行计算机程序能够实现上述方法过程。本发明可以更好地利用漏洞代码的语法、语义信息,充分挖掘漏洞代码与上下文的关系,并有效的识别一类漏洞,普适性和通用性更强,可以取代实际代码审计中人工制定漏洞指标的环节,使实际使用成本更低、应用领域更广、精度更高。

    一种支持序列化或反序列化特征的混合流图生成方法

    公开(公告)号:CN115993953A

    公开(公告)日:2023-04-21

    申请号:CN202211411937.9

    申请日:2022-11-11

    申请人: 扬州大学

    IPC分类号: G06F8/20 G06F8/30 G06F9/448

    摘要: 本发明公开了一种支持序列化或反序列化特征的混合流图生成方法,对java源程序进行指定入口函数,并采用上下文敏感的指针分析方法,构建初始调用图,提高指针分析的效率及准确性,并结合信息流传播的规则,对实际程序中存在的反序列化黑白名单规则加以适配,使得构造的调用关系更加准确,同时信息流传播及调用图的结合共同构造出混合流图,实现了序列化或反序列化调用关系的精准分析,帮助开发人员查找出可能存在的漏洞。

    基于软件开发过程度量的软件安全性缺陷预测方法及装置

    公开(公告)号:CN111506504B

    公开(公告)日:2023-04-07

    申请号:CN202010286267.7

    申请日:2020-04-13

    申请人: 扬州大学

    摘要: 本发明公开了一种基于软件开发过程度量的软件安全性缺陷预测方法及装置。本发明通过构造文件开发者图和项目代码修改图,表达了软件开发过程中开发者活动和代码修改的信息;同时使用图神经网络训练嵌入模型对图结构分别进行嵌入操作,获取其对应的特征向量作为度量元,保留了图结构中的大量信息;将获得的文件开发者度量元和文件修改度量元这两种度量元作为特征,利用缺陷数据库中的数据进行数据标注,训练分类模型,获得最终的预测模型,利用该模型进行安全性缺陷预测,在文件粒度上给出预测结果,且预测准确度高。