一种面向多源漏洞信息的事件图谱自动构建方法及系统

    公开(公告)号:CN113656805A

    公开(公告)日:2021-11-16

    申请号:CN202110828495.7

    申请日:2021-07-22

    申请人: 扬州大学

    IPC分类号: G06F21/57

    摘要: 本发明提出了一种面向多源漏洞信息的事件图谱自动构建方法及系统,从文本和代码信息两个角度将CVE、NVD等网站中的漏洞相关信息进行整合。首先从漏洞数据库中爬取漏洞报告,将漏洞的发生原因视为事件触发词进行识别,并通过其判断漏洞类型。其次通过命名实体识别的方式对描述中的攻击者、后果、位置等信息进行识别,并进行信息补全。再利用文本信息抽取显式的事件关系,并利用文本相似性抽取隐式的事件关系,并进行漏洞相关代码的表征。最终借助可视化工具将所得的漏洞事件信息可视化为事件图谱,从而为开发人员提供更直观准确的漏洞事件及其相关因素,减少开发人员手动分析和理解漏洞数据的人力和时间成本,提高软件维护的有效性和高效性。

    一种面向软件缺陷的多轮自动问答方法、系统、计算机设备和存储介质

    公开(公告)号:CN113326062A

    公开(公告)日:2021-08-31

    申请号:CN202110569649.5

    申请日:2021-05-25

    申请人: 扬州大学

    摘要: 本发明公开了一种面向软件缺陷的多轮自动问答方法,属于软件维护领域,本发明包括如下步骤:从开源Bug管理库爬取缺陷报告,提取报告中对缺陷理解有帮助的信息,对一些长文本抽取实体和关系,进行知识融合和质量检测,构建软件缺陷知识图谱;记录软件开发者或维护者与系统的多次沟通,构建多轮对话记忆模块;根据软件开发者或维护者提问的软件缺陷领域的相关问题,构建软件开发者或维护者的用户画像;根据所述对话记忆和软件开发者或维护者用户画像构建多轮问答模块。

    基于软件开发过程度量的软件安全性缺陷预测方法及装置

    公开(公告)号:CN111506504A

    公开(公告)日:2020-08-07

    申请号:CN202010286267.7

    申请日:2020-04-13

    申请人: 扬州大学

    IPC分类号: G06F11/36 G06K9/62

    摘要: 本发明公开了一种基于软件开发过程度量的软件安全性缺陷预测方法及装置。本发明通过构造文件开发者图和项目代码修改图,表达了软件开发过程中开发者活动和代码修改的信息;同时使用图神经网络训练嵌入模型对图结构分别进行嵌入操作,获取其对应的特征向量作为度量元,保留了图结构中的大量信息;将获得的文件开发者度量元和文件修改度量元这两种度量元作为特征,利用缺陷数据库中的数据进行数据标注,训练分类模型,获得最终的预测模型,利用该模型进行安全性缺陷预测,在文件粒度上给出预测结果,且预测准确度高。

    面向智能合约代码的漏洞预测方法、系统、计算机设备和存储介质

    公开(公告)号:CN111339535A

    公开(公告)日:2020-06-26

    申请号:CN202010094870.5

    申请日:2020-02-17

    申请人: 扬州大学

    IPC分类号: G06F21/57

    摘要: 本发明公开了一种面向智能合约代码的漏洞预测方法、系统、计算机设备和存储介质,方法包括:采集若干智能合约代码和漏洞数据;针对每个智能合约代码,提取其代码特征值,并识别与漏洞数据相关度值满足预设条件的代码特征值,记为漏洞特征值;针对每个智能合约代码,利用漏洞特征值构建分类器模型;构建智能合约漏洞预测网络;随机选取若干漏洞特征值,并输入至预测网络进行训练,生成漏洞预测分类器;提取待预测智能合约代码的代码特征值,并将该代码特征值输入至漏洞预测分类器中,获得漏洞预测结果。本发明结合多粒度扫描、级联森林等技术构建漏洞预测分类器,能提供有效的智能合约代码漏洞预测效果,进而提高智能合约代码上链前的代码质量。

    一种面向代码模型中分类任务的后门攻击方法及系统

    公开(公告)号:CN118312957A

    公开(公告)日:2024-07-09

    申请号:CN202410505753.1

    申请日:2024-04-25

    申请人: 扬州大学

    摘要: 本发明公开了一种面向代码模型中分类任务的后门攻击方法及系统。后门攻击方法包括:S1、收集并预处理干净样本,得到重要性变量名;S2、在干净样本中,按照标签类别对变量名分类,得到多个触发集;同时从干净样本中选取目标标签;S3、将目标标签对应的触发集中的变量名进行C分数计算;在干净样本中,将C分数最大的变量名替换重要性变量名,预测替换后的标签,重复上述过程直至标签变化为目标标签,此时替换后的干净样本为中毒样本,将中毒样本中替换产生的变量名作为触发器;S4、将中毒样本中的触发器随机插入干净样本,形成负样本;采用基于负样本、中毒样本、干净样本得到的攻击模型进行攻击。本发明具有简单、隐蔽性强、误触率低的特点。

    基于Petri-Net的信息物理系统中数据丢失错误检测方法及系统

    公开(公告)号:CN118041827A

    公开(公告)日:2024-05-14

    申请号:CN202410318136.0

    申请日:2024-03-20

    申请人: 扬州大学

    摘要: 本发明公开了一种基于Petri‑Net的信息物理系统中数据丢失错误检测方法及系统,该方法首先将信息物理系统映射为带数据的佩特里网并生成合并过程,根据删除规则优化合并过程中的事件和条件得到优化合并过程,在所述优化合并过程中判断每一个事件是否为丢失事件,输出数据丢失错误的事件集合;本发明通过删除规则对合并过程进行优化,降低了模型的复杂度;设计了数据丢失错误的检测算法,可以检测出信息物理系统数据流中的数据丢失错误,以验证信息物理系统的设计正确性。

    基于多标签学习的UI元素的Web代码生成方法

    公开(公告)号:CN112379878B

    公开(公告)日:2024-03-26

    申请号:CN202011131833.3

    申请日:2020-10-21

    申请人: 扬州大学

    IPC分类号: G06F8/38 G06F8/33 G06F16/958

    摘要: 本发明公开了一种基于多标签学习的UI元素的Web代码生成方法,包括:获取UI元素图片及其代码的数据集;对每一个UI元素图片进行预处理,获得处理后的图片;对预处理后的图片进行特征提取,获得特征向量v;基于向量v,训练一个HTML标签分类器、HTML属性的分类器,n'个对应离散CSS属性值的分类器和m'个连续CSS属性值回归器,之后利用各分类器、回归器预测新的UI元素图片,对预测后的结果进行代码组装,获得该图片对应的代码。本发明方法能够获得UI元素图片到Web代码的生成模型M,对M输入待处理的UI元素图片,便能生成相应的Web代码,普适性和通用性更强,可以取代实际开发中的部分环节,使实际使用成本更低、应用领域更广。

    数据驱动的内存泄漏智能化检测方法及系统

    公开(公告)号:CN113326187B

    公开(公告)日:2023-11-24

    申请号:CN202110569646.1

    申请日:2021-05-25

    申请人: 扬州大学

    IPC分类号: G06F11/36 G06F21/57 G06N3/042

    摘要: 本发明公开了一种数据驱动的内存泄漏智能化检测方法及系统,方法包括以下步骤:漏洞数据采集;构造程序间价值流图IVFG,提取漏洞特征;利用多关系图卷积网络COMPGCN,训练漏洞检测模型;对待检测文件进行预处理,并利用检测模型检测是否存在内存泄漏,报告发生内存泄漏的漏洞函数及可疑的漏洞语句。本发明可以更好地利用内存泄漏漏洞特有的代码语法和语义信息,充分挖掘漏洞代码与调用上下文、全局变量等敏感对象的关系,达到对潜在内存泄漏的代码的判别并输出可疑的漏洞语句,针对性更强,可以一定程度上解决传统静态或动态方法检测内存泄漏的不足,并且相较于目前流行的基于深度学习的漏洞检测方法,可以输出存在内存泄漏的可疑语句,使实际应用领域更广、精度更高、定(56)对比文件孔维星.基于图网络的源代码漏洞检测研究《.中国优秀硕士学位论文全文数据库 (信息科技辑)》.2021,(第2期),全文.Xiao Cheng.Static Detection ofControl-Flow-Related VulnerabilitiesUsing Graph Embedding《.2019 24thInternational Conference on Engineeringof Complex Computer Systems (ICECCS)》.2019,全文.朱亚伟.C程序内存泄漏的智能化检测方法.《中国优秀硕士学位论文全文数据库 (信息科技辑)》.2019,(第7期),17-49.孙小兵.面向软件安全性缺陷的开发者推荐方法《.软件学报》.2018,第29卷(第8期),全文.Xiaobing Sun.An Empirical Study onReal Bugs for Machine Learning Programs.《2017 24th Asia-Pacific SoftwareEngineering Conference (APSEC)》.2018,全文.Hua Yan.Automated memory leak fixingon value-flow slices for C programs《.SAC‘16:Proceedings of the 31st Annual ACMSymposium on Applied Computing》.2016,全文.

    一种基于图学习的线程安全代码识别方法

    公开(公告)号:CN113138924B

    公开(公告)日:2023-10-31

    申请号:CN202110440403.8

    申请日:2021-04-23

    申请人: 扬州大学

    摘要: 本发明公开了一种基于图学习的线程安全代码识别方法,属于软件测试领域;具体包括:构建得到线程安全数据集;将线程安全数据集中的类转化为可供分析的域访问图;构建以域访问图为输入、以分类标签为输出的GMN神经网络模型;采用匹配池对构建的GMN神经网络模型进行训练,得到训练好的GMN神经网络模型;将待安全识别的类对应转化成域访问图,而后输入至训练好的GMN神经网络模型,得到识别结果;本发明使用域访问图的结构,充分体现了并发程序中不同的访问关系,基于训练好的GMN神经网络模型的注意力机制进行跨图匹配,达到对线程安全代码的识别,更具普适性,通用性,且极大地提升了预测结果的准确性。

    一种基于图的语句级程序修复方法及系统

    公开(公告)号:CN113741886B

    公开(公告)日:2023-09-26

    申请号:CN202110879818.5

    申请日:2021-08-02

    申请人: 扬州大学

    摘要: 本发明公开了一种基于图的语句级程序修复方法及系统,属于软件调试领域。本发明首先提取缺陷代码及补丁、规范代码以构建训练及预训练的数据集;对数据集预处理并预训练编程语言模型;利用编程语言模型进行数据嵌入,构建并训练基于Graph‑to‑Sequence架构的翻译模型;使用训练完成的翻译模型生成缺陷语句的补丁。本发明使用融合源代码多种特征的代码图表征代码,结合了预训练模型学习代码规范并加快翻译模型训练收敛速度,可以优化缺陷语句的上下文表示,使翻译模型能够更好地学习缺陷语句与正确语句之间的语法语义关联信息,从而更好地表征缺陷修复的语义,生成遵循编程语言规范的高质量修复补丁以自动化地修复缺陷程序,能够极大降低缺陷修复的成本。