-
公开(公告)号:CN115577362A
公开(公告)日:2023-01-06
申请号:CN202211105496.X
申请日:2022-09-09
Applicant: 哈尔滨工业大学
IPC: G06F21/57 , G06F18/25 , G06F18/213
Abstract: 本发明公开了一种基于源代码和汇编代码跨模态特征增强的漏洞检测方法,所述方法从源代码中提取控制依赖和数据依赖相关的语法语义特征,从汇编代码中提取内存操作相关的语法语义特征,然后使用高级语言程序源代码与其语句对齐的汇编代码输入到跨模态特征增强和融合的双模态表示学习模型进行软件漏洞检测。该方法能够对高级语言源代码和汇编代码两种程序模态进行表示学习,利用源代码和汇编代码之间的语句对齐关系,分别在源代码模态和汇编代码模态提取漏洞相关的语义特征,并使用不同的深度学习网络和交叉注意力机制学习二者之间的语义关联性,充分利用两种模态程序的特征互补性进行特征级融合,从而提升软件漏洞检测的准确性。
-
公开(公告)号:CN114816431A
公开(公告)日:2022-07-29
申请号:CN202210569302.5
申请日:2022-05-24
Applicant: 哈尔滨工业大学
IPC: G06F8/41
Abstract: 本发明公开了一种SysML语言的安全可靠语义扩展和建模方法,所述方法通过扩展需求图的安全和可靠语义、增加冗余语义、失效模式和影响分析语义、故障树语义,并构建可视化模型,使得SysML语言既支持自动从系统模型中提取安全可靠分析的相关信息,也支持利用安全可靠分析进一步完善系统模型,从而将基于模型的系统工程和安全可靠分析过程有效地融合,有助于确保安全分析和系统设计之间的一致性,解决当前设计复杂安全关键系统的问题。
-
公开(公告)号:CN114416570A
公开(公告)日:2022-04-29
申请号:CN202210068537.6
申请日:2022-01-20
Applicant: 哈尔滨工业大学
IPC: G06F11/36
Abstract: 本发明公开了一种基于加权软件行为图的等价变异体检测方法,首先解析原始程序和变异体的源代码,进行语句级插桩,为后续执行时捕获执行路径奠定基础。其次,分别运行原始程序和变异体,在相同的输入下,如果变异体的输出与原始程序的输出不一致,这类变异体一定是不等价的,直接排除,否则可能是等价的,继续后续处理。最后,逐一对比相同输入下变异体和原始程序的加权软件行为图,如果在任一输入下二者不相等,则该变异体与原始程序不等价,如果在全部输入下二者始终相等,则该变异体等价于原始程序。该方法既能够像人工判定时一样准确追踪程序的内部执行行为,提高等价变异体判断的准确性,又能够减少人工判定成本,提高等价变异体检测的效率。
-
公开(公告)号:CN113849162A
公开(公告)日:2021-12-28
申请号:CN202111142407.4
申请日:2021-09-28
Applicant: 哈尔滨工业大学
Abstract: 一种利用模型驱动和深度神经网络相结合的代码生成方法,涉及一种代码生成方法。所述方法包括如下步骤:使用活动图对目标需求建模后,自动生成逻辑结构代码;利用训练好的深度神经网络模型完成自然语言需求描述到具体功能代码的生成。本发明依靠两种代码生成各自的优点,弥补对方的不足,即利用模型驱动解决基于自然语言的代码生成中的长距离依赖和代码粒度较小的问题;又基于自然语言的生成解决模型驱动代码生成中代码细节信息不丰富的问题,对功能复杂的代码既可以保证逻辑的正确性以及长结构的正确性,又可以一定程度保证代码细节的正确性。
-
公开(公告)号:CN112699377A
公开(公告)日:2021-04-23
申请号:CN202011613496.1
申请日:2020-12-30
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种基于切片属性图表示学习的函数级代码漏洞检测方法,首先引入新的切片准则,并提出切片属性图的概念,基于切片准则和程序切片技术生成代码的切片属性图,提取与漏洞候选关键点有依赖关系的图结构信息、节点属性信息和代码上下文信息;然后,利用关系图卷积神经网络并结合基于节点和子图的双重注意力机制,对切片属性图进行表示学习,以学习更全面、更准确的漏洞模式;最后对各个切片属性图的漏洞识别结果进行融合实现函数级别的漏洞检测,并确定漏洞候选语句的集合以及与漏洞相关联的语法要素。该方法能覆盖更多的漏洞候选关键点,充分学习和表示漏洞相关的结构、属性和上下文信息,提高漏洞检测的准确率。
-
公开(公告)号:CN109144882A
公开(公告)日:2019-01-04
申请号:CN201811096080.X
申请日:2018-09-19
Applicant: 哈尔滨工业大学
IPC: G06F11/36
CPC classification number: G06F11/3684
Abstract: 本发明公开了一种程序不变量的软件故障定位方法及装置。该方法包括:针对目标软件源代码进行语句、值和逻辑表达式级的插桩,采用预设的测试用例集合执行插桩后的源代码,获得执行信息;对预设失败测试用例集合进行聚类,并对每个聚类,选择有助于区分缺陷语句的成功测试用例集合;学习优选成功测试用例集合的执行信息,获得程序不变量集合,包括集合型、真值表型和浮点型范围不变量;根据失败测试用例集合的执行信息和程序不变量集合检测不变量违背,获得可疑语句集合。采用依赖分析过滤掉因故障传播导致的不变量违背误检,统计分析各语句处的不变量违背,计算语句可疑度。本发明提高了软件故障定位的准确性,克服了逻辑表达式缺陷定位漏检问题。
-
公开(公告)号:CN103150254B
公开(公告)日:2015-05-13
申请号:CN201310099998.0
申请日:2013-03-26
Applicant: 哈尔滨工业大学
IPC: G06F11/36
Abstract: 基于状态依赖概率建模的软件错误定位方法,本发明涉及计算机程序分析领域。本发明是要解决传统的软件错误定位方法定位精度低的问题,而提供了基于状态依赖概率建模的软件错误定位方法。步骤1:分别执行正确测试用例和错误测试用例,并分别对正确测试用例和错误测试用例建立状态依赖概率模型;步骤2:在步骤1的基础上,根据状态依赖概率模型,计算每个节点的可疑度;步骤3:将错误定位信息按可疑度进行降序排列,可疑度高的节点认定为更有可能出错的节点,即完成了对基于状态依赖概率建模的软件的错误进行定位。本发明应用于计算机程序分析领域。
-
公开(公告)号:CN103020494A
公开(公告)日:2013-04-03
申请号:CN201210508663.5
申请日:2012-12-03
Applicant: 哈尔滨工业大学
IPC: G06F21/12
Abstract: 一种程序代码编程模式著作权归属检测模型及著作权归属检测方法,它涉及一种编程模式及程序代码著作权归属检测方法。本发明的目的是要解决现在的程序代码雷同检测方法和工具存在不能有效提取大规模程序集合中的编程模式,以及不考虑每个作者的历史数据,无法判定程序代码的著作权归属的问题。一种程序代码编程模式著作权归属检测模型由已知著作权归属的程序代码库、查询程序代码、编程模式及其索引文件、编程模式挖掘器、著作权归属分析器和著作权归属度列表组成。著作权归属检测方法:以待确认著作权归属的程序代码作为程序代码的编程模式的查询程序代码输入,即可得到著作权归属度列表。本发明主要提供一种程序代码的编程模式及著作权归属检测方法。
-
公开(公告)号:CN116561771B
公开(公告)日:2025-05-13
申请号:CN202310650119.2
申请日:2023-06-02
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种基于合约语义图与深广特征融合的智能合约漏洞检测方法,所述方法能够充分利用智能合约代码中数据流、控制流与fallback运行机制的相关信息,构建出包含丰富结构信息的智能合约语义图。然后结合代码token序列的顺序语义信息与智能合约语义图的结构语义信息,利用深度神经网络提取出智能合约的深度语义特征,同时基于预先定义好的可解释的人工漏洞检测规则,使用全连接层与激活函数构成的线性模型提取出智能合约的人工规则特征。最后,使用Wide&Deep模型对分别侧重广度和深度的两种特征进行融合,进行智能合约的漏洞检测。本发明可以有效表示智能合约中与漏洞相关的语义信息。
-
公开(公告)号:CN119475352A
公开(公告)日:2025-02-18
申请号:CN202411576635.6
申请日:2024-11-06
Applicant: 哈尔滨工业大学
IPC: G06F21/57 , G06F18/25 , G06F18/24 , G06F21/56 , G06N3/0455 , G06N3/0442 , G06N3/084
Abstract: 本发明公开了一种基于跨模态细粒度特征对齐和融合的语句级漏洞检测方法,所述方法将高级程序语言代码转换为源代码语句与汇编代码指令序列对齐且源代码变量与汇编代码寄存器对齐的双模态融合信息的汇编代码,通过双模态互切和双模态净化方法对代码进行预处理,得到净化后的源代码切片和汇编代码切片;将净化后到的双模态切片代码段送入编码网络进行双模态特征融合并学习语句的长依赖关系;将双模态信息融合的代码切片高级向量表示送入解码网络,将编码器得到的语义向量转换为特定序列;将解码网络的输出结果送入分类器中判别待测代码语句是否含有漏洞。本发明可检测出包含多种类型的漏洞或跨越多行语句的复杂漏洞结构,有效地降低误报率和漏报率。
-
-
-
-
-
-
-
-
-