一种层次语义感知的代码表示学习方法

    公开(公告)号:CN114816517B

    公开(公告)日:2024-07-16

    申请号:CN202210488430.7

    申请日:2022-05-06

    Abstract: 本发明公开了一种层次语义感知的代码表示学习方法,所述方法针对给定的源代码,首先利用程序分析技术构建程序的有向无环语义图,然后抽取语义图中的语法子树信息,并利用Tree‑LSTM模型学习程序中每条语句的局部语义向量表示,最后基于语句的局部语义向量表示,利用Graph‑LSTM模型学习代码的结构和顺序语义信息。本发明首次提出适用于程序结构语义编码的基于图的LSTM模型Graph‑LSTM,并提出一种能够将源代码序列信息融入到代码表示学习过程中的新框架,提高了模型的特征表示能力。

    基于树型注意力和加权图匹配的相似漏洞检测方法

    公开(公告)号:CN115859307A

    公开(公告)日:2023-03-28

    申请号:CN202211678532.1

    申请日:2022-12-26

    Abstract: 本发明公开了一种基于树型注意力和加权图匹配的相似漏洞检测方法,首先,分别为目标函数、漏洞函数和补丁函数生成FCG、vSCG、pSCG。其次,利用语句节点嵌入网络分别提取FCG、vSCG和pSCG语句节点的语义和语法信息。接着,利用图神经网络和加权图匹配方法构成的图匹配模型,学习并计算FCG和vSCG之间以及FCG和pSCG之间的相似度,然后利用计算的三元组损失函数调整网络参数,训练检测模型。最后,利用训练好的模型检测软件中的相似漏洞。本发明可以在捕获代码中与漏洞相关的语法和语义特征的同时,有效利用补丁信息区分仅有细微差异的漏洞和补丁函数,从而提高相似漏洞检测的准确率。

    基于源代码和汇编代码跨模态特征增强的漏洞检测方法

    公开(公告)号:CN115577362A

    公开(公告)日:2023-01-06

    申请号:CN202211105496.X

    申请日:2022-09-09

    Abstract: 本发明公开了一种基于源代码和汇编代码跨模态特征增强的漏洞检测方法,所述方法从源代码中提取控制依赖和数据依赖相关的语法语义特征,从汇编代码中提取内存操作相关的语法语义特征,然后使用高级语言程序源代码与其语句对齐的汇编代码输入到跨模态特征增强和融合的双模态表示学习模型进行软件漏洞检测。该方法能够对高级语言源代码和汇编代码两种程序模态进行表示学习,利用源代码和汇编代码之间的语句对齐关系,分别在源代码模态和汇编代码模态提取漏洞相关的语义特征,并使用不同的深度学习网络和交叉注意力机制学习二者之间的语义关联性,充分利用两种模态程序的特征互补性进行特征级融合,从而提升软件漏洞检测的准确性。

    基于切片属性图表示学习的函数级代码漏洞检测方法

    公开(公告)号:CN112699377A

    公开(公告)日:2021-04-23

    申请号:CN202011613496.1

    申请日:2020-12-30

    Abstract: 本发明公开了一种基于切片属性图表示学习的函数级代码漏洞检测方法,首先引入新的切片准则,并提出切片属性图的概念,基于切片准则和程序切片技术生成代码的切片属性图,提取与漏洞候选关键点有依赖关系的图结构信息、节点属性信息和代码上下文信息;然后,利用关系图卷积神经网络并结合基于节点和子图的双重注意力机制,对切片属性图进行表示学习,以学习更全面、更准确的漏洞模式;最后对各个切片属性图的漏洞识别结果进行融合实现函数级别的漏洞检测,并确定漏洞候选语句的集合以及与漏洞相关联的语法要素。该方法能覆盖更多的漏洞候选关键点,充分学习和表示漏洞相关的结构、属性和上下文信息,提高漏洞检测的准确率。

Patent Agency Ranking