基于树型注意力和加权图匹配的相似漏洞检测方法

    公开(公告)号:CN115859307B

    公开(公告)日:2024-11-22

    申请号:CN202211678532.1

    申请日:2022-12-26

    Abstract: 本发明公开了一种基于树型注意力和加权图匹配的相似漏洞检测方法,首先,分别为目标函数、漏洞函数和补丁函数生成FCG、vSCG、pSCG。其次,利用语句节点嵌入网络分别提取FCG、vSCG和pSCG语句节点的语义和语法信息。接着,利用图神经网络和加权图匹配方法构成的图匹配模型,学习并计算FCG和vSCG之间以及FCG和pSCG之间的相似度,然后利用计算的三元组损失函数调整网络参数,训练检测模型。最后,利用训练好的模型检测软件中的相似漏洞。本发明可以在捕获代码中与漏洞相关的语法和语义特征的同时,有效利用补丁信息区分仅有细微差异的漏洞和补丁函数,从而提高相似漏洞检测的准确率。

    序列决策和概率采样指导的漏洞检测语句级可解释方法

    公开(公告)号:CN118690346A

    公开(公告)日:2024-09-24

    申请号:CN202410730438.9

    申请日:2024-06-06

    Abstract: 本发明公开了一种序列决策和概率采样指导的漏洞检测语句级可解释方法,所述方法如下:将待解释的漏洞代码按照语句进行拆分,探索器按顺序遍历代码中的语句;探索器利用待解释的检测模型中的代码表示网络,根据候选漏洞模式和当前语句生成决策向量;导航器根据决策向量返回当前语句与漏洞相关概率,探索器根据导航器生成的漏洞相关概率执行概率采样;探索器根据采样做出决策,更新候选漏洞相关语句集合;利用标签信息和候选漏洞相关语句集合,计算增益值和期望梯度,将通过反向传播以调整导航器;用探索器和训练好的导航器对待解释模型的漏洞检测结果进行解释。本发明可灵活应用于现有的漏洞检测模型,且适用于有或没有细粒度标签两种训练场景。

    应用于输入法中的基于“三级上屏”的句子生成和显示方法

    公开(公告)号:CN118535028A

    公开(公告)日:2024-08-23

    申请号:CN202410774665.1

    申请日:2024-06-17

    Abstract: 本发明公开了一种应用于输入法中的基于“三级上屏”的句子生成和显示方法,所述方法如下:组字区中显示用户输入的英文或者拼音;如检测到组字区中用户输入的拼音,响应于输入拼音的操作,显示候选词显示界面;将选中的候选词填入组字区,并替换掉原来组字区中的拼音;按下大模型触发快捷键,响应于针对组字区中内容的操作,客户端基于组字区的内容发送双语生成请求给服务器,服务器调用大模型执行双语生成操作,并将结果返回给客户端,客户端显示句子生成显示界面;句子生成显示界面中显示根据组字区中的内容利用大模型生成的至少一个句子,选中某个推荐句子进入终端设备。本发明能实现在输入法中直接对句子的文本预测与续写,显著提升输入效率。

    一种针对漏洞检测模型的组合对抗攻击方法

    公开(公告)号:CN115080982B

    公开(公告)日:2024-07-19

    申请号:CN202210729780.8

    申请日:2022-06-24

    Abstract: 本发明公开了一种针对漏洞检测模型的组合对抗攻击方法,首先使用本发明中提出的4种代码扰动方法对程序骨架中可修改的语句进行扰动,生成大量语义相似的候选样本。其次,利用生成的候选样本初始化遗传算法的种群规模和成员,然后,根据不同的扰动方法设计变异算子,并对种群成员进行选择、交叉和变异操作生成新的种群;最后,判断每次迭代生成的新种群中是否存在适应度大于一定阈值的成员,如果存在,则表示成功获得对抗样本。根据本发明提出的多种代码扰动方法,可实现对各种语法要素执行语义保持的程序等价变换,从而提高生成的对抗样本质量。通过将遗传搜索策略与多种代码扰动方法相结合,能够提高对代码漏洞检测模型的攻击成功率和攻击效率。

    基于切片属性图表示学习的函数级代码漏洞检测方法

    公开(公告)号:CN112699377B

    公开(公告)日:2023-04-28

    申请号:CN202011613496.1

    申请日:2020-12-30

    Abstract: 本发明公开了一种基于切片属性图表示学习的函数级代码漏洞检测方法,首先引入新的切片准则,并提出切片属性图的概念,基于切片准则和程序切片技术生成代码的切片属性图,提取与漏洞候选关键点有依赖关系的图结构信息、节点属性信息和代码上下文信息;然后,利用关系图卷积神经网络并结合基于节点和子图的双重注意力机制,对切片属性图进行表示学习,以学习更全面、更准确的漏洞模式;最后对各个切片属性图的漏洞识别结果进行融合实现函数级别的漏洞检测,并确定漏洞候选语句的集合以及与漏洞相关联的语法要素。该方法能覆盖更多的漏洞候选关键点,充分学习和表示漏洞相关的结构、属性和上下文信息,提高漏洞检测的准确率。

    一种基于深度学习和强化学习的多粒度代码漏洞检测方法

    公开(公告)号:CN111753303B

    公开(公告)日:2023-02-07

    申请号:CN202010747186.2

    申请日:2020-07-29

    Abstract: 本发明公开了一种基于深度学习和强化学习的多粒度代码漏洞检测方法,步骤如下:1)解析源代码,获取代码对应的中间代码表示;2)对中间代码进行切片,获取比源程序更小的代码段;3)使用代码分段表示方法将输入的代码段转化为低维连续的实值向量;4)将代码段的向量表示输入到基于深度学习的粗粒度代码漏洞检测模型中,判断代码段是否包含缺陷;5)构建基于强化学习的细粒度代码漏洞检测模型,预测含有缺陷的代码段中具体引发漏洞的代码行。本发明提出一种完整的多粒度代码漏洞检测框架,并首次将强化学习应用到细粒度代码漏洞检测领域,以及提出一种新的代码分段表示学习模型以充分利用程序的语义信息,提高了漏洞检测的准确度和实用性。

    一种基于知识库和表示学习的缺陷报告自动分派方法

    公开(公告)号:CN111723021B

    公开(公告)日:2022-05-03

    申请号:CN202010728693.1

    申请日:2020-07-23

    Abstract: 本发明公开了一种基于知识库和表示学习的缺陷报告自动分派方法,所述方法利用知识库和表示学习技术,首先从缺陷报告仓库中提取结构化信息和文本信息,从而构建知识库。然后将知识库中的实体和关系以及文本描述初始化为相同维度的低维连续的实值向量。再利用改进的表示学习模型PTITransE学习实体和关系的向量表示。最后,基于实体和关系的向量表示,使用链接预测技术,为新提交的缺陷报告推荐合适的修复者。本发明首次将知识库和表示学习应用到缺陷分派领域,并提出一种新的表示学习模型以充分利用缺陷报告的文本和结构化信息,提高了缺陷分派的准确率。

    一种基于代码知识图谱和知识迁移的代码摘要生成方法

    公开(公告)号:CN111797242A

    公开(公告)日:2020-10-20

    申请号:CN202010611989.5

    申请日:2020-06-29

    Abstract: 本发明公开了一种基于代码知识图谱和知识迁移的代码摘要生成方法,所述方法如下:1、抽取并融合多源数据构建代码知识图谱;2、利用代码解析工具生成抽象语法树,遍历抽象语法树中的方法调用节点获取API调用序列;3、从代码知识图谱中搜索API调用序列中的API描述信息;4、挖掘大规模开源项目,构建API序列摘要生成数据集,训练文本摘要生成模型,学习与API功能相关的背景知识;5、构建代码摘要生成模型;6、在代码摘要数据集上训练代码摘要生成模型,并利用该模型生成代码摘要。本发明将代码知识图谱和知识迁移用于代码摘要生成任务,能加强模型提取代码功能语义信息的能力,辅助模型理解代码,提高代码摘要生成质量。

    一种基于深度学习和强化学习的多粒度代码漏洞检测方法

    公开(公告)号:CN111753303A

    公开(公告)日:2020-10-09

    申请号:CN202010747186.2

    申请日:2020-07-29

    Abstract: 本发明公开了一种基于深度学习和强化学习的多粒度代码漏洞检测方法,步骤如下:1)解析源代码,获取代码对应的中间代码表示;2)对中间代码进行切片,获取比源程序更小的代码段;3)使用代码分段表示方法将输入的代码段转化为低维连续的实值向量;4)将代码段的向量表示输入到基于深度学习的粗粒度代码漏洞检测模型中,判断代码段是否包含缺陷;5)构建基于强化学习的细粒度代码漏洞检测模型,预测含有缺陷的代码段中具体引发漏洞的代码行。本发明提出一种完整的多粒度代码漏洞检测框架,并首次将强化学习应用到细粒度代码漏洞检测领域,以及提出一种新的代码分段表示学习模型以充分利用程序的语义信息,提高了漏洞检测的准确度和实用性。

Patent Agency Ranking