-
公开(公告)号:CN114077741B
公开(公告)日:2022-12-09
申请号:CN202111284864.7
申请日:2021-11-01
申请人: 清华大学
摘要: 本发明提供一种软件供应链安全检测方法和装置、电子设备及存储介质,其中所述方法包括:获取待检测二进制文件,提取待检测二进制文件的待分析特征,待分析特征包括函数内特征、函数间特征以及模块间特征;将待分析特征输入至特征向量生成模型,输出与待检测二进制文件对应的至少一个待分析特征向量;获取至少一个待分析特征向量分别与参考文件对应的至少一个参考特征向量之间每两个向量的距离,以得到待检测二进制文件与参考文件之间的相似度;基于相似度,检测出待检测二进制文件与参考文件之间的复用关系。本发明能够检测二进制程序中是否复用了第三方代码、代码缺陷、存在关联的漏洞或恶意代码等供应链安全风险,提高了检测效率、准确率。
-
公开(公告)号:CN117608539A
公开(公告)日:2024-02-27
申请号:CN202311446133.7
申请日:2023-11-02
申请人: 清华大学
IPC分类号: G06F8/30 , G06F18/214 , G06F18/25 , G06N3/042
摘要: 本申请提供一种二进制代码的表示向量生成方法、装置、设备及存储介质,可用于计算机技术领域。该方法包括:获取待处理的二进制代码;其中,所述待处理的二进制代码中包括至少一个指令;确定所述待处理的二进制代码中所包括指令的,属于多个第一预设维度下的指令相关信息;其中,所述第一预设维度表征所述指令相关信息的类别;所述指令相关信息表征所述指令的指令内容;将所述属于多个第一预设维度下的指令相关信息进行汇总处理后,输入至预先训练好的向量生成模型中进行处理,得到所述待处理的二进制代码对应的表示向量。本申请的方法,通过融合二进制代码的语义信息、控制流信息和数据流信息,来提高生成的二进制代码的表示向量的准确度。
-
公开(公告)号:CN114077741A
公开(公告)日:2022-02-22
申请号:CN202111284864.7
申请日:2021-11-01
申请人: 清华大学
摘要: 本发明提供一种软件供应链安全检测方法和装置、电子设备及存储介质,其中所述方法包括:获取待检测二进制文件,提取待检测二进制文件的待分析特征,待分析特征包括函数内特征、函数间特征以及模块间特征;将待分析特征输入至特征向量生成模型,输出与待检测二进制文件对应的至少一个待分析特征向量;获取至少一个待分析特征向量分别与参考文件对应的至少一个参考特征向量之间每两个向量的距离,以得到待检测二进制文件与参考文件之间的相似度;基于相似度,检测出待检测二进制文件与参考文件之间的复用关系。本发明能够检测二进制程序中是否复用了第三方代码、代码缺陷、存在关联的漏洞或恶意代码等供应链安全风险,提高了检测效率、准确率。
-
-