-
公开(公告)号:CN116432622A
公开(公告)日:2023-07-14
申请号:CN202310301816.7
申请日:2023-03-13
申请人: 深圳开源互联网安全技术有限公司 , 中国科学院软件研究所
IPC分类号: G06F40/194 , G06N3/0455 , G06F8/41 , G06F8/53
摘要: 本发明公开了一种基于中间表达的二进制代码开源成分识别方法及系统,其包括:将开源组件库中的开源组件的源代码转换为二进制文件,并抽取和存储转换过程中的中间表达式,以获得基础数据库;将待检测的二进制的目标文件反编译为中间表达式,以获得目标数据;通过第一神经网络模型分别对基础数据库中的各个数据以及目标数据进行转换处理,以获得基于高维空间向量表达的源代码向量和目标代码向量;分别计算目标代码向量与每一源代码向量的相似度,以获得相似度值;基于上述方法,通过中间表达式的转换,有效消除了二进制代码文件在进行开源成分检测过程中因编译配置带来的影响,从而提升检测结果的准确性和效率。