发明公开
- 专利标题: 基于中间表达的二进制代码开源成分识别方法及系统
-
申请号: CN202310301816.7申请日: 2023-03-13
-
公开(公告)号: CN116432622A公开(公告)日: 2023-07-14
- 发明人: 万振华 , 胡佳豪 , 蒋建春 , 程泽凯
- 申请人: 深圳开源互联网安全技术有限公司 , 中国科学院软件研究所
- 申请人地址: 广东省深圳市龙华区民治街道民乐社区星河WORLD二期E栋401-405;
- 专利权人: 深圳开源互联网安全技术有限公司,中国科学院软件研究所
- 当前专利权人: 深圳开源互联网安全技术有限公司,中国科学院软件研究所
- 当前专利权人地址: 广东省深圳市龙华区民治街道民乐社区星河WORLD二期E栋401-405;
- 代理机构: 广州三环专利商标代理有限公司
- 代理商 赵贯杰
- 主分类号: G06F40/194
- IPC分类号: G06F40/194 ; G06N3/0455 ; G06F8/41 ; G06F8/53
摘要:
本发明公开了一种基于中间表达的二进制代码开源成分识别方法及系统,其包括:将开源组件库中的开源组件的源代码转换为二进制文件,并抽取和存储转换过程中的中间表达式,以获得基础数据库;将待检测的二进制的目标文件反编译为中间表达式,以获得目标数据;通过第一神经网络模型分别对基础数据库中的各个数据以及目标数据进行转换处理,以获得基于高维空间向量表达的源代码向量和目标代码向量;分别计算目标代码向量与每一源代码向量的相似度,以获得相似度值;基于上述方法,通过中间表达式的转换,有效消除了二进制代码文件在进行开源成分检测过程中因编译配置带来的影响,从而提升检测结果的准确性和效率。