Invention Publication
- Patent Title: 基于中间表达的二进制代码开源成分识别方法及系统
-
Application No.: CN202310301816.7Application Date: 2023-03-13
-
Publication No.: CN116432622APublication Date: 2023-07-14
- Inventor: 万振华 , 胡佳豪 , 蒋建春 , 程泽凯
- Applicant: 深圳开源互联网安全技术有限公司 , 中国科学院软件研究所
- Applicant Address: 广东省深圳市龙华区民治街道民乐社区星河WORLD二期E栋401-405;
- Assignee: 深圳开源互联网安全技术有限公司,中国科学院软件研究所
- Current Assignee: 深圳开源互联网安全技术有限公司,中国科学院软件研究所
- Current Assignee Address: 广东省深圳市龙华区民治街道民乐社区星河WORLD二期E栋401-405;
- Agency: 广州三环专利商标代理有限公司
- Agent 赵贯杰
- Main IPC: G06F40/194
- IPC: G06F40/194 ; G06N3/0455 ; G06F8/41 ; G06F8/53

Abstract:
本发明公开了一种基于中间表达的二进制代码开源成分识别方法及系统,其包括:将开源组件库中的开源组件的源代码转换为二进制文件,并抽取和存储转换过程中的中间表达式,以获得基础数据库;将待检测的二进制的目标文件反编译为中间表达式,以获得目标数据;通过第一神经网络模型分别对基础数据库中的各个数据以及目标数据进行转换处理,以获得基于高维空间向量表达的源代码向量和目标代码向量;分别计算目标代码向量与每一源代码向量的相似度,以获得相似度值;基于上述方法,通过中间表达式的转换,有效消除了二进制代码文件在进行开源成分检测过程中因编译配置带来的影响,从而提升检测结果的准确性和效率。
Information query