Invention Publication
- Patent Title: 一种基于神经网络的源码分类方法
-
Application No.: CN202211302051.0Application Date: 2022-10-24
-
Publication No.: CN115587318APublication Date: 2023-01-10
- Inventor: 孙雪凯 , 刘春玲 , 林键 , 唐永鹤 , 娄睿 , 戚旭衍 , 刘威 , 董卫宇 , 蒋烈辉 , 井靖 , 王瑞敏 , 王焕伟 , 何红旗 , 刘铁铭 , 刘乐 , 王奕森
- Applicant: 中国人民解放军战略支援部队信息工程大学
- Applicant Address: 河南省郑州市高新区科学大道62号
- Assignee: 中国人民解放军战略支援部队信息工程大学
- Current Assignee: 中国人民解放军网络空间部队信息工程大学
- Current Assignee Address: 450000 河南省郑州市高新区科学大道62号
- Agency: 郑州大通专利商标代理有限公司
- Agent 刘莹莹
- Main IPC: G06F18/24
- IPC: G06F18/24 ; G06N3/08

Abstract:
本发明提供一种基于神经网络的源码分类方法。该方法包括:将待分类源码转换为AST;定义并初始化整个AST叶子节点对应的向量矩阵,记作从AST中随机抽取n条路径{p1,…,pn};针对抽取到的任一条路径pi,可将其转换为二元组 ;从value_vocab中分别查询到当前路径pi上起始节点和末端节点的向量,进而得到当前路径pi的向量ci,记作:ci作为全连接神经网络中的一个神经元的输入,得到对应的输出n条路径{p1,…,pn}对应的n个向量{c1,…,cn}输入到含有n个神经元的全连接神经网络后,得到n个输出将所有的输出聚合为代码嵌入v;定义一个类别标签矩阵,记作将代码嵌入v与tags_vocab中每一个训练函数标签的嵌入进行运算后得到代码嵌入v的预测分布。
Information query