- 专利标题: 基于分层对比学习的代码特征提取方法及系统
-
申请号: CN202110411676.X申请日: 2021-04-16
-
公开(公告)号: CN113238797B公开(公告)日: 2024-10-15
- 发明人: 吕晨 , 王潇 , 高学剑 , 吴琼 , 马正 , 高曰秀 , 李季 , 吕蕾 , 刘弘
- 申请人: 山东师范大学
- 申请人地址: 山东省济南市历下区文化东路88号
- 专利权人: 山东师范大学
- 当前专利权人: 山东师范大学
- 当前专利权人地址: 山东省济南市历下区文化东路88号
- 代理机构: 济南圣达知识产权代理有限公司
- 代理商 黄海丽
- 主分类号: G06F8/73
- IPC分类号: G06F8/73 ; G06F8/41 ; G06N3/042 ; G06N3/0464 ; G06N3/045 ; G06N3/0895
摘要:
本发明公开了基于分层对比学习的代码特征提取方法及系统,包括:获取待处理代码;对待处理代码片段进行解析,生成AST树;对AST树进行嵌入表示得到特征矩阵X,构造AST树的邻接矩阵A;以AST树的每个节点在AST树中的层次编号,建立节点标签;基于节点标签对特征矩阵X进行更新,得到新的特征矩阵X';将新的特征矩阵X'和邻接矩阵A,输入到训练后的残差自注意力网络模型中,得到待处理代码的特征;通过AST提取程序的语法信息,同时对解析的AST按节点的层次赋予标签进行分类,建立单标签多分类的关系,充分挖掘程序的结构信息,使得生成模型的表达能力更全面更准确。
公开/授权文献
- CN113238797A 基于分层对比学习的代码特征提取方法及系统 公开/授权日:2021-08-10