基于分层对比学习的代码特征提取方法及系统
摘要:
本发明公开了基于分层对比学习的代码特征提取方法及系统,包括:获取待处理代码;对待处理代码片段进行解析,生成AST树;对AST树进行嵌入表示得到特征矩阵X,构造AST树的邻接矩阵A;以AST树的每个节点在AST树中的层次编号,建立节点标签;基于节点标签对特征矩阵X进行更新,得到新的特征矩阵X’;将新的特征矩阵X’和邻接矩阵A,输入到训练后的残差自注意力网络模型中,得到待处理代码的特征;通过AST提取程序的语法信息,同时对解析的AST按节点的层次赋予标签进行分类,建立单标签多分类的关系,充分挖掘程序的结构信息,使得生成模型的表达能力更全面更准确。
公开/授权文献
0/0