-
公开(公告)号:CN112230990A
公开(公告)日:2021-01-15
申请号:CN202011250169.4
申请日:2020-11-10
Applicant: 北京邮电大学
IPC: G06F8/75 , G06F16/2455 , G06Q50/20 , G06N3/04
Abstract: 本发明实施例公开了一种基于层级注意力神经网络的程序代码查重方法。该方法包括如下步骤:搭建代码查重系统步骤,程序代码预处理步骤,基于层级注意力网络的分类模型构建步骤,基于层级注意力网络的程序代码查重模型训练评估及预测步骤。利用本发明实施例,能够将自然语言处理的文本表征技术与程序代码查重任务相结合,提供一种抗干扰能力强、同时提取程序代码特征和程序结构特征、可处理长程序代码并且适用于多种高级语言的程序代码查重方法。