-
公开(公告)号:CN112001484A
公开(公告)日:2020-11-27
申请号:CN202010853000.1
申请日:2020-08-22
Applicant: 哈尔滨工业大学
IPC: G06N3/04 , G06N3/08 , G06K9/62 , G06F40/284 , G06F16/35
Abstract: 本发明公开了一种基于多任务深度学习的安全缺陷报告预测方法,首先挖掘缺陷报告仓库以及安全漏洞管理网站,构造多任务学习数据集。对数据集中缺陷报告的文本内容进行预处理,生成专业语料库,并利用其训练word2vec模型。建立多任务深度学习模型,利用模型底层的深度神经网络提取缺陷报告的共享语义特征,利用高层的各个子网络学习针对不同任务的具有分辨力的特征,最后将高层网络输出的特征向量作为各子任务预测网络的输入,完成安全缺陷报告识别和严重级别预测任务。本发明首次将多任务学习用于安全缺陷报告预测,利用与目标任务相关的辅助任务信息,引导模型学习到有更强泛化能力的特征,能够提高模型的泛化能力,降低噪音数据的影响。