-
公开(公告)号:CN117235719A
公开(公告)日:2023-12-15
申请号:CN202210647361.X
申请日:2022-06-08
Applicant: 国家电网有限公司信息通信分公司 , 北京邮电大学
Abstract: 本发明公开一种基于GAN的恶意代码检测模型抗混淆训练方法,利用sinGAN对小样本的恶意代码混淆样本灰度图像进行数据增强,并利用数据增强后的样本对检测模型进行抗混淆训练。包括:训练恶意代码混淆样本生成器,使用少量的恶意代码混淆文件的灰度图像训练sinGAN,为每个恶意代码混淆样本训练一个生成器和判别器;抗混淆训练:利用训练好的生成器和判别器,随机输入高斯噪声就可以得到若干不同的新的灰度图像,使用这些图像和训练好的生成器对恶意代码检测模型进行抗混淆训练,最终得到一个经过抗混淆训练后的恶意代码检测器;本发明构造的数据增强方法相比于原始数据和普通的数据的增强方法,提供了更好的思路。
-
公开(公告)号:CN114238977A
公开(公告)日:2022-03-25
申请号:CN202111588156.2
申请日:2021-12-23
Applicant: 国家电网有限公司 , 国家电网有限公司信息通信分公司 , 国网山东省电力公司信息通信公司 , 北京邮电大学
IPC: G06F21/56 , G06V10/764 , G06V10/77 , G06V10/774 , G06K9/62
Abstract: 近几年来,恶意代码的数量在不断上升,恶意代码的溯源问题日益凸显。而目前主流的将恶意代码转换成图片,进而使用图像分类的对恶意代码进行分类的方法,需要对恶意代码进行裁剪以及变换,从而将恶意代码转换为二维的图像。这种方法会损失恶意代码作为一维数据本身的部分信息,并且一个强行设置的图像宽度可能会导致恶意代码本身的语义截断问题。针对以上问题,本发明提出了一种将efficient‑net和1d‑cnn相融合的恶意代码分类模型,将恶意代码的二进制文件分别转换为1维矢量和图像后,分别输入两个网络,将其特征图进行了金字塔融合。这种方法既保存了恶意代码的纹理特征,同时也让恶意代码本身的一维特征得以保存,从而在爬取的38个恶意代码家族的数据集和Malimg上表现出了较好的性能,表明拟议的恶意代码家族分类方法具有更高的可靠性。
-