-
公开(公告)号:CN115412295A
公开(公告)日:2022-11-29
申请号:CN202210871377.9
申请日:2022-07-22
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , H04L43/04 , H04L43/0876 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于大规模预训练的多场景低资源加密流量识别方法和系统。本发明通过自监督学习掩码任务、BURST同源任务以挖掘有效通用加密流量知识,并结合低资源下多场景的微调学习表征每个场景下对应不同类别的加密流量,可以实现高效地在多场景加密流量识别任务中迁移应用,而不依赖明文信息和大量标注样本;同时作为一种端到端方法,无需手动提取特征集。本发明能够解决现有多场景低资源加密流量识别方法存在的特征工程繁杂、受标注样本数量影响大、无法直接迁移到多场景进而导致识别效果受限的问题。
-
公开(公告)号:CN118523943A
公开(公告)日:2024-08-20
申请号:CN202410708254.2
申请日:2024-06-03
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , G06F18/214 , G06N3/0455 , G06N3/0895 , G06N3/096
Abstract: 本发明公开一种基于对比学习预训练的不均衡加密流量识别方法及系统,属网络流量分析技术领域。所述方法包括:对无标注的不均衡加密流量进行会话流提取,并生成会话流的流量表示;构造由会话流的流量表示组成的正负对三元组,并分别基于所述正负对三元组和所述会话流的流量表示进行对比学习的自监督训练和掩码预测的自监督训练,以生成预训练的不均衡加密流量识别模型;利用无标注的不均衡加密流量和带标注的不均衡加密流量对预训练的不均衡加密流量识别模型进行微调,得到训练好的不均衡加密流量识别模型;基于训练好的不均衡加密流量识别模型完成不均衡加密流量的识别任务。本发明可以解决数据不平衡带来的少样本类误分问题。
-