基于数据块集成分类的网络流量异常检测方法、设备及存储介质
摘要:
本发明涉及一种基于数据块集成分类的网络流量异常检测方法、设备及存储介质。本发明首先等大小划分数据块,使用基于数据块划分的混合重采样机制获得数据子块,混合重采样技术可以有效地缓解过采样中的过拟合问题以及欠采样中的信息丢失问题。然后使用基于马氏距离的相似度评估方法进行选择性重采样,可以得到一系列类别分布平衡的数据子块。数据块的大小是适应性调整的,通过逐步增加数据块的大小,对比每个数据块上训练出来模型性能均值,从而得到合适的数据块大小。最后使用每个类别分布平衡的网络流量数据训练得到一个基础分类器,从而得到用于网络流量异常检测的集成分类模型,该模型对异常类网络流量数据具有较高的识别率。
0/0