一种基于特征选择与密度峰值聚类的异常流量检测方法

    公开(公告)号:CN105577679A

    公开(公告)日:2016-05-11

    申请号:CN201610023675.7

    申请日:2016-01-14

    CPC classification number: H04L63/1425

    Abstract: 本发明公开了一种基于特征选择以及密度峰值聚类的网络流量异常检测方法包括如下阶段:流量采集阶段:通过网络分析工具监听网络,并将监听到的数据包采集到本地;特征提取阶段:从数据包中提取属于同一个流的数据包,对数据包进行特征抽取,并将提取的特征进行归一化;特征选择阶段:利用最大信息系数评估每个特征对分类决策的重要性,再根据特征之间的冗余度对特征进行简单聚类,选择出重要性最高的一个特征加入特征子集;聚类分析阶段:采用改进的基于密度峰值的聚类方法对特征进行聚类得到多个流量类型簇,对每一个流量类型簇进行少量抽样,并进行类别检测,利用抽样样本众数类别的流量类型来覆盖整个流量类型簇的流量类型,以检测出异常流量。

    一种基于特征选择与密度峰值聚类的异常流量检测方法

    公开(公告)号:CN105577679B

    公开(公告)日:2019-02-15

    申请号:CN201610023675.7

    申请日:2016-01-14

    Abstract: 本发明公开了一种基于特征选择以及密度峰值聚类的网络流量异常检测方法包括如下阶段:流量采集阶段:通过网络分析工具监听网络,并将监听到的数据包采集到本地;特征提取阶段:从数据包中提取属于同一个流的数据包,对数据包进行特征抽取,并将提取的特征进行归一化;特征选择阶段:利用最大信息系数评估每个特征对分类决策的重要性,再根据特征之间的冗余度对特征进行简单聚类,选择出重要性最高的一个特征加入特征子集;聚类分析阶段:采用改进的基于密度峰值的聚类方法对特征进行聚类得到多个流量类型簇,对每一个流量类型簇进行少量抽样,并进行类别检测,利用抽样样本众数类别的流量类型来覆盖整个流量类型簇的流量类型,以检测出异常流量。

    一种基于PAM聚类算法的网络异常流量检测方法

    公开(公告)号:CN106101102B

    公开(公告)日:2019-07-26

    申请号:CN201610416192.3

    申请日:2016-06-15

    Inventor: 何道敬 倪谢俊

    Abstract: 本发明公开了一种基于改进PAM聚类算法的网络流量异常检测方法,包括:流量采集阶段:通过网络分析工具监听网络获取网络数据包;特征提取阶段:提取网络数据包的属性,对一时间段内的网络数据包的属性分别进行信息熵值计算,得到多条多维数据记录;中心选择阶段:根据多维数据记录采用PAM聚类方法对网络数据包的数据点进行聚类,获取近似聚类中心后,通过近似聚类中心选择精确聚类中心;离群点判定阶段:设定阈值,筛选出精确聚类中心距离和局部利群因子均高于阈值的数据点得到离群的异常数据。该方法将改进的PAM聚类算法运用到异常流量检测中去,在继承了聚类无需标记的优势的同时,也降低算法需要的运行时间,具备处理更多数据的能力。

    一种基于PAM聚类算法的网络异常流量检测方法

    公开(公告)号:CN106101102A

    公开(公告)日:2016-11-09

    申请号:CN201610416192.3

    申请日:2016-06-15

    Inventor: 何道敬 倪谢俊

    Abstract: 本发明公开了一种基于改进PAM聚类算法的网络流量异常检测方法,包括:流量采集阶段:通过网络分析工具监听网络获取网络数据包;特征提取阶段:提取网络数据包的属性,对一时间段内的网络数据包的属性分别进行信息熵值计算,得到多条多维数据记录;中心选择阶段:根据多维数据记录采用PAM聚类方法对网络数据包的数据点进行聚类,获取近似聚类中心后,通过近似聚类中心选择精确聚类中心;离群点判定阶段:设定阈值,筛选出精确聚类中心距离和局部利群因子均高于阈值的数据点得到离群的异常数据。该方法将改进的PAM聚类算法运用到异常流量检测中去,在继承了聚类无需标记的优势的同时,也降低算法需要的运行时间,具备处理更多数据的能力。

Patent Agency Ranking