-
公开(公告)号:CN109067612A
公开(公告)日:2018-12-21
申请号:CN201810769817.3
申请日:2018-07-13
Applicant: 哈尔滨工程大学
CPC classification number: H04L43/026 , G06K9/6223 , H04L43/028 , H04L43/062
Abstract: 本发明属于网络技术领域,具体涉及一种基于增量聚类算法的在线流量识别方法。包括离线识别阶段和在线识别阶段,离线识别阶段将预先准备的训练数据集使用基于改进K均值算法的半监督学习流量算法进行初步的聚类和映射工作,得到初步分类完成的数据集;在线识别阶段基于离线识别阶段所形成的已完成聚类和映射的数据集,对在线新加入的数据流进行增量聚类来判断其网络应用类型,从而达到流量识别的目的。本方法基于机器学习技术,通过构建合适的识别模型对预先准备的数据进行学习,可以实时对在线流量进行增量聚类,结合预先准备的训练集进行初步的半监督分类,可以实现网络流量的在线识别,具有良好的实时性和较高的识别率。