一种基于机器学习的数据流分类方法及系统
摘要:
本发明公开了一种基于机器学习的数据流分类方法,包括:步骤1)捕获并根据输入规则过滤网络上的数据流,获取符合条件的数据包;步骤2)根据数据包的五元组信息建立数据流,结合其反向的数据流建立应用流,提取指定的应用流特征信息,记录在应用流流表中;步骤3)检测应用流是否完成交互过程;如果已完成,则将应用流特征信息封装成特征向量,调用机器学习分类器进行分类得到标签La,进入步骤4),否则,将所述应用流的分类结果标识为“未知应用”;步骤4)查找当前应用流所属的关联信息表,结合表内历史应用流的机器学习分类信息决定当前应用流的最终分类结果。本发明的方法能够有效提升当前数据流的分类准确性。
公开/授权文献
0/0