一种基于特征效率的加密流量分析特征选择方法
摘要:
本发明公开了一种基于特征效率的加密流量分析特征选择方法,首先定义特征效率的计算方法F(f);然后两类样本上计算每个特征的特征效率,选择特征效率最大的一维特征,并且移除这维特征的值域交叠之外的样本,并记录移除的样本个数,如此循环,直到所有特征被计算完。然后根据预先规定的特征个数或者特征效率的阈值选择特征。本发明能够在给定最大特征集的前提下,有效的计算每个特征的特征效率,根据给定的特征效率阈值或者规定的特征数目筛选特征,有利于提高网站指纹识别技术的识别准确率,并且节省分类模型构建过程中消耗的时间和空间成本。
0/0