一种基于条件互信息和交互信息的多标签特征选择方法
摘要:
本发明公开了一种基于条件互信息和交互信息的多标签特征选择方法。本发明基于条件互信息重新定义特征相关项将已选特征的条件互信息纳入进来。又从特征交互的角度定义标签之间的冗余,将其纳入冗余项,定义了一个多标签特征选择算法,有效地选择特征子集,提高多标签分类模型的性能。其中,所述发明包括:对多标签数据集进行预处理,其中包括缺失值填充,数据离散化等;利用多标签特征选择算法MCIMII对处理过的数据集进行特征筛选,得到筛选后的特征集。将得到的特征数据集输入到MLKNN模型中,得到数据集优化后的MLKNN模型。
0/0