- 专利标题: 一种基于条件互信息和交互信息的多标签特征选择方法
-
申请号: CN202011352442.4申请日: 2020-11-26
-
公开(公告)号: CN112463894A公开(公告)日: 2021-03-09
- 发明人: 蒋文田 , 杨柏林 , 马希骜
- 申请人: 浙江工商大学
- 申请人地址: 浙江省杭州市下沙高教园区学正街18号
- 专利权人: 浙江工商大学
- 当前专利权人: 浙江工商大学
- 当前专利权人地址: 浙江省杭州市下沙高教园区学正街18号
- 代理机构: 杭州奥创知识产权代理有限公司
- 代理商 王佳健
- 主分类号: G06F16/28
- IPC分类号: G06F16/28 ; G06F16/2457
摘要:
本发明公开了一种基于条件互信息和交互信息的多标签特征选择方法。本发明基于条件互信息重新定义特征相关项将已选特征的条件互信息纳入进来。又从特征交互的角度定义标签之间的冗余,将其纳入冗余项,定义了一个多标签特征选择算法,有效地选择特征子集,提高多标签分类模型的性能。其中,所述发明包括:对多标签数据集进行预处理,其中包括缺失值填充,数据离散化等;利用多标签特征选择算法MCIMII对处理过的数据集进行特征筛选,得到筛选后的特征集。将得到的特征数据集输入到MLKNN模型中,得到数据集优化后的MLKNN模型。
公开/授权文献
- CN112463894B 一种基于条件互信息和交互信息的多标签特征选择方法 公开/授权日:2022-05-31