一种耦合Boruta算法与相关性分析的指标遴选方法
摘要:
本发明公开了一种耦合Boruta算法与相关性分析的指标筛选方法,包括S1、根据已有数据进行预处理,生成包含因变量和多个待筛选自变量的数据集;S2、对自变量数据集中的n个指标进行Boruta重要性排序,删除不重要指标;S3、对余下的指标进行相关性分析,设定多个相关系数的阈值r;S4、针对每一个相关系数的阈值r,从最重要的指标开始,删除与其相关系数大于选定阈值的所有其他指标;选择未被删除的第二重要指标,重复该步骤依次筛选,直至完成最后一个指标的筛选,删选出的指标构成该阈值r对应的指标集;S5、采用每一个阈值对应遴选出的指标集作为参数建立模型;S6、根据模型精度选择最终的指标集。该方法具有遴选重要指标和避免多重共线性问题的优点。
0/0