发明公开
- 专利标题: 一种耦合Boruta算法与相关性分析的指标遴选方法
-
申请号: CN202410349941.X申请日: 2024-03-26
-
公开(公告)号: CN118410320A公开(公告)日: 2024-07-30
- 发明人: 韩小乐 , 沈旭辉 , 刘金涛 , 吴鹏飞 , 倪飞宇
- 申请人: 河海大学
- 申请人地址: 江苏省南京市鼓楼区西康路1号
- 专利权人: 河海大学
- 当前专利权人: 河海大学
- 当前专利权人地址: 江苏省南京市鼓楼区西康路1号
- 代理机构: 南京千语知识产权代理事务所
- 代理商 尚于杰
- 主分类号: G06F18/2113
- IPC分类号: G06F18/2113 ; G06F18/27 ; G06F18/214 ; G06F18/21 ; G06N5/01 ; G06N3/0499
摘要:
本发明公开了一种耦合Boruta算法与相关性分析的指标筛选方法,包括S1、根据已有数据进行预处理,生成包含因变量和多个待筛选自变量的数据集;S2、对自变量数据集中的n个指标进行Boruta重要性排序,删除不重要指标;S3、对余下的指标进行相关性分析,设定多个相关系数的阈值r;S4、针对每一个相关系数的阈值r,从最重要的指标开始,删除与其相关系数大于选定阈值的所有其他指标;选择未被删除的第二重要指标,重复该步骤依次筛选,直至完成最后一个指标的筛选,删选出的指标构成该阈值r对应的指标集;S5、采用每一个阈值对应遴选出的指标集作为参数建立模型;S6、根据模型精度选择最终的指标集。该方法具有遴选重要指标和避免多重共线性问题的优点。