一种用于机器学习模型训练的优化随机森林参数的方法
Abstract:
本发明公开了一种用于机器学习模型训练的优化随机森林参数的方法,首先将整个蚂蚁种群划分为若干个子种群;然后将每一个子种群对应RDD中的一个分区,并在一个分区中指定独立进化;最后利用迁移算子在各子种群之间交换信息。相比于传统的网格搜索,基于Spark的并行蚁狮算法可以高效找到更优参数组合以提高随机森林的分类精度,且在大数据分布式Spark平台下,寻优计算速度快,加速效果明显,可以作为云计算平台的下一代参数优化器。
Patent Agency Ranking
0/0