一种融合组合优化与强化学习加速收敛的物流分拣方法
摘要:
本发明公开了一种融合组合优化与强化学习加速收敛的物流分拣方法,包括以下步骤:S1.统计历史班次的包牌所含货物件量比例数据,预测未来班次的货物件量比例数据;S2.通过目标组合优化,获得包牌所占格口数量最优分配;S3.基于分拣机的分拣格口的历史分拣数据,拟合格口处理效率函数;S4.获取包牌类别相似度矩阵和转移概率矩阵;S5.基于包牌类别的相似度和转移概率矩阵设计强化学习策略以及价值网络,构造蒙特卡洛树的叶节点;S6.通过对蒙特卡洛树的叶节点进行展开,获取最优的格口分拣策略。本发明降低分拣计划优化更新的复杂度,加快蒙特卡洛树搜索的搜索速度,实现满足较高时效要求的多目标分拣优化策略。
0/0