一种基于深度强化学习的AGV路径规划方法
Abstract:
本发明公开了一种基于深度强化学习的AGV路径规划方法,包括以下过程:估值网络、目标网络、环境、经验池初始化;路径规划开始;智能体agent与环境交互,在St下得到at;得到奖励rt,更新状态,得到St+1,将St、at、rt、St+1放入回放池中;从回放池中随机抽取一组St、at、rt、St+1;优化损失函数;更新估值网络Q;将此时的估值网络设定为新目标网络;路径规划结束。采用上述技术方案,采用基于深度强化学习的AGV路径规划方法,对于复杂未知的环境,AGV系统可以自寻优的寻找较优的路径,进一步提高AGV系统的工作效率,提高AGV路径规划的环境适应能力。
Patent Agency Ranking
0/0