一种基于改进Sarsa算法的路径规划方法
摘要:
一种基于改进Sarsa算法的路径规划方法,属于强化学习和路径规划领域。本发明为了解决基于传统Sarsa算法的路径规划过程存在规划收敛速度较慢、规划效率较低的问题。本发明针对于待进行路径规划的区域建立地图模型,引入路径矩阵P(s,a),在智能体探索的过程中,动态调整贪婪因子ε,采用ε‑greedy策略进行动作选择,智能体采取动作a后,环境会反馈一个奖励R并进入到下一个状态s′;并基于路径矩阵更新Q值表,从而基于改进的Sarsa算法实现路径规划。主要用于机器人的路径规划。
公开/授权文献
0/0