一种自适应局部环境变化的救援机器人轨迹规划方法
摘要:
本发明涉及一种自适应局部环境变化的救援机器人轨迹规划方法,包括以下步骤:确定救援机器人的引导路线,并根据途径区域是否受到灾害的持续影响将地图划分为静态区域和动态区域;构建用于救援机器人轨迹规划的强化学习网络,所述强化学习网络在静态区域基于效率奖励函数引导网络,以保证救援机器人的行驶效率,在动态区域基于自适应奖励函数引导网络,以应对变化的受灾区域;通过网络与环境的不断交互,利用强化学习网络生成救援机器人规划轨迹。与现有技术相比,本发明通过精细设计的差异化多目标奖励优化强化学习,在保证救援机器人作业效率的情况下,显著的提高了在局部受灾区域变化情况下的完成概率。
0/0