基于Q学习的室内测量机器人多目标点移动路径规划方法
摘要:
本发明提供了一种基于Q学习的室内测量机器人多目标点移动路径规划方法,基于强化学习中一种与模型无关的Q学习算法,在回报函数中设定符合测量机器人的移动策略用于机器人实践学习,利用状态、动作、奖励这三个要素,根据测量机器人当前所处状态来采取行动,并记录被反馈的奖励,决策到下个状态时能采取的更优动作,从而实现在测量点数量和位置已知的情况下,测量机器人自动获取一条顺序合理的移动路径。本发明提出的移动路径规划方法能够实现测量机器人在室内环境中多测量点的全局移动规划,帮助测量机器人在进行测量任务过程中“不走冤枉路”,以最快的速度完成工作,大大提高了测量效率。
0/0