一种水下自主航行器在大尺度连续性障碍物环境中路径规划避障控制方法
Abstract:
本发明是一种水下自主航行器在大尺度连续性障碍物环境中路径规划避障控制方法。本发明涉及水下机器人路径避障规划技术领域,本发明建立存在大尺度连续性障碍物模拟训练环境,以避障传感器信息为输入,航行速度和偏航角速度为输出搭建深度强化学习神经网络的状态与动作,针对运动规划避障控制过程的多目标结构,对奖赏函数进行了模块化设计,为了避免稀疏奖励引起系统不稳定,结合人工势场法设置连续性奖励。本发明利用基于改进的深度确定性策略梯度算法,对水下自主航行器进行避障训练,将训练所得到的避障策略写入机器人下位机控制系统;水下自主航行器在水下峡谷中行驶时,利用训练学习到的避障策略进行避障,安全的到达目标区域。
Patent Agency Ranking
0/0