发明公开
摘要:
本发明提供了一种基于时空平滑度分析的水下机器人强化学习控制方法,通过结合时间平滑度和空间平滑度分析,效削弱电机信号中的震荡现象,通过在强化学习基于神经网络的控制器中引入积分补偿器,补偿由于值函数拟合误差带来的稳态误差,从而保证控制的稳定性和精确度。另外,本发明在控制过程中对水下机器人的动力学模型进行动态拟合,并通过动力学模型获得用于强化学习训练的经验数据,通过扩充训练数据的方法提高强化学习算法的学习效率。