一种四旋翼无人机积分补偿确定性策略梯度控制方法
摘要:
本专利公开了一种四旋翼无人机积分补偿确定性策略梯度控制方法。本发明使用深度神经网络对四旋翼无人机的控制器进行表示,将四旋翼无人机的运动状态通过深度神经网络直接映射到四个电机的控制指令,使用机器学习算法根据奖励反馈信号对深度神经网络进行训练,最终获得满足控制需求的控制器。本方法可以直接使用带有复杂非线性特性的四旋翼无人机数学模型进行训练,通过引入积分补偿机制结合确定性策略梯度算法进行训练,可以提高训练得到的控制器的鲁棒性和精确性。
0/0