一种基于深度强化学习的固定翼无人机群集控制方法
摘要:
本发明公开了一种基于深度强化学习的固定翼无人机群集控制方法,其步骤包括:步骤S1、离线训练阶段:建立随机无人机动力学模型,基于竞争双重Q网络的Q函数评估之后,进行动作选择;所述竞争双重Q网络为D3QN网络;步骤S2、在线执行阶段:构建竞争双重Q网络,并载入训练好的网络模型,所述网络模型和动作选择策略运行在僚机的机载电脑上,长机滚转动作由操控员给出,长机和僚机的自驾仪分别根据各自的滚转动作,直至完成飞行任务。本发明具有较强的实时性和适应性,能够将仿真中训练得到的策略迁移到真实环境等优点。
0/0