发明公开
- 专利标题: 基于TD3多经验池强化学习的飞行器免解耦姿态控制方法
-
申请号: CN202211551858.8申请日: 2022-12-05
-
公开(公告)号: CN115857530A公开(公告)日: 2023-03-28
- 发明人: 贾晨辉 , 柳嘉润 , 黄旭 , 路坤锋 , 冯明涛 , 巩庆海 , 骆无意 , 翟雯婧 , 刘晓东
- 申请人: 北京航天自动控制研究所
- 申请人地址: 北京市海淀区永定路50号
- 专利权人: 北京航天自动控制研究所
- 当前专利权人: 北京航天自动控制研究所
- 当前专利权人地址: 北京市海淀区永定路50号
- 代理机构: 北京佳信天和知识产权代理事务所
- 代理商 张宏伟
- 主分类号: G05D1/08
- IPC分类号: G05D1/08
摘要:
本公开属于航天飞行器控制领域,涉及一种基于TD3多经验池强化学习的飞行器免解耦姿态控制方法,包括:建立飞行器姿态控制任务的马尔可夫过程,确定飞行任务的状态、动作和奖励;采用TD3强化学习算法对行为网络和评价网络进行训练,结合多经验池经验回放算法实现TD3算法中所有神经网络的快速收敛;将TD3算法训练好的行为网络作为神经网络控制器部署到飞行器中实现飞行器的免解耦姿态控制。通过上述算法,可以实现一个多通道免解耦的神经网络姿态控制器的训练,实现算法训练过程较快收敛,且训练出来的控制器对环境噪声及飞行器本体不确定性具有较强的适应能力。