基于TD3多经验池强化学习的飞行器免解耦姿态控制方法

发明公开

CN115857530A 基于TD3多经验池强化学习的飞行器免解耦姿态控制方法审中-实审

请登陆查看更多内容

专利标题： 基于TD3多经验池强化学习的飞行器免解耦姿态控制方法
申请号： CN202211551858.8

申请日： 2022-12-05
公开(公告)号： CN115857530A

公开(公告)日： 2023-03-28
发明人: 贾晨辉 , 柳嘉润 , 黄旭 , 路坤锋 , 冯明涛 , 巩庆海 , 骆无意 , 翟雯婧 , 刘晓东
申请人： 北京航天自动控制研究所
申请人地址： 北京市海淀区永定路50号
专利权人： 北京航天自动控制研究所
当前专利权人： 北京航天自动控制研究所
当前专利权人地址： 北京市海淀区永定路50号
代理机构： 北京佳信天和知识产权代理事务所
代理商 张宏伟
主分类号： G05D1/08
IPC分类号： G05D1/08

摘要：

本公开属于航天飞行器控制领域，涉及一种基于TD3多经验池强化学习的飞行器免解耦姿态控制方法，包括：建立飞行器姿态控制任务的马尔可夫过程，确定飞行任务的状态、动作和奖励；采用TD3强化学习算法对行为网络和评价网络进行训练，结合多经验池经验回放算法实现TD3算法中所有神经网络的快速收敛；将TD3算法训练好的行为网络作为神经网络控制器部署到飞行器中实现飞行器的免解耦姿态控制。通过上述算法，可以实现一个多通道免解耦的神经网络姿态控制器的训练，实现算法训练过程较快收敛，且训练出来的控制器对环境噪声及飞行器本体不确定性具有较强的适应能力。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G05	控制；调节
G05D	非电变量的控制或调节系统（金属的连续铸造入B22D11/16；阀门本身入F16K；非电变量的检测见G01各有关小类；电或磁变量的调节入G05F）
G05D1/00	陆地、水上、空中或太空中的运载工具的位置、航道、高度或姿态的控制，例如自动驾驶仪（无线电导航系统或使用其他波的类似系统入G01S）
G05D1/08	.姿态的控制，即摇摆、俯仰角或偏航角的控制