一种基于强化学习的航天器自主交会对接制导策略生成方法

发明公开

CN114036631A 一种基于强化学习的航天器自主交会对接制导策略生成方法有权

请登陆查看更多内容

专利标题： 一种基于强化学习的航天器自主交会对接制导策略生成方法
申请号： CN202111231850.9

申请日： 2021-10-22
公开(公告)号： CN114036631A

公开(公告)日： 2022-02-11
发明人: 杨志斌 , 幸林泉 , 肖应民 , 周勇 , 黄志球 , 薛垒
申请人： 南京航空航天大学
申请人地址： 江苏省南京市秦淮区御道街29号
专利权人： 南京航空航天大学
当前专利权人： 南京航空航天大学
当前专利权人地址： 江苏省南京市秦淮区御道街29号
代理机构： 南京苏高专利商标事务所
代理商 颜盈静
主分类号： G06F30/15
IPC分类号： G06F30/15 ; G06F30/27 ; G06N3/04 ; G06N3/08 ; B64G1/24

摘要：

本发明公开了一种基于强化学习的航天器自主交会对接制导策略生成方法，包括：将航天器交会对接过程建模为马尔科夫决策过程模型；采用动态规划算法对马尔科夫决策过程模型进行求解，得到所有状态采取不同动作的得分，生成决策表；将决策表中的所有状态作为训练数据特征，将决策表中所有状态在每个动作下的得分作为训练数据标签，以此构建训练数据；构建神经网络模型，并采用训练数据对神经网络模型进行训练，得到作为决策表的近似表示的神经网络模型；对于某一个状态，通过得到的神经网络模型计算该状态下所有动作的得分，选择得分最大的动作作为最优制导策略；基于最优制导策略，航天器进行自主交会对接。

公开/授权文献

CN114036631B 一种基于强化学习的航天器自主交会对接制导策略生成方法公开/授权日：2024-09-20

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06F	电数字数据处理（基于特定计算模型的计算机系统入G06N）
G06F30/00	计算机辅助设计（CAD）
G06F30/10	.几何设计
G06F30/15	..车辆、飞行器或船只的设计