-
公开(公告)号:CN111708378A
公开(公告)日:2020-09-25
申请号:CN202010572028.8
申请日:2020-06-22
Applicant: 哈尔滨工程大学
IPC: G05D1/10
Abstract: 本发明提供一种基于强化学习的导弹纵向姿态控制算法,属于导弹姿态控制研究领域,基于强化学习的Actor-Critic(AC)结构,由动作网络和评价网络构成。其中,评价网络是根据导弹的状态输出对于导弹状态的评价值,动作网络是根据评价网络输出的评价值产生对应的升降舵偏角,从而实现在不依赖导弹内部模型的情况下对导弹的纵向姿态进行稳定控制。步骤如下:步骤1)建立并确定导弹纵向姿态动力学模型;步骤2)定义导弹攻角的跟踪误差,同时建立与误差有关的性能指标;步骤3)设计评价网络;步骤4)设计动作网络;步骤5)设计评价网络权值更新律;步骤6)设计动作网络权值更新律。本发明主要应用于导弹纵向姿态控制。
-
公开(公告)号:CN111708378B
公开(公告)日:2023-01-03
申请号:CN202010572028.8
申请日:2020-06-22
Applicant: 哈尔滨工程大学
IPC: G05D1/10
Abstract: 本发明提供一种基于强化学习的导弹纵向姿态控制算法,属于导弹姿态控制研究领域,基于强化学习的Actor‑Critic(AC)结构,由动作网络和评价网络构成。其中,评价网络是根据导弹的状态输出对于导弹状态的评价值,动作网络是根据评价网络输出的评价值产生对应的升降舵偏角,从而实现在不依赖导弹内部模型的情况下对导弹的纵向姿态进行稳定控制。步骤如下:步骤1)建立并确定导弹纵向姿态动力学模型;步骤2)定义导弹攻角的跟踪误差,同时建立与误差有关的性能指标;步骤3)设计评价网络;步骤4)设计动作网络;步骤5)设计评价网络权值更新律;步骤6)设计动作网络权值更新律。本发明主要应用于导弹纵向姿态控制。
-