• Patent Title: 一种基于强化学习的导弹纵向姿态控制算法
  • Application No.: CN202010572028.8
    Application Date: 2020-06-22
  • Publication No.: CN111708378A
    Publication Date: 2020-09-25
  • Inventor: 池海红于馥睿刘兴一周明鑫
  • Applicant: 哈尔滨工程大学
  • Applicant Address: 黑龙江省哈尔滨市南岗区南通大街145号哈尔滨工程大学科技处知识产权办公室
  • Assignee: 哈尔滨工程大学
  • Current Assignee: 哈尔滨工程大学
  • Current Assignee Address: 黑龙江省哈尔滨市南岗区南通大街145号哈尔滨工程大学科技处知识产权办公室
  • Main IPC: G05D1/10
  • IPC: G05D1/10
一种基于强化学习的导弹纵向姿态控制算法
Abstract:
本发明提供一种基于强化学习的导弹纵向姿态控制算法,属于导弹姿态控制研究领域,基于强化学习的Actor-Critic(AC)结构,由动作网络和评价网络构成。其中,评价网络是根据导弹的状态输出对于导弹状态的评价值,动作网络是根据评价网络输出的评价值产生对应的升降舵偏角,从而实现在不依赖导弹内部模型的情况下对导弹的纵向姿态进行稳定控制。步骤如下:步骤1)建立并确定导弹纵向姿态动力学模型;步骤2)定义导弹攻角的跟踪误差,同时建立与误差有关的性能指标;步骤3)设计评价网络;步骤4)设计动作网络;步骤5)设计评价网络权值更新律;步骤6)设计动作网络权值更新律。本发明主要应用于导弹纵向姿态控制。
Public/Granted literature
Patent Agency Ranking
0/0