-
公开(公告)号:CN114815864B
公开(公告)日:2024-08-20
申请号:CN202210346557.5
申请日:2022-03-31
Applicant: 哈尔滨工程大学
IPC: G05D1/46 , G05D109/28
Abstract: 本发明公开了一种基于强化学习的高超声速飞行器航迹规划方法,本发明根据航迹规划分2个阶段:离线训练阶段,训练一个不依赖于固定环境的RL智能体作为航迹规划的基线策略;在线规划阶段,RL‑CEM利用环境模拟器预测未来的状态进行规划,之后选择优于基线策略的策略作为执行策略,否则将使用基线策略。本发明提出的RL‑CEM不仅有效地回避航迹规划中的局部最优,还展现出了令人满意的成功率。RL‑CEM弥补了以往基于RL的航迹规划方法容易陷入局部最优、规划失败时无替代方案的缺点。本发明的航迹规划方法回避了高超声速飞行器复杂的动力学,仅通过其运动学来解决该问题。
-
公开(公告)号:CN114815864A
公开(公告)日:2022-07-29
申请号:CN202210346557.5
申请日:2022-03-31
Applicant: 哈尔滨工程大学
IPC: G05D1/08
Abstract: 本发明公开了一种基于强化学习的高超声速飞行器航迹规划方法,本发明根据航迹规划分2个阶段:离线训练阶段,训练一个不依赖于固定环境的RL智能体作为航迹规划的基线策略;在线规划阶段,RL‑CEM利用环境模拟器预测未来的状态进行规划,之后选择优于基线策略的策略作为执行策略,否则将使用基线策略。本发明提出的RL‑CEM不仅有效地回避航迹规划中的局部最优,还展现出了令人满意的成功率。RL‑CEM弥补了以往基于RL的航迹规划方法容易陷入局部最优、规划失败时无替代方案的缺点。本发明的航迹规划方法回避了高超声速飞行器复杂的动力学,仅通过其运动学来解决该问题。
-