一种基于TD3算法的深度强化学习制导律

    公开(公告)号:CN115639746A

    公开(公告)日:2023-01-24

    申请号:CN202210938319.3

    申请日:2022-08-05

    发明人: 胡哲 易文俊

    IPC分类号: G05B13/04

    摘要: 本发明公开一种基于TD3算法的深度强化学习制导律。包括如下步骤:(1):建立导弹与目标的相对运动模型;(2):设计马尔可夫决策过程;(3):构建深度强化学习制导律的网络模型;将构建好的模型进行离线训练,然后利用训练好的网络模型来进行法向加速度的输出;设计马尔可夫决策过程,将视线角速率作为状态空间,将法向加速度作为动作空间,然后在利用确定性策略梯度原理,寻找最优的神经网络参数,然后利用训练好的神经参数,实现从视线角速率到法向加速度的直接映射。

    基于施瓦尔兹不等式的飞行器避障方法

    公开(公告)号:CN110716581B

    公开(公告)日:2022-12-27

    申请号:CN201910965249.9

    申请日:2019-10-11

    IPC分类号: G05D1/10

    摘要: 本发明提出了一种基于施瓦尔兹不等式的飞行器避障方法,具体步骤为:建立包含飞行器与障碍物在内的纵平面避障坐标系,确定纵平面避障坐标系下飞行器与障碍物坐标;确定飞行器与障碍物相对距离以及避障剩余飞行时间;按照飞行器执行机构的响应频率实时解算法向过载指令,飞行器执行机构根据法向过载指令工作,直至避障成功。本发明需感知的外界信息少:避障过程种飞行器只需获取障碍物相对位置坐标信息即可。

    基于施瓦尔兹不等式的飞行器避障方法

    公开(公告)号:CN110716581A

    公开(公告)日:2020-01-21

    申请号:CN201910965249.9

    申请日:2019-10-11

    IPC分类号: G05D1/10

    摘要: 本发明提出了一种基于施瓦尔兹不等式的飞行器避障方法,具体步骤为:建立包含飞行器与障碍物在内的纵平面避障坐标系,确定纵平面避障坐标系下飞行器与障碍物坐标;确定飞行器与障碍物相对距离以及避障剩余飞行时间;按照飞行器执行机构的响应频率实时解算法向过载指令,飞行器执行机构根据法向过载指令工作,直至避障成功。本发明需感知的外界信息少:避障过程种飞行器只需获取障碍物相对位置坐标信息即可。