一种运载火箭增强拓扑变异进化神经网络着陆制导方法

    公开(公告)号:CN117029584A

    公开(公告)日:2023-11-10

    申请号:CN202310933038.3

    申请日:2023-07-26

    摘要: 本发明公开了一种运载火箭增强拓扑变异进化神经网络着陆制导方法,该方法为:设置奖励函数,建立运载火箭垂直着陆制导的马尔科夫决策过程模型,搭建运载火箭垂直着陆制导的强化学习环境;结合增强拓扑神经进化算法设置初始的神经网络种群和演化参数,对神经网络结构进行基因编码操作,生成随机初始化神经网络;将神经网络与运载火箭垂直着陆制导的强化学习环境进行多次交互,得到总奖励再取平均作为该神经网络的适应度;保留适应度排名靠前的精英个体,剩余的种群内部之间进行交叉变异,记录适应度低于阈值的种群,增加变异概率;返回上一步对新的种群进行处理;满足终止条件则得到最终的制导网络。本发明能够实现全局优化,具有良好的泛化性。

    一种基于强化学习的飞行器控制方法

    公开(公告)号:CN116699994A

    公开(公告)日:2023-09-05

    申请号:CN202310704882.9

    申请日:2023-06-13

    IPC分类号: G05B13/04

    摘要: 本发明公开了一种基于强化学习的飞行器控制方法,具体为:建立飞行器运动环境,并根据控制目标设计控制性能验证指标;建立马尔可夫决策过程,构建智能控制方式,将控制过程转化为决策过程,搭建强化学习环境,通过神经网络来拟合控制目标与相关自变量关系,在不同的飞行器飞行状态下给出最优解;选择强化学习算法并构建状态空间、动作空间和奖惩函数,进行归一化;设计训练空间,预设控制指令空间并进行训练;根据控制律设计需求,设计基于经典控制的三回路过载驾驶仪,在不同时间段跟踪不同的阶跃过载,并且通过控制性能验证指标来比对性能差异。本发明可以更好的适应飞行器飞行过程中遇到强干扰、大攻角改变等情形,控制效果得到较高提升。

    一种基于深度强化学习的火箭着陆制导方法及系统

    公开(公告)号:CN116697829A

    公开(公告)日:2023-09-05

    申请号:CN202310615988.1

    申请日:2023-05-29

    IPC分类号: F42B15/01

    摘要: 本发明公开了一种基于深度强化学习的火箭着陆制导方法及系统。该方法为:首先根据火箭的六自由度动力学模型搭建仿真环境,建立火箭着陆制导马尔科夫决策过程;然后根据深度强化学习算法,搭建神经网络,并使用训练模块对神经网络进行训练,得到训练好的神经网络模型;接着仿真测试模块调用训练好的神经网络模型进行仿真验证;最后根据仿真测试后的神经网络模型,生成实时控制指令引导火箭着陆飞行。该系统包括环境搭建模块、马尔科夫决策模块、算法模块、训练模块、仿真测试和控制模块。本发明算法效率高,在模型存在一定偏差的情况下,具备泛化能力,能够满足着陆精度要求,燃料消耗低,对可回收运载火箭的自主着陆,具有很好的应用价值。

    一种基于深度强化学习的来袭导弹防御对抗系统及方法

    公开(公告)号:CN115562007A

    公开(公告)日:2023-01-03

    申请号:CN202211147804.5

    申请日:2022-09-20

    IPC分类号: G05B13/04

    摘要: 本发明公开了一种基于深度强化学习的来袭导弹防御对抗系统及方法。该系统包括模型搭建模块、马尔科夫决策模块、神经网络创建模块、训练模块、仿真验证模块和决策模块。方法为:首先搭建载机、诱饵和来袭导弹的相对运动模型,建立马尔科夫决策过程;然后根据深度强化学习算法,搭建神经网络,并使用训练模块对神经网络进行训练,得到训练好的神经网络模型;接着仿真验证模块调用训练好的神经网络模型进行仿真验证;最后根据仿真验证后的神经网络模型,生成干扰物投放方案和载机机动方案,对来袭导弹进行防御对抗。本发明算法效率高,自主决策能力强,提升飞行器针对典型场景的自主化、自适应智能决策能力,提高了飞行器的战场生存和突防能力。