一种基于强化学习的飞行器智能协同对抗决策方法和系统
摘要:
本发明公开了一种基于强化学习的飞行器智能协同对抗决策方法和系统,该方法包括观测值设计:对不同机型的飞行动力学以及武器、雷达等进行仿真建模;动作空间设计:设计每架飞行器的动作空间,包括目标飞行器编号和四个航向做出的指令值,所述指令动作值包括迎角、滚转角、油门量;回报函数设计:设计存货奖励、距离奖励/惩罚和雷达锁定项;强化学习环境设计:采用训练模式和应用模式进行飞行器及对抗方的动态控制,并实现状态、动作和奖励值的数据接口功能;本发明定制飞行器智能协同对抗决策系统,目标函数合理,经过一定的训练之后具有显著的效果,能够保证模型和算法的有效性,可用于飞行器制定合适的对抗策略。
0/0