一种基于深度强化学习的作战策略优化方法及系统
摘要:
本发明公开了一种基于深度强化学习的作战策略优化方法及系统,该方法包括:构建高超声速滑翔弹模型,确定导弹的当前状态;构建神经网络模型,神经网络模型的输入为突防环境,输出为动作集;根据突防环境,基于神经网络模型,得到预测动作集;根据当前状态以及预测动作集,计算导弹的下一步状态并更新高超声速滑翔弹模型;采用Minimax算法计算敌方状态;根据下一步状态以及敌方状态计算奖惩函数;根据奖惩函数优化神经网络模型;基于优化后的神经网络模型得到最优作战策略。本发明具有短距离精确操作和长期规划预测的能力,推演效果符合预期,同时其具有较强的实时决策能力,可以很大程度的提高突防成功的概率,可作为滑翔弹突防的决策依据。
0/0