基于在线增强学习模型的全流程任务时序智能决策方法
摘要:
基于在线增强学习模型的全流程任务时序智能决策方法,第一步,针对红蓝方对抗推演场景,建立增强学习模型,实现面向场景信息的任务时序决策;第二步,采用在线学习异步训练方法对增强学习模型进行强化学习训练,提升训练的鲁棒性和稳定性;第三步,以红方的全流程任务完成概率为基准,通过融合不同的探测与识别弧段得到全局任务完成概率,作为反馈信息;第四步,以全局任务完成概率作为反馈,完成增强学习模型在功能级干扰对抗决策上的训练和部署。本发明解决了现有技术中存在的红蓝方推演
0/0