- 专利标题: 基于在线增强学习模型的全流程任务时序智能决策方法
-
申请号: CN202011331267.0申请日: 2020-11-24
-
公开(公告)号: CN113379063B公开(公告)日: 2024-01-05
- 发明人: 张旭辉 , 王振亚 , 路鹰 , 郑本昌 , 黄虎 , 任金磊 , 张佳 , 李君 , 吴志壕 , 范佳宣 , 阎岩 , 古月 , 韩特 , 何漫
- 申请人: 中国运载火箭技术研究院
- 申请人地址: 北京市丰台区北京9200信箱38分箱
- 专利权人: 中国运载火箭技术研究院
- 当前专利权人: 中国运载火箭技术研究院
- 当前专利权人地址: 北京市丰台区北京9200信箱38分箱
- 代理机构: 中国航天科技专利中心
- 代理商 张辉
- 主分类号: G06N20/00
- IPC分类号: G06N20/00 ; G06N3/047 ; G06N3/084 ; G06N3/092 ; G06N7/01 ; G06F18/24
摘要:
基于在线增强学习模型的全流程任务时序智能决策方法,第一步,针对红蓝方对抗推演场景,建立增强学习模型,实现面向场景信息的任务时序决策;第二步,采用在线学习异步训练方法对增强学习模型进行强化学习训练,提升训练的鲁棒性和稳定性;第三步,以红方的全流程任务完成概率为基准,通过融合不同的探测与识别弧段得到全局任务完成概率,作为反馈信息;第四步,以全局任务完成概率作为反馈,完成增强学习模型在功能级干扰对抗决策上的训练和部署。本发明解决了现有技术中存在的红蓝方推演
公开/授权文献
- CN113379063A 基于在线增强学习模型的全流程任务时序智能决策方法 公开/授权日:2021-09-10