基于在线增强学习模型的全流程任务时序智能决策方法

发明授权

CN113379063B 基于在线增强学习模型的全流程任务时序智能决策方法有权

请登陆查看更多内容

专利标题： 基于在线增强学习模型的全流程任务时序智能决策方法
申请号： CN202011331267.0

申请日： 2020-11-24
公开(公告)号： CN113379063B

公开(公告)日： 2024-01-05
发明人: 张旭辉 , 王振亚 , 路鹰 , 郑本昌 , 黄虎 , 任金磊 , 张佳 , 李君 , 吴志壕 , 范佳宣 , 阎岩 , 古月 , 韩特 , 何漫
申请人： 中国运载火箭技术研究院
申请人地址： 北京市丰台区北京9200信箱38分箱
专利权人： 中国运载火箭技术研究院
当前专利权人： 中国运载火箭技术研究院
当前专利权人地址： 北京市丰台区北京9200信箱38分箱
代理机构： 中国航天科技专利中心
代理商 张辉
主分类号： G06N20/00
IPC分类号： G06N20/00 ; G06N3/047 ; G06N3/084 ; G06N3/092 ; G06N7/01 ; G06F18/24

摘要：

基于在线增强学习模型的全流程任务时序智能决策方法，第一步，针对红蓝方对抗推演场景，建立增强学习模型，实现面向场景信息的任务时序决策；第二步，采用在线学习异步训练方法对增强学习模型进行强化学习训练，提升训练的鲁棒性和稳定性；第三步，以红方的全流程任务完成概率为基准，通过融合不同的探测与识别弧段得到全局任务完成概率，作为反馈信息；第四步，以全局任务完成概率作为反馈，完成增强学习模型在功能级干扰对抗决策上的训练和部署。本发明解决了现有技术中存在的红蓝方推演

公开/授权文献

CN113379063A 基于在线增强学习模型的全流程任务时序智能决策方法公开/授权日：2021-09-10

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06N	基于特定计算模型的计算机系统
G06N20/00	机器学习