发明公开
CN116245009A 人机策略生成方法
审中-实审
- 专利标题: 人机策略生成方法
-
申请号: CN202211617213.X申请日: 2022-12-15
-
公开(公告)号: CN116245009A公开(公告)日: 2023-06-09
- 发明人: 田径 , 刘飞阳 , 石添介 , 冯雨歆 , 赵一煊 , 文敏华
- 申请人: 中国航空工业集团公司西安航空计算技术研究所
- 申请人地址: 陕西省西安市高新区锦业二路15号
- 专利权人: 中国航空工业集团公司西安航空计算技术研究所
- 当前专利权人: 中国航空工业集团公司西安航空计算技术研究所
- 当前专利权人地址: 陕西省西安市高新区锦业二路15号
- 代理机构: 北京清大紫荆知识产权代理有限公司
- 代理商 林政
- 主分类号: G06F30/27
- IPC分类号: G06F30/27 ; G06F18/25 ; G06N3/04 ; G06N3/08
摘要:
本公开实施例中提供了一种人机策略生成方法,针对多智能体博弈场景,采用Minimax与DQN相结合的方法,构建神经网络来逼近值函数;改进网络结构,通过dropout采样的方式对模型的认知不确定性进行建模,继续训练神经网络使其趋于稳定;构建教师学生网络对模型的偶然不确定性进行自监督学习;推理阶段使用划定可信度阈值的方法实现高可信度空战博弈;在推理时记录不确定度高的场景进行多次迭代训练以获得更高性能模型。通过本申请的处理方案,生成策略的同时能够对模型的不确定性进行量化,进而构建更具安全性的空战博弈策略生成系统。