人机策略生成方法

发明公开

请登陆查看更多内容

专利标题： 人机策略生成方法
申请号： CN202211617213.X

申请日： 2022-12-15
公开(公告)号： CN116245009A

公开(公告)日： 2023-06-09
发明人: 田径 , 刘飞阳 , 石添介 , 冯雨歆 , 赵一煊 , 文敏华
申请人： 中国航空工业集团公司西安航空计算技术研究所
申请人地址： 陕西省西安市高新区锦业二路15号
专利权人： 中国航空工业集团公司西安航空计算技术研究所
当前专利权人： 中国航空工业集团公司西安航空计算技术研究所
当前专利权人地址： 陕西省西安市高新区锦业二路15号
代理机构： 北京清大紫荆知识产权代理有限公司
代理商 林政
主分类号： G06F30/27
IPC分类号： G06F30/27 ; G06F18/25 ; G06N3/04 ; G06N3/08

摘要：

本公开实施例中提供了一种人机策略生成方法，针对多智能体博弈场景，采用Minimax与DQN相结合的方法，构建神经网络来逼近值函数；改进网络结构，通过dropout采样的方式对模型的认知不确定性进行建模，继续训练神经网络使其趋于稳定；构建教师学生网络对模型的偶然不确定性进行自监督学习；推理阶段使用划定可信度阈值的方法实现高可信度空战博弈；在推理时记录不确定度高的场景进行多次迭代训练以获得更高性能模型。通过本申请的处理方案，生成策略的同时能够对模型的不确定性进行量化，进而构建更具安全性的空战博弈策略生成系统。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06F	电数字数据处理（基于特定计算模型的计算机系统入G06N）
G06F30/00	计算机辅助设计（CAD）
G06F30/20	.设计优化、验证或模拟（电路设计的优化、验证或模拟入G06F30/30）
G06F30/27	..使用机器学习，例如人工智能，神经网络，支持向量机[SVM]或训练模型