一种基于群体非依赖性学习策略的多航天器围捕追逃博弈决策方法

发明公开

CN118052290A 一种基于群体非依赖性学习策略的多航天器围捕追逃博弈决策方法审中-公开

请登陆查看更多内容

专利标题： 一种基于群体非依赖性学习策略的多航天器围捕追逃博弈决策方法
申请号： CN202410300128.3

申请日： 2024-03-15
公开(公告)号： CN118052290A

公开(公告)日： 2024-05-17
发明人: 肖冰 , 钱寒雨 , 乔贝贝 , 孙小钦 , 吴西伟
申请人： 西北工业大学
申请人地址： 陕西省西安市友谊西路127号
专利权人： 西北工业大学
当前专利权人： 西北工业大学
当前专利权人地址： 陕西省西安市友谊西路127号
代理机构： 北京科迪生专利代理有限责任公司
代理商 李薇
主分类号： G06N5/04
IPC分类号： G06N5/04 ; G06N20/00

摘要：

本发明公开了一种基于群体非依赖性学习策略的多航天器围捕追逃博弈决策方法，具体包括以下主要过程：以速度脉冲为追逃双方基本策略，建立多航天器围捕追逃博弈优化数学模型；基于近端策略优化框架设计智能学习算法，在此基础上，融合脉冲大小选择、行为切换和任务分配三种决策能力；设计群体非依赖性基本博弈行为集合，并建立以行为奖励核心的奖励函数模型；设计加减速、半强制性行为切换和动态任务分配三种辅助博弈机制。本发明所提算法以底层简单行为作引导，相对传统基于终端距离的智能学习策略，能够提升航天器学习效率和质量，同时所设计辅助机制可有效提升集群博弈的灵活性。该发明具有训练简单、适应性强和实时性强等特点。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06N	基于特定计算模型的计算机系统
G06N5/00	利用基于知识的模式的计算机系统
G06N5/04	.推理方法或设备