一种基于强化学习的飞行器智能协同对抗决策方法和系统

发明公开

CN116578113A 一种基于强化学习的飞行器智能协同对抗决策方法和系统审中-实审

请登陆查看更多内容

专利标题： 一种基于强化学习的飞行器智能协同对抗决策方法和系统
申请号： CN202310536062.3

申请日： 2023-05-12
公开(公告)号： CN116578113A

公开(公告)日： 2023-08-11
发明人: 黄操 , 季玉龙 , 周文涛 , 王一 , 王进林 , 朱珑涛 , 何杨
申请人： 四川大学
申请人地址： 四川省成都市武侯区一环路南一段24号
专利权人： 四川大学
当前专利权人： 四川大学
当前专利权人地址： 四川省成都市武侯区一环路南一段24号
代理机构： 成都禾创知家知识产权代理有限公司
代理商 刘凯
主分类号： G05D1/10
IPC分类号： G05D1/10

摘要：

本发明公开了一种基于强化学习的飞行器智能协同对抗决策方法和系统，该方法包括观测值设计：对不同机型的飞行动力学以及武器、雷达等进行仿真建模；动作空间设计：设计每架飞行器的动作空间，包括目标飞行器编号和四个航向做出的指令值，所述指令动作值包括迎角、滚转角、油门量；回报函数设计：设计存货奖励、距离奖励/惩罚和雷达锁定项；强化学习环境设计：采用训练模式和应用模式进行飞行器及对抗方的动态控制，并实现状态、动作和奖励值的数据接口功能；本发明定制飞行器智能协同对抗决策系统，目标函数合理，经过一定的训练之后具有显著的效果，能够保证模型和算法的有效性，可用于飞行器制定合适的对抗策略。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G05	控制；调节
G05D	非电变量的控制或调节系统（金属的连续铸造入B22D11/16；阀门本身入F16K；非电变量的检测见G01各有关小类；电或磁变量的调节入G05F）
G05D1/00	陆地、水上、空中或太空中的运载工具的位置、航道、高度或姿态的控制，例如自动驾驶仪（无线电导航系统或使用其他波的类似系统入G01S）
G05D1/10	.三维的位置或航道的同时控制（G05D1/12优先）