一种基于逆向强化学习的智能空战奖励函数生成方法

发明公开

CN114462569A 一种基于逆向强化学习的智能空战奖励函数生成方法审中-实审

专利标题： 一种基于逆向强化学习的智能空战奖励函数生成方法
申请号： CN202111654923.5

申请日： 2021-12-30
公开(公告)号： CN114462569A

公开(公告)日： 2022-05-10
发明人: 邓红艳 , 陈治湘 , 苏玉强 , 周宏升 , 雷祥 , 李德龙 , 叶培华 , 耿振余 , 张央檠 , 董冬梅 , 何玲玥 , 王奔驰 , 邓桂龙
申请人： 邓红艳 , 陈治湘 , 苏玉强 , 周宏升 , 雷祥 , 李德龙 , 叶培华 , 耿振余 , 张央檠 , 董冬梅 , 何玲玥 , 王奔驰 , 邓桂龙
申请人地址： 北京市海淀区北四环西路88号; ; ; ; ; ; ; ; ; ; ; ;
专利权人： 邓红艳,陈治湘,苏玉强,周宏升,雷祥,李德龙,叶培华,耿振余,张央檠,董冬梅,何玲玥,王奔驰,邓桂龙
当前专利权人： 邓红艳,陈治湘,苏玉强,周宏升,雷祥,李德龙,叶培华,耿振余,张央檠,董冬梅,何玲玥,王奔驰,邓桂龙
当前专利权人地址： 北京市海淀区北四环西路88号; ; ; ; ; ; ; ; ; ; ; ;
主分类号： G06N3/04
IPC分类号： G06N3/04 ; G06N3/08

摘要：

本发明涉及一种基于逆向强化学习的智能空战奖励函数生成方法，其采用模仿学习训练空对空对抗算法，采用逆向强化学习算法确定奖励函数；能够确保算法设计出一个合理的奖励函数，保证强化学习算法的收敛与模型的效果；此外，该方法具有通用性，针对不同任务都可以自动设计出一个奖励函数，无需人工设计。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类: