发明公开
- 专利标题: 一种基于逆向强化学习的智能空战奖励函数生成方法
-
申请号: CN202111654923.5申请日: 2021-12-30
-
公开(公告)号: CN114462569A公开(公告)日: 2022-05-10
- 发明人: 邓红艳 , 陈治湘 , 苏玉强 , 周宏升 , 雷祥 , 李德龙 , 叶培华 , 耿振余 , 张央檠 , 董冬梅 , 何玲玥 , 王奔驰 , 邓桂龙
- 申请人: 邓红艳 , 陈治湘 , 苏玉强 , 周宏升 , 雷祥 , 李德龙 , 叶培华 , 耿振余 , 张央檠 , 董冬梅 , 何玲玥 , 王奔驰 , 邓桂龙
- 申请人地址: 北京市海淀区北四环西路88号; ; ; ; ; ; ; ; ; ; ; ;
- 专利权人: 邓红艳,陈治湘,苏玉强,周宏升,雷祥,李德龙,叶培华,耿振余,张央檠,董冬梅,何玲玥,王奔驰,邓桂龙
- 当前专利权人: 邓红艳,陈治湘,苏玉强,周宏升,雷祥,李德龙,叶培华,耿振余,张央檠,董冬梅,何玲玥,王奔驰,邓桂龙
- 当前专利权人地址: 北京市海淀区北四环西路88号; ; ; ; ; ; ; ; ; ; ; ;
- 主分类号: G06N3/04
- IPC分类号: G06N3/04 ; G06N3/08
摘要:
本发明涉及一种基于逆向强化学习的智能空战奖励函数生成方法,其采用模仿学习训练空对空对抗算法,采用逆向强化学习算法确定奖励函数;能够确保算法设计出一个合理的奖励函数,保证强化学习算法的收敛与模型的效果;此外,该方法具有通用性,针对不同任务都可以自动设计出一个奖励函数,无需人工设计。