专利检索 ap:("西安交通大学" OR "中国航天科工集团第二研究院") AND inv:"丁季时雨" 第 2 页

11.

发明公开
融合专家系统与强化学习的多智能体博弈对抗方法和系统审中-实审

公开(公告)号：CN114298301A

公开(公告)日：2022-04-08

申请号：CN202111424345.6

申请日：2021-11-26

申请人： 中国航天科工集团第二研究院

发明人： 丁季时雨 , 孙科武 , 董博 , 马喆 , 毛磊

IPC分类号： G06N3/08 , G06N3/04

摘要： 本发明公开了一种融合专家系统与强化学习的多智能体博弈对抗方法和系统。所述融合专家系统与强化学习的多智能体博弈对抗方法，将多智能体博弈对抗的任务进行分层，包含宏观策略和微观动作两个层次。宏观层次的主要任务是根据专家系统内部大量的某个领域专家水平的知识与经验，制定多智能体博弈对抗中基于规则的总体策略；微观层次的主要任务是在宏观策略的指导下对智能体一定范围内的微观操作进行强化学习，能够较好地融合规则式经验与强化学习方法各自的优点，有效地降低多智能体博弈对抗强化学习的难度。