发明公开
- 专利标题: 针对对抗场景下不确定性辅助任务的分层强化学习方法
-
申请号: CN202310637974.X申请日: 2023-05-31
-
公开(公告)号: CN116776963A公开(公告)日: 2023-09-19
- 发明人: 蒋嶷川 , 陈文博 , 姜元爽 , 狄凯
- 申请人: 东南大学
- 申请人地址: 江苏省南京市玄武区四牌楼2号
- 专利权人: 东南大学
- 当前专利权人: 东南大学
- 当前专利权人地址: 江苏省南京市玄武区四牌楼2号
- 代理机构: 南京众联专利代理有限公司
- 代理商 张天哲
- 主分类号: G06N3/092
- IPC分类号: G06N3/092 ; G06N3/084 ; G06N3/045 ; G06N3/008
摘要:
本发明提出了针对对抗场景下不确定性辅助任务的分层强化学习方法。首先进行上层的任务分配阶段,智能体先获取全局环境信息,然后提取出其中对自身重要的辅助任务信息,再基于此提取出重要的主要任务信息,最后结合其它智能体的信息学习出任务分配策略;然后进行下层的任务执行阶段,智能体先根据分配结果构建专属子环境,然后在子环境内学习出任务执行顺序,最后执行具体动作。本专利提出的分层强化学习算法可以更高效地帮助多智能体系统学习如何执行不确定辅助任务,通过先学习上层的多智能体不确定辅助任务分配策略,再学习下层的单智能体不确定辅助任务执行策略,分别解决不确定辅助任务对群体和个体的影响,可以有效降低问题的复杂度。