针对对抗场景下不确定性辅助任务的分层强化学习方法
摘要:
本发明提出了针对对抗场景下不确定性辅助任务的分层强化学习方法。首先进行上层的任务分配阶段,智能体先获取全局环境信息,然后提取出其中对自身重要的辅助任务信息,再基于此提取出重要的主要任务信息,最后结合其它智能体的信息学习出任务分配策略;然后进行下层的任务执行阶段,智能体先根据分配结果构建专属子环境,然后在子环境内学习出任务执行顺序,最后执行具体动作。本专利提出的分层强化学习算法可以更高效地帮助多智能体系统学习如何执行不确定辅助任务,通过先学习上层的多智能体不确定辅助任务分配策略,再学习下层的单智能体不确定辅助任务执行策略,分别解决不确定辅助任务对群体和个体的影响,可以有效降低问题的复杂度。
0/0