针对对抗场景下不确定性辅助任务的分层强化学习方法

Invention Publication

CN116776963A 针对对抗场景下不确定性辅助任务的分层强化学习方法审中-实审

Please log in to see more content

Patent Title: 针对对抗场景下不确定性辅助任务的分层强化学习方法
Application No.: CN202310637974.X

Application Date: 2023-05-31
Publication No.: CN116776963A

Publication Date: 2023-09-19
Inventor: 蒋嶷川 , 陈文博 , 姜元爽 , 狄凯
Applicant: 东南大学
Applicant Address: 江苏省南京市玄武区四牌楼2号
Assignee: 东南大学
Current Assignee: 东南大学
Current Assignee Address: 江苏省南京市玄武区四牌楼2号
Agency: 南京众联专利代理有限公司
Agent 张天哲
Main IPC: G06N3/092
IPC: G06N3/092 ; G06N3/084 ; G06N3/045 ; G06N3/008

Abstract:

本发明提出了针对对抗场景下不确定性辅助任务的分层强化学习方法。首先进行上层的任务分配阶段，智能体先获取全局环境信息，然后提取出其中对自身重要的辅助任务信息，再基于此提取出重要的主要任务信息，最后结合其它智能体的信息学习出任务分配策略；然后进行下层的任务执行阶段，智能体先根据分配结果构建专属子环境，然后在子环境内学习出任务执行顺序，最后执行具体动作。本专利提出的分层强化学习算法可以更高效地帮助多智能体系统学习如何执行不确定辅助任务，通过先学习上层的多智能体不确定辅助任务分配策略，再学习下层的单智能体不确定辅助任务执行策略，分别解决不确定辅助任务对群体和个体的影响，可以有效降低问题的复杂度。

Information query

Chinese Patent Announcement Global Dossier Espacenet