一种分层强化学习的智能体控制方法

发明公开

请登陆查看更多内容

专利标题： 一种分层强化学习的智能体控制方法
申请号： CN201911360634.7

申请日： 2019-12-25
公开(公告)号： CN111142522A

公开(公告)日： 2020-05-12
发明人: 曾杰 , 罗喜伶 , 金晨 , 李云波
申请人： 北京航空航天大学杭州创新研究院
申请人地址： 浙江省杭州市滨江区长河街道创慧街18号
专利权人： 北京航空航天大学杭州创新研究院
当前专利权人： 北京航空航天大学杭州创新研究院
当前专利权人地址： 浙江省杭州市滨江区长河街道创慧街18号
代理机构： 杭州求是专利事务所有限公司
代理商 郑海峰
主分类号： G05D1/02
IPC分类号： G05D1/02 ; G05D1/12

摘要：

本发明公开了一种分层强化学习的智能体控制方法，属于可移动智能体控制领域。本发明基于现有MLSH算法框架上，利用DDPG算法分别训练智能体在不同环境下各自追寻目标点和避障的能力，最后通过主策略网络来进行动作选择的融合。相对于基于传统融合规则的算法而言，网络自动选择动作的融合不存在死区问题，本发明不同于MLSH算法自动分层形成的子任务，而是明确将导航任务分成追寻目标点和避障两个子任务，这样主要是减少训练时间以及方便实际应用。

公开/授权文献

CN111142522B 一种分层强化学习的智能体控制方法公开/授权日：2023-06-09

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G05	控制；调节
G05D	非电变量的控制或调节系统（金属的连续铸造入B22D11/16；阀门本身入F16K；非电变量的检测见G01各有关小类；电或磁变量的调节入G05F）
G05D1/00	陆地、水上、空中或太空中的运载工具的位置、航道、高度或姿态的控制，例如自动驾驶仪（无线电导航系统或使用其他波的类似系统入G01S）
G05D1/02	.二维的位置或航道控制