发明公开
- 专利标题: 一种分层强化学习的智能体控制方法
-
申请号: CN201911360634.7申请日: 2019-12-25
-
公开(公告)号: CN111142522A公开(公告)日: 2020-05-12
- 发明人: 曾杰 , 罗喜伶 , 金晨 , 李云波
- 申请人: 北京航空航天大学杭州创新研究院
- 申请人地址: 浙江省杭州市滨江区长河街道创慧街18号
- 专利权人: 北京航空航天大学杭州创新研究院
- 当前专利权人: 北京航空航天大学杭州创新研究院
- 当前专利权人地址: 浙江省杭州市滨江区长河街道创慧街18号
- 代理机构: 杭州求是专利事务所有限公司
- 代理商 郑海峰
- 主分类号: G05D1/02
- IPC分类号: G05D1/02 ; G05D1/12
摘要:
本发明公开了一种分层强化学习的智能体控制方法,属于可移动智能体控制领域。本发明基于现有MLSH算法框架上,利用DDPG算法分别训练智能体在不同环境下各自追寻目标点和避障的能力,最后通过主策略网络来进行动作选择的融合。相对于基于传统融合规则的算法而言,网络自动选择动作的融合不存在死区问题,本发明不同于MLSH算法自动分层形成的子任务,而是明确将导航任务分成追寻目标点和避障两个子任务,这样主要是减少训练时间以及方便实际应用。
公开/授权文献
- CN111142522B 一种分层强化学习的智能体控制方法 公开/授权日:2023-06-09