一种分层强化学习的智能体控制方法
摘要:
本发明公开了一种分层强化学习的智能体控制方法,属于可移动智能体控制领域。本发明基于现有MLSH算法框架上,利用DDPG算法分别训练智能体在不同环境下各自追寻目标点和避障的能力,最后通过主策略网络来进行动作选择的融合。相对于基于传统融合规则的算法而言,网络自动选择动作的融合不存在死区问题,本发明不同于MLSH算法自动分层形成的子任务,而是明确将导航任务分成追寻目标点和避障两个子任务,这样主要是减少训练时间以及方便实际应用。
公开/授权文献
0/0