基于先验知识的深度强化学习机器人运动控制方法及系统
摘要:
本发明提出基于先验知识的深度强化学习机器人运动控制方法及系统,涉及机器人控制技术领域。包括基于虚拟模型控制法获取四足机器人动作输出曲线;将四足机器人动作输出曲线作为开环的参考轨迹,将强化学习控制器生成的动作输出量作为闭环优化信号,搭建策略框架;根据策略框架,采用四足机器人动作输出曲线作为先验知识引导四足机器人学习,对强化学习控制器进行训练,得到训练好的强化学习控制器,对四足机器人进行运动控制。本发明将虚拟模型控制动作输出曲线作为四足机器人的先验知识,指导四足机器人的学习过程,将深度强化学习网络作为反馈调整部分增加机器人的学习能力,提高四足机器人对地形的适应能力和学习效率。
0/0