一种基于深度强化学习的双臂机器人协同运动控制方法
Abstract:
本发明公开了一种基于深度强化学习的双臂机器人协同运动控制方法,采用DATD3算法对双臂机器人的机械臂协同运动控制进行训练,机械臂协同运动控制系统采用中心训练分布执行的架构,两个智能体中的Critic评估器会互相使用对方的控制策略;将动作噪声作为两个智能体的输入,两个智能体输出动作值;建立机械臂的三维仿真环境,并将步骤1中两个智能体训练输出的动作值输入仿真环境,在仿真环境中通过仿真训练获得状态值;对状态值进行采样并采用HER算法进行状态值进行优化,进而得到双臂机器人协同运动控制策略;并基于优化后的状态值更新两个智能体中的采样策略;本方法可以有效增加双臂机器人的学习效率,提高生产力。
Patent Agency Ranking
0/0