一种基于强化学习的机器人路径规划方法及设备
摘要:
本发明属于磨抛控制技术领域,并具体公开了一种基于强化学习的机器人路径规划方法及设备。包括:将工件模型的点云数据转化为BOJ模型后,通过共形映射生成共形平面,对共形平面进行障碍物膨化处理,以生成栅格地图,并基于该栅格化地图对任务目标区域进行标记,生成当前路径;构建全覆盖路径规划的奖励函数模型,以对当前路径进行评价;基于所述栅格地图和奖励函数模型,建立基于Actor Critic强化学习框架,根据评估梯度函数更新Actor Critic强化学习框架,直至收敛,得到优化的自适应路径;将优化的自适应路径重新映射回三维曲面。本发明实现了复杂多孔曲面的自动路径全覆盖,生成的路径具有自动避障、全覆盖、强连续性等优势。
0/0