基于强化学习的机械臂步进式路径轨迹优化方法

发明公开

CN118342517A 基于强化学习的机械臂步进式路径轨迹优化方法审中-实审

请登陆查看更多内容

专利标题： 基于强化学习的机械臂步进式路径轨迹优化方法
申请号： CN202410646752.9

申请日： 2024-05-23
公开(公告)号： CN118342517A

公开(公告)日： 2024-07-16
发明人: 柯霄汉 , 杜昊 , 王琛琛 , 唐顿 , 金晶 , 王薇
申请人： 上海术理智能科技有限公司
申请人地址： 上海市奉贤区程普路377号4幢B区10层
专利权人： 上海术理智能科技有限公司
当前专利权人： 上海术理智能科技有限公司
当前专利权人地址： 上海市奉贤区程普路377号4幢B区10层
代理机构： 南京行高知识产权代理有限公司
代理商 肖念
主分类号： B25J9/16
IPC分类号： B25J9/16

摘要：

本发明公开了一种基于强化学习的机械臂步进式路径轨迹优化方法，根据策略函数进行机械臂运动，通过策略优化算法优化策略函数的输出；每次机械臂运动之后，计算绕z轴旋转的关节的旋转角度；当绕z轴旋转的关节基本面向目标点时，锁定对应关节的输出角度值；锁定对应输出角度值后，继续训练，当末端位姿与目标位姿的距离小于一定阈值时，提前终止训练，否则直到训练结束；训练过程中使用奖励函数。本发明步进式训练可以有效的减少学习时间，并以最优姿态快速定位目标点。通过锁定先训练好的关节动作输出值，使得模型通过动用更少的关节，在更短的时间内，达到更好的效果。奖励函数的设计优化了模型规划路径，以最少的动作达到最优的路径。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

B	作业；运输
B25	手动工具；轻便机动工具；手动器械的手柄；车间设备；机械手
B25J	机械手；装有操纵装置的容器（单独采摘水果、蔬菜、啤酒花或类似作物的自动装置入A01D46/30；外科用的针头操纵器入A61B17/062；与滚轧机有关的机械手入B21B39/20；与锻压机有关的机械手入B21J13/10；夹持轮子或其部件的装置入B60B30/00；起重机入B66C；用于核反应堆中所用的燃料或其他材料的处理设备入G21C19/00；机械手与加有防辐射的小室或房间的组合结构入G21F7/06）
B25J9/00	程序控制机械手
B25J9/16	.程序控制（全面生产控制，即集中控制多台机器入G05B19/418）