-
公开(公告)号:CN115598975A
公开(公告)日:2023-01-13
申请号:CN202211159452.5
申请日:2022-09-22
Applicant: 哈尔滨工业大学(CN)
IPC: G05B13/04
Abstract: 基于参数预训练的销孔装配DDPG强化学习加速方法,涉及机器人销孔装配任务强化学习技术领域。本发明是为了解决现有的基于销孔装配强化学习方法还存在任务针对性差,装配任务强化学习效率低导致的难以在短时间内学习到有用策略的问题。本发明包括:定义销孔装配抽象编码变量x,z,α和β;对销孔装配接触状态分类,并获取每类销孔装配接触状态几何约束,建立销孔装配位姿转移模型;利用销孔装配策略模型对DDPG强化学习网络中的Actor网络预训练,获得Actor网络参数;利用销孔装配位姿转移模型获得位姿动作价值函数Qpose(s,a),利用Qpose(s,a)对Critic网络预训练获得Critic网络参数;以Actor网络参数和Critic网络参数为基础进行销孔装配强化加速学习。本发明用于销孔装配的强化学习加速。
-
公开(公告)号:CN115598975B
公开(公告)日:2024-08-27
申请号:CN202211159452.5
申请日:2022-09-22
Applicant: 哈尔滨工业大学
IPC: G05B13/04
Abstract: 基于参数预训练的销孔装配DDPG强化学习加速方法,涉及机器人销孔装配任务强化学习技术领域。本发明是为了解决现有的基于销孔装配强化学习方法还存在任务针对性差,装配任务强化学习效率低导致的难以在短时间内学习到有用策略的问题。本发明包括:定义销孔装配抽象编码变量x,z,α和β;对销孔装配接触状态分类,并获取每类销孔装配接触状态几何约束,建立销孔装配位姿转移模型;利用销孔装配策略模型对DDPG强化学习网络中的Actor网络预训练,获得Actor网络参数;利用销孔装配位姿转移模型获得位姿动作价值函数Qpose(s,a),利用Qpose(s,a)对Critic网络预训练获得Critic网络参数;以Actor网络参数和Critic网络参数为基础进行销孔装配强化加速学习。本发明用于销孔装配的强化学习加速。
-
公开(公告)号:CN114952830B
公开(公告)日:2023-05-16
申请号:CN202210520027.8
申请日:2022-05-13
Applicant: 哈尔滨工业大学
IPC: B25J9/16
Abstract: 一种基于接触约束的机器人高精度轴孔装配轴零件定位方法,属于机器人高精度轴孔装配操作领域。本发明针对现有轴孔装配操作利用机器视觉算法实现定位,算法复杂并且定位可靠性低的问题。包括确定机器人基座平面与轴零件基座平面之间的变换关系;计算孔零件坐标系x2y2z2相对机器人坐标系x0y0z0的位姿;确定孔零件在每一次三点接触状态下的原点o2及孔零件轴线相对机器人坐标系x0y0z0的位姿;将每一次三点接触状态下的原点o2及孔零件轴线投影到轴零件基座上;确定轴零件轴线在机器人坐标系x0y0z0的位置;再根据轴零件坐标系x1y1z1的原点在轴零件轴线上的位置,确定轴零件坐标系x1y1z1在机器人坐标系x0y0z0中的位姿,完成轴零件定位。本发明可实现更精准的定位。
-
公开(公告)号:CN114952830A
公开(公告)日:2022-08-30
申请号:CN202210520027.8
申请日:2022-05-13
Applicant: 哈尔滨工业大学
IPC: B25J9/16
Abstract: 一种基于接触约束的机器人高精度轴孔装配轴零件定位方法,属于机器人高精度轴孔装配操作领域。本发明针对现有轴孔装配操作利用机器视觉算法实现定位,算法复杂并且定位可靠性低的问题。包括确定机器人基座平面与轴零件基座平面之间的变换关系;计算孔零件坐标系x2y2z2相对机器人坐标系x0y0z0的位姿;确定孔零件在每一次三点接触状态下的原点o2及孔零件轴线相对机器人坐标系x0y0z0的位姿;将每一次三点接触状态下的原点o2及孔零件轴线投影到轴零件基座上;确定轴零件轴线在机器人坐标系x0y0z0的位置;再根据轴零件坐标系x1y1z1的原点在轴零件轴线上的位置,确定轴零件坐标系x1y1z1在机器人坐标系x0y0z0中的位姿,完成轴零件定位。本发明可实现更精准的定位。
-
-
-