-
公开(公告)号:CN115598975A
公开(公告)日:2023-01-13
申请号:CN202211159452.5
申请日:2022-09-22
Applicant: 哈尔滨工业大学(CN)
IPC: G05B13/04
Abstract: 基于参数预训练的销孔装配DDPG强化学习加速方法,涉及机器人销孔装配任务强化学习技术领域。本发明是为了解决现有的基于销孔装配强化学习方法还存在任务针对性差,装配任务强化学习效率低导致的难以在短时间内学习到有用策略的问题。本发明包括:定义销孔装配抽象编码变量x,z,α和β;对销孔装配接触状态分类,并获取每类销孔装配接触状态几何约束,建立销孔装配位姿转移模型;利用销孔装配策略模型对DDPG强化学习网络中的Actor网络预训练,获得Actor网络参数;利用销孔装配位姿转移模型获得位姿动作价值函数Qpose(s,a),利用Qpose(s,a)对Critic网络预训练获得Critic网络参数;以Actor网络参数和Critic网络参数为基础进行销孔装配强化加速学习。本发明用于销孔装配的强化学习加速。