一种基于深度强化学习的非合作目标捕获方法

发明公开

CN117464687A 一种基于深度强化学习的非合作目标捕获方法审中-实审

请登陆查看更多内容

专利标题： 一种基于深度强化学习的非合作目标捕获方法
申请号： CN202311655229.4

申请日： 2023-12-05
公开(公告)号： CN117464687A

公开(公告)日： 2024-01-30
发明人: 邵翔宇 , 雷文骁 , 赵彤宇 , 张欧阳 , 陈伟良 , 孙光辉
申请人： 哈尔滨工业大学
申请人地址： 黑龙江省哈尔滨市南岗区西大直街92号
专利权人： 哈尔滨工业大学
当前专利权人： 哈尔滨工业大学
当前专利权人地址： 黑龙江省哈尔滨市南岗区西大直街92号
代理机构： 哈尔滨市松花江联合专利商标代理有限公司
代理商 岳昕
主分类号： B25J9/16
IPC分类号： B25J9/16

摘要：

一种基于深度强化学习的非合作目标捕获方法，它属于空间机械臂控制与非合作目标捕获领域。本发明解决了当同时要求目标捕获和能量、时间损失性能优化时，现有深度强化学习算法训练的时间成本高以及目标捕获的成功率低的问题。本发明针对空间机械臂非合作目标抓捕这类复杂高维控制问题，提出了预训练加主任务训练的方法，在预训练过程中完成目标抓捕任务，并在主任务训练过程中对抓捕时的待优化目标函数进行优化，解决了在训练过程中同时进行抓捕和目标函数优化时存在的训练成功率低，算法难以收敛的问题，而且训练时间成本较低、利用训练好的控制策略进行目标捕获的成功率高。本发明方法可以应用于非合作目标捕获。

信息查询

中国专利公布公告

审查信息

Global Dossier

Espacenet

IPC分类:

B	作业；运输
B25	手动工具；轻便机动工具；手动器械的手柄；车间设备；机械手
B25J	机械手；装有操纵装置的容器（单独采摘水果、蔬菜、啤酒花或类似作物的自动装置入A01D46/30；外科用的针头操纵器入A61B17/062；与滚轧机有关的机械手入B21B39/20；与锻压机有关的机械手入B21J13/10；夹持轮子或其部件的装置入B60B30/00；起重机入B66C；用于核反应堆中所用的燃料或其他材料的处理设备入G21C19/00；机械手与加有防辐射的小室或房间的组合结构入G21F7/06）
B25J9/00	程序控制机械手
B25J9/16	.程序控制（全面生产控制，即集中控制多台机器入G05B19/418）