发明公开
- 专利标题: 一种基于深度强化学习的非合作目标捕获方法
-
申请号: CN202311655229.4申请日: 2023-12-05
-
公开(公告)号: CN117464687A公开(公告)日: 2024-01-30
- 发明人: 邵翔宇 , 雷文骁 , 赵彤宇 , 张欧阳 , 陈伟良 , 孙光辉
- 申请人: 哈尔滨工业大学
- 申请人地址: 黑龙江省哈尔滨市南岗区西大直街92号
- 专利权人: 哈尔滨工业大学
- 当前专利权人: 哈尔滨工业大学
- 当前专利权人地址: 黑龙江省哈尔滨市南岗区西大直街92号
- 代理机构: 哈尔滨市松花江联合专利商标代理有限公司
- 代理商 岳昕
- 主分类号: B25J9/16
- IPC分类号: B25J9/16
摘要:
一种基于深度强化学习的非合作目标捕获方法,它属于空间机械臂控制与非合作目标捕获领域。本发明解决了当同时要求目标捕获和能量、时间损失性能优化时,现有深度强化学习算法训练的时间成本高以及目标捕获的成功率低的问题。本发明针对空间机械臂非合作目标抓捕这类复杂高维控制问题,提出了预训练加主任务训练的方法,在预训练过程中完成目标抓捕任务,并在主任务训练过程中对抓捕时的待优化目标函数进行优化,解决了在训练过程中同时进行抓捕和目标函数优化时存在的训练成功率低,算法难以收敛的问题,而且训练时间成本较低、利用训练好的控制策略进行目标捕获的成功率高。本发明方法可以应用于非合作目标捕获。