-
公开(公告)号:CN120068646A
公开(公告)日:2025-05-30
申请号:CN202510220146.5
申请日:2025-02-27
Applicant: 哈尔滨工业大学
IPC: G06F30/27 , G05B13/04 , G06N3/092 , G06N3/008 , G06N3/045 , G06F111/04 , G06F111/06 , G06F119/14
Abstract: 本发明提出了一种基于模型辅助强化学习的空间机器人目标捕获方法,包括:步骤1:推导出空间自由飞行机器人系统的动力学约束并搭建环境模型;步骤2:设置合适的参数和目标函数进行无模型强化学习训练;步骤3:设计深度拉格朗日神经网络框架并训练出系统动力学模型,并得出状态转移模型;步骤4:以步骤2的参数为参照,加入步骤3得到的状态转移模型进行模型生成虚拟经验来辅助完成强化学习训练过程。本发明可提升强化学习的样本效率,收敛速度和训练出抓取移动目标的控制器模型的快速性和准确性;整体逻辑与原理清晰简单,适用于不同的系统和各种工况,具有较强的泛化性;用深度拉格朗日神经网络使得状态转移模型具有可靠性。