- 专利标题: 基于贝尔曼误差的方差最小化强化学习机械臂训练加速方法
-
申请号: CN202410508730.6申请日: 2024-04-26
-
公开(公告)号: CN118114746B公开(公告)日: 2024-07-23
- 发明人: 陈兴国 , 江宛真 , 巩宇
- 申请人: 南京邮电大学
- 申请人地址: 江苏省南京市栖霞区文苑路9号
- 专利权人: 南京邮电大学
- 当前专利权人: 南京邮电大学
- 当前专利权人地址: 江苏省南京市栖霞区文苑路9号
- 代理机构: 南京苏科专利代理有限责任公司
- 代理商 姚姣阳
- 主分类号: G06N3/092
- IPC分类号: G06N3/092 ; B25J9/16 ; G06N3/06 ; G06N3/0455
摘要:
本发明提供了一种基于贝尔曼误差的方差最小化强化学习机械臂训练加速方法,用于机械臂控制,包括如下步骤:将工程问题建立成强化学习环境模型,通过使用位置传感器和旋转编码器,获取并测量了机械臂在运动过程中的关节角度、角速度、末端执行器位置、末端执行器速度和障碍物位置等位置姿态数据。数据经神经网络转化,形成了机械臂状态的特征。利用基于投影贝尔曼误差的方差最小化算法进行训练,提升机器臂的控制策略。通过反复迭代训练,最终获得机械臂的最优控制策略,提升机械臂在特定任务和应用场景中的表现。该方法通过减小梯度估计方差,能加快收敛到最优策略的速度,提高机械臂训练的准确性和效率,改善自动化控制系统性能。
公开/授权文献
- CN118114746A 基于贝尔曼误差的方差最小化强化学习机械臂训练加速方法 公开/授权日:2024-05-31