- 专利标题: 一种基于课程强化学习的机器人策略训练系统及训练方法
-
申请号: CN202211227150.7申请日: 2022-10-09
-
公开(公告)号: CN115454096B公开(公告)日: 2024-07-19
- 发明人: 吴立刚 , 董博 , 王淼 , 王夏爽 , 姚蔚然 , 田昊宇 , 丁季时雨 , 孙科武 , 杨皙睿 , 孙光辉
- 申请人: 哈尔滨工业大学 , 中国航天科工集团第二研究院
- 申请人地址: 黑龙江省哈尔滨市南岗区西大直街92号;
- 专利权人: 哈尔滨工业大学,中国航天科工集团第二研究院
- 当前专利权人: 哈尔滨工业大学,中国航天科工集团第二研究院
- 当前专利权人地址: 黑龙江省哈尔滨市南岗区西大直街92号;
- 代理机构: 哈尔滨市松花江联合专利商标代理有限公司
- 代理商 岳昕
- 主分类号: G05D1/43
- IPC分类号: G05D1/43 ; G05D1/249
摘要:
一种基于课程强化学习的机器人策略训练系统及训练方法,它属于无人系统自主决策与控制领域。本发明解决了现有方法在针对于机器人的策略训练方面难以获得好的决策与控制效果的问题。本发明针对异构多机器人不同类型的任务模式,以复杂环境的动力学模型为输入,构建基于课程学习的多机器人联合任务决策课程学习训练架构。考虑训练过程中任务难度的循序渐进,建立基于复杂环境动力学模型的参数自主生成算法和目标自主生成算法。然后在此基础上,建立课程难度评估与标校算法,反馈给自优化强化学习算法。本发明方法可以应用于无人系统的自主决策与控制。
公开/授权文献
- CN115454096A 一种基于课程强化学习的机器人策略训练系统及训练方法 公开/授权日:2022-12-09