一种基于课程强化学习的机器人策略训练系统及训练方法
摘要:
一种基于课程强化学习的机器人策略训练系统及训练方法,它属于无人系统自主决策与控制领域。本发明解决了现有方法在针对于机器人的策略训练方面难以获得好的决策与控制效果的问题。本发明针对异构多机器人不同类型的任务模式,以复杂环境的动力学模型为输入,构建基于课程学习的多机器人联合任务决策课程学习训练架构。考虑训练过程中任务难度的循序渐进,建立基于复杂环境动力学模型的参数自主生成算法和目标自主生成算法。然后在此基础上,建立课程难度评估与标校算法,反馈给自优化强化学习算法。本发明方法可以应用于无人系统的自主决策与控制。
0/0