一种基于自适应课程残差分层强化学习轨迹规划方法及系统
摘要:
本发明公开了一种基于自适应课程残差分层强化学习轨迹规划方法及系统,所述方法利用模糊逻辑集成自动驾驶车辆的空间位置和动态特性;将基于规则的方法与深度强化学习相结合形成CR‑HRL决策框架,利用模糊逻辑将自动驾驶车辆的空间位置和动态特性作为输入CR‑HRL决策框架,根据训练过程自适应地调整基于规则和深度强化学习的输出比例,输出高层行为决策结果和目标速度;根据高层行为决策结果和目标速度生成安全舒适的规划轨迹;本发明使用基于规则的安全规划模型作为CR‑HRL的软指导,利用深度强化学习算法生成残差策略作为补充,得到安全和高效平衡的策略,在模拟器SUMO和ROS中的RL分别进行训练和测试,验证了方法的有效性,将模型成功地应用于实际,验证了模型的泛化能力。
0/0