一种基于自适应课程残差分层强化学习轨迹规划方法及系统

发明公开

CN117192986A 一种基于自适应课程残差分层强化学习轨迹规划方法及系统审中-实审

请登陆查看更多内容

专利标题： 一种基于自适应课程残差分层强化学习轨迹规划方法及系统
申请号： CN202311165662.X

申请日： 2023-09-11
公开(公告)号： CN117192986A

公开(公告)日： 2023-12-08
发明人: 陈仕韬 , 史佳敏 , 宗紫琪 , 沈艳晴 , 严宇宸 , 邱卓 , 常恩滔 , 辛景民 , 郑南宁
申请人： 西安交通大学 , 宁波市舜安人工智能研究院
申请人地址： 陕西省西安市碑林区咸宁西路28号
专利权人： 西安交通大学,宁波市舜安人工智能研究院
当前专利权人： 西安交通大学,宁波市舜安人工智能研究院
当前专利权人地址： 陕西省西安市碑林区咸宁西路28号
代理机构： 西安通大专利代理有限责任公司
代理商 王艾华
主分类号： G05B13/04
IPC分类号： G05B13/04

摘要：

本发明公开了一种基于自适应课程残差分层强化学习轨迹规划方法及系统，所述方法利用模糊逻辑集成自动驾驶车辆的空间位置和动态特性；将基于规则的方法与深度强化学习相结合形成CR‑HRL决策框架，利用模糊逻辑将自动驾驶车辆的空间位置和动态特性作为输入CR‑HRL决策框架，根据训练过程自适应地调整基于规则和深度强化学习的输出比例，输出高层行为决策结果和目标速度；根据高层行为决策结果和目标速度生成安全舒适的规划轨迹；本发明使用基于规则的安全规划模型作为CR‑HRL的软指导，利用深度强化学习算法生成残差策略作为补充，得到安全和高效平衡的策略，在模拟器SUMO和ROS中的RL分别进行训练和测试，验证了方法的有效性，将模型成功地应用于实际，验证了模型的泛化能力。

信息查询

中国专利公布公告

审查信息

Global Dossier

Espacenet

IPC分类:

G	物理
G05	控制；调节
G05B	一般的控制或调节系统；这种系统的功能单元；用于这种系统或单元的监视或测试装置（应用流体作用的一般流体压力执行器或系统入F15B；阀门本身入F16K；仅按机械特征区分的入G05G；传感元件见相应小类，例如G12B，G01、H01的小类；校正单元见相应的小类，例如H02K）
G05B13/00	自适应控制系统，即系统按照一些预定的准则自动调整自己使之具有最佳性能的系统（G05B19/00优先；机器学习G06N 20/00）
G05B13/02	.电的
G05B13/04	..包括使用模型或模拟器的