Invention Publication
- Patent Title: 使用强化学习来加速自动驾驶车辆的轨迹规划的离线代理
-
Application No.: CN201911266984.7Application Date: 2019-12-11
-
Publication No.: CN112034834APublication Date: 2020-12-04
- Inventor: 何润欣 , 周金运 , 罗琦 , 宋适宇 , 缪景皓 , 胡江滔 , 王禹 , 许稼轩 , 姜舒
- Applicant: 百度(美国)有限责任公司
- Applicant Address: 美国加利福尼亚州
- Assignee: 百度(美国)有限责任公司
- Current Assignee: 百度(美国)有限责任公司
- Current Assignee Address: 美国加利福尼亚州
- Agency: 北京英赛嘉华知识产权代理有限责任公司
- Agent 马晓亚; 王艳春
- Priority: 16/413,339 2019.05.15 US
- Main IPC: G05D1/02
- IPC: G05D1/02

Abstract:
在一个实施方式中,系统生成多个驱动驾驶场景来训练强化学习(RL)代理并重放每个驱动驾驶场景以通过以下操作训练RL代理:将RL算法应用于驱动驾驶场景的初始状态,以从ADV的多个离散的控制/动作选项中确定多个控制动作,以达到基于多个离散的轨迹状态选项的多个轨迹状态,对于每个控制/动作确定通过RL算法的回报预测,确定轨迹状态的判断分数,并基于判断分数更新RL代理。
Public/Granted literature
- CN112034834B 使用强化学习来加速自动驾驶车辆的轨迹规划的离线代理 Public/Granted day:2024-06-18
Information query