使用强化学习来加速自动驾驶车辆的轨迹规划的离线代理

Invention Publication

CN112034834A 使用强化学习来加速自动驾驶车辆的轨迹规划的离线代理有权

Please log in to see more content

Patent Title: 使用强化学习来加速自动驾驶车辆的轨迹规划的离线代理
Application No.: CN201911266984.7

Application Date: 2019-12-11
Publication No.: CN112034834A

Publication Date: 2020-12-04
Inventor: 何润欣 , 周金运 , 罗琦 , 宋适宇 , 缪景皓 , 胡江滔 , 王禹 , 许稼轩 , 姜舒
Applicant: 百度(美国)有限责任公司
Applicant Address: 美国加利福尼亚州
Assignee: 百度(美国)有限责任公司
Current Assignee: 百度(美国)有限责任公司
Current Assignee Address: 美国加利福尼亚州
Agency: 北京英赛嘉华知识产权代理有限责任公司
Agent 马晓亚; 王艳春
Priority: 16/413,339 2019.05.15 US
Main IPC: G05D1/02
IPC: G05D1/02

Abstract:

在一个实施方式中，系统生成多个驱动驾驶场景来训练强化学习(RL)代理并重放每个驱动驾驶场景以通过以下操作训练RL代理：将RL算法应用于驱动驾驶场景的初始状态，以从ADV的多个离散的控制/动作选项中确定多个控制动作，以达到基于多个离散的轨迹状态选项的多个轨迹状态，对于每个控制/动作确定通过RL算法的回报预测，确定轨迹状态的判断分数，并基于判断分数更新RL代理。

Public/Granted literature

CN112034834B 使用强化学习来加速自动驾驶车辆的轨迹规划的离线代理 Public/Granted day:2024-06-18

Information query

Chinese Patent Announcement Global Dossier Espacenet

IPC分类:

G	物理
G05	控制；调节
G05D	非电变量的控制或调节系统（金属的连续铸造入B22D11/16；阀门本身入F16K；非电变量的检测见G01各有关小类；电或磁变量的调节入G05F）
G05D1/00	陆地、水上、空中或太空中的运载工具的位置、航道、高度或姿态的控制，例如自动驾驶仪（无线电导航系统或使用其他波的类似系统入G01S）
G05D1/02	.二维的位置或航道控制