基于值分布强化学习的感知遮挡下纵向决策方法及系统

Invention Publication

CN117208019A 基于值分布强化学习的感知遮挡下纵向决策方法及系统审中-实审

Please log in to see more content

Patent Title: 基于值分布强化学习的感知遮挡下纵向决策方法及系统
Application No.: CN202311473564.2

Application Date: 2023-11-08
Publication No.: CN117208019A

Publication Date: 2023-12-12
Inventor: 陈雪梅 , 徐书缘 , 朱宇臻 , 薛杨武 , 肖龙 , 赵小萱 , 沈晓旭
Applicant: 北京理工大学前沿技术研究院 , 北京理工大学
Applicant Address: 山东省济南市长清区崮云湖街道芙蓉路3266号北京理工大学前沿技术研究院A-2座3层
Assignee: 北京理工大学前沿技术研究院,北京理工大学
Current Assignee: 北京理工大学前沿技术研究院,北京理工大学
Current Assignee Address: 山东省济南市长清区崮云湖街道芙蓉路3266号北京理工大学前沿技术研究院A-2座3层
Agency: 济南圣达知识产权代理有限公司
Agent 李琳
Main IPC: B60W60/00
IPC: B60W60/00 ; G06N3/092 ; G06F18/213 ; G06F18/25 ; B60W30/095 ; B60W50/00

Abstract:

本发明提供了一种基于值分布强化学习的感知遮挡下纵向决策方法及系统，属于车辆驾驶决策技术领域，获取目标区域的人员识别结果，获取其中的位置信息和速度信息；获取目标区域的环境信息；利用融合谨慎心驱动的值分布式强化学习模型，基于所述环境信息、位置信息和速度信息，预测人员的下一步动作和位置，并依据预测结果，生成纵向决策；融合谨慎心驱动的值分布式强化学习模型包括用于确定相关分位数下的奖励的效率分位数函数，利用谨慎心驱动更新所述函数与环境信息互动后的奖励。本发明基于分布式强化学习与谨慎心驱动方法相融合，有效提升了车辆的通行安全和效率以及算法的泛化能力。

Public/Granted literature

CN117208019B 基于值分布强化学习的感知遮挡下纵向决策方法及系统 Public/Granted day:2024-04-05

Information query

Chinese Patent Announcement Global Dossier Espacenet

IPC分类:

B	作业；运输
B60	一般车辆
B60W	附注
B60W60/00	尤其适用于自主道路车辆的驱动控制系统