- 专利标题: 基于值分布强化学习的感知遮挡下纵向决策方法及系统
-
申请号: CN202311473564.2申请日: 2023-11-08
-
公开(公告)号: CN117208019A公开(公告)日: 2023-12-12
- 发明人: 陈雪梅 , 徐书缘 , 朱宇臻 , 薛杨武 , 肖龙 , 赵小萱 , 沈晓旭
- 申请人: 北京理工大学前沿技术研究院 , 北京理工大学
- 申请人地址: 山东省济南市长清区崮云湖街道芙蓉路3266号北京理工大学前沿技术研究院A-2座3层
- 专利权人: 北京理工大学前沿技术研究院,北京理工大学
- 当前专利权人: 北京理工大学前沿技术研究院,北京理工大学
- 当前专利权人地址: 山东省济南市长清区崮云湖街道芙蓉路3266号北京理工大学前沿技术研究院A-2座3层
- 代理机构: 济南圣达知识产权代理有限公司
- 代理商 李琳
- 主分类号: B60W60/00
- IPC分类号: B60W60/00 ; G06N3/092 ; G06F18/213 ; G06F18/25 ; B60W30/095 ; B60W50/00
摘要:
本发明提供了一种基于值分布强化学习的感知遮挡下纵向决策方法及系统,属于车辆驾驶决策技术领域,获取目标区域的人员识别结果,获取其中的位置信息和速度信息;获取目标区域的环境信息;利用融合谨慎心驱动的值分布式强化学习模型,基于所述环境信息、位置信息和速度信息,预测人员的下一步动作和位置,并依据预测结果,生成纵向决策;融合谨慎心驱动的值分布式强化学习模型包括用于确定相关分位数下的奖励的效率分位数函数,利用谨慎心驱动更新所述函数与环境信息互动后的奖励。本发明基于分布式强化学习与谨慎心驱动方法相融合,有效提升了车辆的通行安全和效率以及算法的泛化能力。
公开/授权文献
- CN117208019B 基于值分布强化学习的感知遮挡下纵向决策方法及系统 公开/授权日:2024-04-05