基于预测轨迹的安全强化学习智能车汇入决策方法及系统

    公开(公告)号:CN118928463A

    公开(公告)日:2024-11-12

    申请号:CN202410990980.8

    申请日:2024-07-23

    Applicant: 燕山大学

    Abstract: 本申请涉及自动驾驶行为决策技术领域,公开了一种基于预测轨迹的安全强化学习智能车汇入决策方法及系统。构建强化学习汇入决策模型,利用预测模型获取每个动作对应的预测轨迹,基于代价函数计算预测轨迹中每一步状态的代价,利用折现总代价计算方法计算预测轨迹的折现总代价。然后根据每个动作的折现总代价确定安全动作集。若智能体的原始决策动作在安全动作集中,或者安全动作集为空,则输出原始决策动作;若不在安全动作集中,则输出安全动作集中价值最大的动作。本申请中,将预测轨迹融入安全强化学习,通过将不安全动作替换为安全动作,有效地减少了训练过程中的碰撞次数,从而缩短了训练周期,降低了训练成本,提高了汇入决策的安全性。

    基于安全强化学习的环形交叉口多车协同决策方法

    公开(公告)号:CN118722718A

    公开(公告)日:2024-10-01

    申请号:CN202410801392.5

    申请日:2024-06-20

    Applicant: 燕山大学

    Abstract: 本发明提供一种基于安全强化学习的环形交叉口多车协同决策方法,包括:搭建构成多智能体强化学习模型;每个智能体通过环形交叉口自动驾驶仿真环境获取自身车辆状态信息以及感知范围内其他周围车辆的状态信息;构建自注意力网络,将每个智能体的状态空间作为输入,输出经过注意力加权后的状态空间;将经过注意力加权后的状态空间输入action网络和critic网络,输出所有智能体的执行动作;基于优先级列表对所有智能体的执行动作进行行车风险评估,得到修正后的安全动作,继续优化多智能体强化学习模型至完全收敛;应用完全收敛的多智能体强化学习模型进行环形交叉口多车协同决策。本发明的方法提高了环形交叉口的整体交通效率和安全性。

Patent Agency Ranking