基于值分布强化学习的自动驾驶汽车决策规划方法

    公开(公告)号:CN114707359A

    公开(公告)日:2022-07-05

    申请号:CN202210487160.8

    申请日:2022-05-06

    申请人: 重庆大学

    IPC分类号: G06F30/20 G06N3/08 G06F111/08

    摘要: 本发明涉及一种基于值分布强化学习的自动驾驶汽车决策规划方法,属于自动驾驶汽车领域。该方法包括:S1:构建考虑不确定性的无信号灯十字路口场景;S2:构建全参数化分位数函数模型,作为自动驾驶汽车控制模型;S3:基于全参数化分位数函数模型中学习的状态‑动作回报分布信息,引入条件风险价值,生成具有风险意识的驾驶行为。本发明利用值分布强化学习提高了自动驾驶汽车在具有不确定性的环境下决策规划策略的安全性与稳定性。

    一种实现自动驾驶车辆安全决策控制的方法

    公开(公告)号:CN114644017B

    公开(公告)日:2024-08-23

    申请号:CN202210486621.X

    申请日:2022-05-06

    申请人: 重庆大学

    IPC分类号: B60W60/00 B60W40/00

    摘要: 本发明涉及一种实现自动驾驶车辆安全决策控制的方法,属于自动驾驶汽车领域。该方法包括:S1:构建基于深度强化学习的决策模型及其不确定性评估方法,包括构建汽车运动学模型、状态空间、动作空间、构建奖励函数;构建并训练基于深度强化学习的决策模型;S2:构建危险场景下的混合安全决策模型。本发明可以输出决策模型的不确定性,帮助自动驾驶车辆识别出决策危险场景,并可以在车辆面临决策危险场景时采取备选安全策略,提升自动驾驶车辆安全性。

    一种基于博弈论的自动驾驶车辆人车交互决策规划方法

    公开(公告)号:CN114644018B

    公开(公告)日:2024-07-30

    申请号:CN202210486625.8

    申请日:2022-05-06

    申请人: 重庆大学

    IPC分类号: B60W60/00 B60W40/00

    摘要: 本发明涉及一种基于博弈论的自动驾驶车辆人车交互决策规划方法,属于自动驾驶汽车技术领域。该方法包括:S1:构建基于博弈论的人车交互模型,具体包括:构建车辆和行人的行为概率预测模型、车辆和行人成本矩阵;基于累积前景理论,根据车辆和行人的行为概率以及成本矩阵,计算车辆和行人行为的收益;引入协作系数,改进人车交互模型;基于改进的人车交互模型进行行人协作值推理;对人车交互模型进行验证;S2:结合实时交通信息的自动驾驶汽车协作控制。本发明能实现自动驾驶汽车针对不同合作程度行人的协作性控制,提高自动驾驶汽车的在无信号灯人行横道的通行效率与安全性。

    一种基于博弈论的自动驾驶车辆人车交互决策规划方法

    公开(公告)号:CN114644018A

    公开(公告)日:2022-06-21

    申请号:CN202210486625.8

    申请日:2022-05-06

    申请人: 重庆大学

    IPC分类号: B60W60/00 B60W40/00

    摘要: 本发明涉及一种基于博弈论的自动驾驶车辆人车交互决策规划方法,属于自动驾驶汽车技术领域。该方法包括:S1:构建基于博弈论的人车交互模型,具体包括:构建车辆和行人的行为概率预测模型、车辆和行人成本矩阵;基于累积前景理论,根据车辆和行人的行为概率以及成本矩阵,计算车辆和行人行为的收益;引入协作系数,改进人车交互模型;基于改进的人车交互模型进行行人协作值推理;对人车交互模型进行验证;S2:结合实时交通信息的自动驾驶汽车协作控制。本发明能实现自动驾驶汽车针对不同合作程度行人的协作性控制,提高自动驾驶汽车的在无信号灯人行横道的通行效率与安全性。

    一种实现自动驾驶车辆安全决策控制的方法

    公开(公告)号:CN114644017A

    公开(公告)日:2022-06-21

    申请号:CN202210486621.X

    申请日:2022-05-06

    申请人: 重庆大学

    IPC分类号: B60W60/00 B60W40/00

    摘要: 本发明涉及一种实现自动驾驶车辆安全决策控制的方法,属于自动驾驶汽车领域。该方法包括:S1:构建基于深度强化学习的决策模型及其不确定性评估方法,包括构建汽车运动学模型、状态空间、动作空间、构建奖励函数;构建并训练基于深度强化学习的决策模型;S2:构建危险场景下的混合安全决策模型。本发明可以输出决策模型的不确定性,帮助自动驾驶车辆识别出决策危险场景,并可以在车辆面临决策危险场景时采取备选安全策略,提升自动驾驶车辆安全性。