一种基于深度强化学习的高速公路合流区协同控制方法

    公开(公告)号:CN120088976A

    公开(公告)日:2025-06-03

    申请号:CN202510005116.2

    申请日:2025-01-02

    Abstract: 本发明公开了一种基于深度强化学习的高速公路合流区的协同控制方法,建立LiikeSim‑Python联合仿真环境,在仿真环境中设置线圈检测器获取高速公路合流区上下游的交通流数据;采用基于高斯混合分布的EM算法作为交通状态分类器,以高速公路合流区的交通流数据为输入,对高速公路合流区的交通状态进行划分;设计状态空间、动作空间和奖励函数;以高速公路合流区的状态空间作为输入,以可变限速智能体和匝道计量智能体的动作作为输出,构建时序特征下的多智能体共享经验的网络模型;为可变限速和匝道计量智能体分别设置一个独立的经验池,以控制周期为频率收集智能体与交通仿真环境的交互经验;使用抽样样本训练智能体模型;利用训练得到的智能体模型实现高速公路合流区的协同控制。本发明能够降低高速公路合流区交通的行程延误。

Patent Agency Ranking