一种基于PPO和图卷积神经网络区域交叉口信号控制方法
摘要:
本发明公开了一种基于PPO和图卷积神经网络区域交叉口信号控制方法,包括以下步骤:构建交叉口协调控制区域并确立强化学习的状态、动作、奖励信息和图卷积神经网络的特征矩阵;构建区域交叉口分层信号控制模型;构建回放经验池,处理和提取训练数据和测试数据;训练区域交叉口分层信号控制模型;对区域交叉口进行统筹联合控制。本发明对控制区域建立多层信号控制模型,下层模型基于PPO算法构建多智能体控制模型;上层模型基于图卷积神经网络对各个交叉口进行统筹协调控制。本发明通过构建两层控制结构,既减少了单点控制模型的运算负担,又实现了对控制区域的总体最优控制,提高了控制区域内的车辆运行效率。
0/0