- 专利标题: 一种基于PPO和图卷积神经网络区域交叉口信号控制方法
-
申请号: CN202110331958.9申请日: 2021-03-29
-
公开(公告)号: CN113299079B公开(公告)日: 2022-06-10
- 发明人: 王昊 , 刘晓瀚 , 董长印 , 杨朝友
- 申请人: 东南大学 , 扬州市法马智能设备有限公司
- 申请人地址: 江苏省南京市玄武区四牌楼2号;
- 专利权人: 东南大学,扬州市法马智能设备有限公司
- 当前专利权人: 东南大学,扬州市法马智能设备有限公司
- 当前专利权人地址: 江苏省南京市玄武区四牌楼2号;
- 代理机构: 南京经纬专利商标代理有限公司
- 代理商 罗运红
- 主分类号: G08G1/07
- IPC分类号: G08G1/07 ; G08G1/01 ; G06N3/04 ; G06N3/08
摘要:
本发明公开了一种基于PPO和图卷积神经网络区域交叉口信号控制方法,包括以下步骤:构建交叉口协调控制区域并确立强化学习的状态、动作、奖励信息和图卷积神经网络的特征矩阵;构建区域交叉口分层信号控制模型;构建回放经验池,处理和提取训练数据和测试数据;训练区域交叉口分层信号控制模型;对区域交叉口进行统筹联合控制。本发明对控制区域建立多层信号控制模型,下层模型基于PPO算法构建多智能体控制模型;上层模型基于图卷积神经网络对各个交叉口进行统筹协调控制。本发明通过构建两层控制结构,既减少了单点控制模型的运算负担,又实现了对控制区域的总体最优控制,提高了控制区域内的车辆运行效率。
公开/授权文献
- CN113299079A 一种基于PPO和图卷积神经网络区域交叉口信号控制方法 公开/授权日:2021-08-24