一种基于PPO和图卷积神经网络区域交叉口信号控制方法

发明授权

CN113299079B 一种基于PPO和图卷积神经网络区域交叉口信号控制方法有权

请登陆查看更多内容

专利标题： 一种基于PPO和图卷积神经网络区域交叉口信号控制方法
申请号： CN202110331958.9

申请日： 2021-03-29
公开(公告)号： CN113299079B

公开(公告)日： 2022-06-10
发明人: 王昊 , 刘晓瀚 , 董长印 , 杨朝友
申请人： 东南大学 , 扬州市法马智能设备有限公司
申请人地址： 江苏省南京市玄武区四牌楼2号;
专利权人： 东南大学,扬州市法马智能设备有限公司
当前专利权人： 东南大学,扬州市法马智能设备有限公司
当前专利权人地址： 江苏省南京市玄武区四牌楼2号;
代理机构： 南京经纬专利商标代理有限公司
代理商 罗运红
主分类号： G08G1/07
IPC分类号： G08G1/07 ; G08G1/01 ; G06N3/04 ; G06N3/08

摘要：

本发明公开了一种基于PPO和图卷积神经网络区域交叉口信号控制方法，包括以下步骤：构建交叉口协调控制区域并确立强化学习的状态、动作、奖励信息和图卷积神经网络的特征矩阵；构建区域交叉口分层信号控制模型；构建回放经验池，处理和提取训练数据和测试数据；训练区域交叉口分层信号控制模型；对区域交叉口进行统筹联合控制。本发明对控制区域建立多层信号控制模型，下层模型基于PPO算法构建多智能体控制模型；上层模型基于图卷积神经网络对各个交叉口进行统筹协调控制。本发明通过构建两层控制结构，既减少了单点控制模型的运算负担，又实现了对控制区域的总体最优控制，提高了控制区域内的车辆运行效率。

公开/授权文献

CN113299079A 一种基于PPO和图卷积神经网络区域交叉口信号控制方法公开/授权日：2021-08-24

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G08	信号装置
G08G	交通控制系统（指导铁路交通，保证铁路交通安全的入B61L；专用于交通控制的雷达或类似系统、声纳系统或激光雷达系统入G01S13/91、G01S15/88、G01S17/88；专用于防碰撞目的的雷达或类似系统、声纳系统或激光雷达系统入G01S13/93、G01S15/93、G01S17/93；陆地、水上、空中或太空中的运载工具的位置、航道、高度或姿态的控制，不限于交通环境入G05D1/00）
G08G1/00	道路车辆的交通控制系统（道路标志或交通信号装置入E01F9/00）
G08G1/07	.交通信号控制