-
公开(公告)号:CN118247977B
公开(公告)日:2025-02-14
申请号:CN202410237022.3
申请日:2024-03-01
Applicant: 南京理工大学
Abstract: 本发明提供了一种基于图注意力和值分解强化学习的区域交通信号控制方法,通过收集道路车流量信息建立路网仿真模型和图模型,充分利用路网车流量信息的空间特征和时序特征,采用了多头图注意力网络和门控循环单元进行特征提取,融合得到的时空特征作为输入传递给D3QN网络计算当前最优相位,训练过程中使用多智能体共享参数条件下的值分解网络来混合路网所有智能体的状态动作价值,实现全局角度的训练。本发明够增强智能体对路网特征的感知能力,有效利用路网的时间空间信息,从整体上提高对区域交通的控制效果,提高路网交通运行效率。
-
公开(公告)号:CN118247977A
公开(公告)日:2024-06-25
申请号:CN202410237022.3
申请日:2024-03-01
Applicant: 南京理工大学
Abstract: 本发明提供了一种基于图注意力和值分解强化学习的区域交通信号控制方法,通过收集道路车流量信息建立路网仿真模型和图模型,充分利用路网车流量信息的空间特征和时序特征,采用了多头图注意力网络和门控循环单元进行特征提取,融合得到的时空特征作为输入传递给D3QN网络计算当前最优相位,训练过程中使用多智能体共享参数条件下的值分解网络来混合路网所有智能体的状态动作价值,实现全局角度的训练。本发明够增强智能体对路网特征的感知能力,有效利用路网的时间空间信息,从整体上提高对区域交通的控制效果,提高路网交通运行效率。
-