基于深度强化学习和态势预测的交通信号协同方法和系统

    公开(公告)号:CN118230568A

    公开(公告)日:2024-06-21

    申请号:CN202410357941.4

    申请日:2024-03-27

    IPC分类号: G08G1/07 G08G1/081 G08G1/01

    摘要: 本发明提供了一种基于深度强化学习和态势预测的交通信号协同方法和系统,属于智慧交通领域。所述系统包括:仿真交互环境模块、融合态势预测的多路口信号协同优化模型和基于不确定性加权的多任务训练模块;其中,所述仿真交互环境模块,用于根据路网的实际拓扑结构和相应的车辆路由数据,配置交通系统仿真软件SUMO,搭建出与实际交通场景相似的仿真交互环境;所述融合态势预测的多路口信号协同优化模型,用于基于当前和未来的交通状况,实现融合态势预测的有效决策;所述基于不确定性加权的多任务训练模块,用于通过引入不确定性来衡量融合不确定性的预测任务和多路口信号灯控制任务的重要度,从而动态地调整各任务在整体损失函数中的权重。