基于策略梯度的多模式交通自适应信号控制方法及装置
摘要:
本发明公开了一种基于策略梯度的多模式交通自适应信号控制方法及装置,方法包括:获取目标交叉口和多模式交通流信息;根据交叉口信息进行仿真建模还原;构建多模式交通仿真流量生成函数;依据公交、社会车辆、行人及非机动车的不同特性提取多模式交通状态;构建优化人均延误变化量的奖励值;设计基于流量的经验回放池并进行采样;以改进的策略梯度框架训练神经网络;输出多模式交通自适应信号控制智能体。本发明提供的方法综合考虑了公交、社会车辆、行人及非机动车等多模式交通的权益,为道路交通管理者提供决策依据。
0/0