基于强化学习的城市轨道交通列车运行图实时调整方法
摘要:
本发明公开了一种基于强化学习的城市轨道交通列车运行图实时调整方法,包括,在以调整后的实际列车运营时刻表与计划列车运营时刻表的偏差值与乘客总等待时间之和最小为目标函数的数学模型基础上,提出了一种竞争双重深度Q网络的调度策略。将训练完成的模型集成到列车运行图编制系统中,实时捕捉系统状态,并根据模型策略输出相应的调整动作,实现运行图的动态调整与优化。本发明方案提高了调度的编制效率,满足了城市轨道交通运营管理人员对调度质量和效率的高标准要求,具备广泛的应用前景,能够极大地提高城市轨道交通系统的运行效率和稳定性。
0/0