基于安全强化学习的列车节能运行控制方法及相关装置

    公开(公告)号:CN118254846A

    公开(公告)日:2024-06-28

    申请号:CN202410151452.3

    申请日:2024-02-02

    Applicant: 五邑大学

    Abstract: 本发明实施例提供了一种基于安全强化学习的列车节能运行控制方法及相关装置。其中,方法包括:建立距离离散化的列车节能运行仿真环境,为满足列车运行过程中速度限制的约束,在网络训练中,通过一种安全动作重置机制来对不安全动作进行重置,考虑计划运行时间的约束下,以能耗最小为目标,设计了一种松弛的动态奖励函数,引导网络的持续进化至收敛。在真实的列车数据和线路信息上,验证了方法输出的运行控制策略符合预期,能够满足列车计划运行时间的要求,同时达到能耗最优的目标。基于此,本发明实施例能够加快最优策略的训练速度,保证了控制策略对列车运行的控制精度。

Patent Agency Ranking