基于强化学习的城轨交通储能系统能量管理方法

    公开(公告)号:CN107895960B

    公开(公告)日:2020-03-17

    申请号:CN201711053352.3

    申请日:2017-11-01

    IPC分类号: H02J3/32 H02J7/34

    摘要: 本发明涉及一种基于强化学习的城轨交通储能系统能量管理方法。该方法包括策略网络初始化和在线学习两部分;其中策略网络初始化部分利用城轨交通中已知的线路、车辆信息、事先编制的列车运行图,以及实际采集的历史车辆数据,建立多车运行场景模型;将多车运行场景模型、空载电压预测模型、直流供电潮流计算算法和近似动态规划算法结合,得到策略网络,作为在线学习模块的初值;在线学习模块采用无模型强化学习算法,通过超级电容智能代理试错的方法进行充放电阈值在线调整。本发明能够在城轨牵引供电网对超级电容储能系统控制策略进行在线学习,实现节能效果和稳压效果的优化。

    基于强化学习的城轨交通地面式超级电容储能系统能量管理方法

    公开(公告)号:CN107895960A

    公开(公告)日:2018-04-10

    申请号:CN201711053352.3

    申请日:2017-11-01

    IPC分类号: H02J3/32 H02J7/34

    摘要: 本发明涉及一种基于强化学习的城轨交通地面式超级电容储能系统能量管理方法。该方法包括策略网络初始化和在线学习两部分;其中策略网络初始化部分利用城轨交通中已知的线路、车辆信息、事先编制的列车运行图,以及实际采集的历史车辆数据,建立多车运行场景模型;将多车运行场景模型、空载电压预测模型、直流供电潮流计算算法和近似动态规划算法结合,得到策略网络,作为在线学习模块的初值;在线学习模块采用无模型强化学习算法,通过超级电容智能代理试错的方法进行充放电阈值在线调整。本发明能够在城轨牵引供电网对超级电容储能系统控制策略进行在线学习,实现节能效果和稳压效果的优化。